亚蓝智能体中心

Qwen3 系列 — 混合思维开源旗舰

厂商：Alibaba

⬇ 10K+ 调用 ★ 4.5 评分 📄 128K 上下文

模型介绍

Qwen3 是阿里巴巴通义千问团队发布的第三代开源大模型系列，首次在开源模型中实现了与闭源旗舰相当的混合思维能力。该系列覆盖从 0.6B 到 235B 的完整参数谱系，是目前最全面的开源大模型系列之一。

模型系列总览

小杯旗舰：Qwen3-0.6B / 1.8B / 4.7B

极致轻量级模型，适合移动端和边缘设备部署、嵌入式系统和快速原型验证。

中杯实力：Qwen3-8B / 32B

性价比最佳区间，消费级 RTX 4090 即可部署：

8B 模型：单卡 4090 流畅运行，适合个人开发者和小型团队
32B 模型：性能接近 72B，推理成本降低 50% 以上

大杯旗舰：Qwen3-235B-A22B（MoE架构）

稀疏激活专家混合模型，激活参数仅 22B：

尽管总参数量达 235B，每次推理只激活 22B 参数
推理成本接近 22B 模型，效果接近 235B 密集模型
支持 128K 上下文，多语言和代码能力业界领先

与 Qwen2.5 对比

特性	Qwen2.5	Qwen3
思考模式	不支持	混合思维（快/慢思考）
MCP 支持	插件形式	原生支持
最大上下文	128K	128K
语言覆盖	29+ 种	119 种
最高参数	72B 密集	235B MoE（激活22B）

Qwen3 的发布标志着开源大模型正式进入"混合思维"时代，让开发者可以在本地部署具有深度推理能力的 AI 系统。

模型文件

📄 config.json 1.2 KB

📄 tokenizer.json 2.4 MB

📦 model.safetensors 需下载

📄 README.md 8.5 KB

API 调用示例

# Python OpenAI SDK 调用示例
import openai

client = openai.OpenAI(
    api_key="your-api-key",
    base_url="https://api.eake.cn/v1"
)

response = client.chat.completions.create(
    model="qwen3-hybrid-reasoning-open-source-flagship",
    messages=[
        {"role": "user", "content": "你好！"}
    ],
    temperature=0.7,
    max_tokens=2048
)

print(response.choices[0].message.content)

📡 API 端点

https://api.eake.cn/v1

完全兼容 OpenAI API 格式，可直接使用官方 SDK 调用

💬 讨论区

登录后参与讨论，分享使用心得

模型信息

厂商 Alibaba

上下文长度 128K

最大输出 16K

API定价 Free

能力标签

通用

快捷操作

← 浏览更多模型

欢迎回来

创建账号