Qwen3 是阿里巴巴通义千问团队开源的第三代大语言模型系列,首次在开源模型中引入了"混合思维"(Hybrid Thinking)机制,结合快思考与慢思考能力,覆盖 0.6B 到 235B 全参数谱系。
| 模型 | 参数量 | 上下文 | 部署方式 |
|---|---|---|---|
| Qwen3-0.6B | 0.6B | 32K | 本地/移动端 |
| Qwen3-8B | 8B | 128K | 消费级 GPU |
| Qwen3-32B | 32B | 128K | 专业 GPU |
| Qwen3-235B-A22B | 235B(激活22B) | 128K | 多卡集群 |
Qwen3 的混合思维机制是其最大创新。传统大模型在所有任务上都使用相同的方式推理,而 Qwen3 能够:
/Think 和 /Fast 指令手动控制思考模式curl https://api.eake.cn/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{"model":"qwen3-235b-a22b","messages":[{"role":"user","content":"解释一下量子计算中的叠加态原理"}],"thinking":{"type":"enabled","budget_tokens":4000}}'
Qwen3 的开源打破了闭源模型在推理能力上的垄断,混合思维机制使其在复杂任务上的表现大幅提升,同时保持了可控的推理成本。
评论区