精读 Qwen3 技术报告：混合思维与原生MCP支持

2026-05-22 · AI 论文

Qwen3 是阿里巴巴通义千问团队开源的第三代大语言模型系列，首次在开源模型中引入了"混合思维"（Hybrid Thinking）机制，结合快思考与慢思考能力，覆盖 0.6B 到 235B 全参数谱系。

核心特性

混合思维架构：融合快思考（快速响应）和慢思考（深度推理）两种模式，根据任务复杂度自动切换
原生 MCP 支持：内置 Model Context Protocol 支持，可直接调用外部工具和插件
128K 超长上下文：支持最高 128,000 tokens 的上下文窗口，适合长文档分析
多语言支持：覆盖中文、英文在内 119 种语言和方言
强大代码能力：CodeQwen1.5 作为基座，代码生成、调试和解释能力业界领先

技术规格

模型	参数量	上下文	部署方式
Qwen3-0.6B	0.6B	32K	本地/移动端
Qwen3-8B	8B	128K	消费级 GPU
Qwen3-32B	32B	128K	专业 GPU
Qwen3-235B-A22B	235B（激活22B）	128K	多卡集群

混合思维详解

Qwen3 的混合思维机制是其最大创新。传统大模型在所有任务上都使用相同的方式推理，而 Qwen3 能够：

对简单问答直接给出快速回答（快思考）
对复杂推理任务自动切换到链式思考（慢思考）
通过 /Think 和 /Fast 指令手动控制思考模式

API 调用示例

curl https://api.eake.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{"model":"qwen3-235b-a22b","messages":[{"role":"user","content":"解释一下量子计算中的叠加态原理"}],"thinking":{"type":"enabled","budget_tokens":4000}}'

Qwen3 的开源打破了闭源模型在推理能力上的垄断，混合思维机制使其在复杂任务上的表现大幅提升，同时保持了可控的推理成本。

← One API … 精读 Gemin… →

精读 Qwen3 技术报告：混合思维与原生MCP支持

核心特性

技术规格

混合思维详解

API 调用示例

评论区

发表评论取消回复

欢迎回来

创建账号

精读 Qwen3 技术报告：混合思维与原生MCP支持

核心特性

技术规格

混合思维详解

API 调用示例

评论区

发表评论 取消回复

发表评论取消回复