欢迎回来

登录 EAKE AI,继续您的智能之旅

忘记密码?
还没有账号?立即注册

Qwen 模型本地部署指南

2026-05-01 · 入门教程

一、Qwen 模型本地部署

Qwen(通义千问)系列模型支持本地部署,适用于数据隐私要求高的场景。

1. 可用模型

模型参数量显存需求推荐用途
Qwen3-32B32B24GB+通用推理
Qwen3-8B8B8GB+轻量对话
Qwen3-Coder7B8GB+代码生成

二、Ollama 部署

ollama pull qwen3:32b
ollama run qwen3:32b

三、模型量化

  • GPTQ:4-bit 量化,显存减半
  • AWQ:激活感知量化,推理速度更快
  • GGUF:CPU/GPU 混合推理

评论区

发表评论