一、Ollama - 本地大模型运行引擎
Ollama 一键运行开源 LLM,支持 GPU 加速。
1. 支持的热门模型
| 模型 | 大小 | 显存需求 |
|---|---|---|
| llama3:8b | 4.7GB | 8GB |
| qwen3:32b | 20GB | 24GB |
| deepseek-r1:7b | 4.7GB | 8GB |
二、安装与使用
ollama pull llama3
ollama run llama3三、API 集成
兼容 OpenAI API 格式,端口 11434。
安装指南
复制下方命令,在终端运行即可安装:
# 安装到当前项目
npx skills add ollama
# 全局安装 — 所有项目可用
npx skills add ollama -g
使用指南
安装完成后,在对话框中直接使用此技能。