欢迎回来

登录 EAKE AI,继续您的智能之旅

忘记密码?
还没有账号?立即注册
使用手册

WordPress网站有什么样的优势,为什么使用wordpress建立品牌官网

WordPress简介和历史以及近年来的发展

WordPress是使用PHP语言开发的博客平台,用户可以在支持PHP和MySQL数据库的服务器上架设属于自己的网站。也可以把 WordPress当作一个内容管理系统(CMS)来使用。

WordPress是一款个人博客系统,并逐步演化成一款内容管理系统软件,WordPress目前在全世界网站的占有率已经超过40%,是目前全球最流行的开源网页项目之一。

丰富的插件和模板是WordPress非常流行的一个特性。WordPress插件数据库中有超过18000个插件,包括SEO、控件等等。个人可以根据它的核心程序提供的规则自己开发模板和插件。这些插件可以快速地把你的博客改变成cms、forums、门户等各种类型的站点。

WordPress Theme 风格模板是世界上的程序里最多的,类型复杂,品质可嘉,样式繁多,只需要把不同的模板文件放到空间的 Theme目录下就可以自由的在后台变幻,方便使用,而且不管你安装的的什么语言包,都可以自由的使用这些风格。只需要把插件文件上传到你 FTP 的 plugin 目录下,就可以直接在后台启用管理,甚至功能强大点的插件会有一个自己的管理目录在后台出现,就像程序自带似的方便,这些插件囊括了几乎所有互联网上可以实现的功能

WordPress是一个免费的开源项目,约占全球网站的40%

WordPress是一个免费的开源项目,在GNU通用公共许可证下授权发布。2014年12月23日发布WordPress 4.1,发行代号“Dinah”。

WordPress被认为是Michel Valdrighi所开发的网志平台b2/cafelog的正式继承者。“WordPress”这个名字出自Christine Selleck的主意,他是主要开发者Matt Mullenweg的朋友。

WordPress 功能强大,插件众多,易于扩充功能。安装使用都非常方便。WordPress 的原版是英文版的,UTF-8编码,2014年12月23日发布4.1版。

2013 年 06月 22日的3.5.2版,其版本的别称是“Elvin”,献给鼓手 Elvin Jones 等。WordPress 3.5要求 PHP 版本至少为 5.2.4(不支持第三方推出的“PHP6.0”),mysql版本至少为5.0。为满足日益庞大的中文用户需求开辟了中文官方站点且提供中文版程序下载。还有爱好者开发了中文语言包,使其可以支持中文。

使用WordPress平台的发行商约占全球网站的40%。

使用WordPress平台的发行商约占全球网站的10%。而WordPress官方网站的每月独立访问用户数则达到3亿。
从3.0开始,WordPress已经内置多用户博客的功能,可以通过简单的设置就开设一个支持多域名的博客平台。WordPress 是世界上使用最广泛的博客系统之一,是一款开源的PHP软件。因为使用者众多,所以WordPress社区非常活跃,有丰富的插件模板资源。使用WordPress可以快速搭建独立的博客网站。
WordPress 不仅仅是一个博客程序,也是一款CMS,很多非博客网站也是用WordPress搭建的。

WordPress是一个免费的开源项目

WordPress是一个免费的开源项目,在GNU通用公共许可证下授权发布。2014年12月23日发布WordPress 4.1,发行代号“Dinah”。

WordPress被认为是Michel Valdrighi所开发的网志平台b2/cafelog的正式继承者。“WordPress”这个名字出自Christine Selleck的主意,他是主要开发者Matt Mullenweg的朋友。

WordPress 功能强大,插件众多,易于扩充功能。安装使用都非常方便。WordPress 的原版是英文版的,UTF-8编码,2014年12月23日发布4.1版。

使用WordPress平台的发行商约占全球网站的10%。而WordPress官方网站的每月独立访问用户数则达到3亿。
从3.0开始,WordPress已经内置多用户博客的功能,可以通过简单的设置就开设一个支持多域名的博客平台。WordPress 是世界上使用最广泛的博客系统之一,是一款开源的PHP软件。因为使用者众多,所以WordPress社区非常活跃,有丰富的插件模板资源。使用WordPress可以快速搭建独立的博客网站。

使用WordPress平台的发行商约占全球网站的10%。而WordPress官方网站的每月独立访问用户数则达到3亿。
从3.0开始,WordPress已经内置多用户博客的功能,可以通过简单的设置就开设一个支持多域名的博客平台。WordPress 是世界上使用最广泛的博客系统之一,是一款开源的PHP软件。因为使用者众多,所以WordPress社区非常活跃,有丰富的插件模板资源。使用WordPress可以快速搭建独立的博客网站。
WordPress 不仅仅是一个博客程序,也是一款CMS,很多非博客网站也是用WordPress搭建的。

使用手册

品牌官网建设案例

超级区块wordpress企业主题-标准版风格:教育培训,职业教育类-红色风格

这是超级区块WordPress主题-教育培训、职业教育类风格区块演示,购买超级区块wordpress企业主题即可使用这个风格,这个风格干净整洁,适合用于教育培训,职业教育,招生宣传的品牌官网和落地页制作,可以直接导入这个数据,在在此基础上进行修改成自己的内容。

我们在这次的设计中采用了红色和深蓝色两种对比度极高的色彩进行搭配,整体色调比较突出,排版上参考了很多教育品牌的招生宣传落地页的内容进行制作,因此十分适合教育行业的朋友直接导入是使用。

项目预览图赏析

大萨达
教育类区块主题首页首屏预览
教育类区块主题首页师资和作品预览

使用手册

安宁尽览信息官网

安宁尽览信息官网

安宁尽览人力资源有限公司,前身是安宁尽览广告服务部(原大巷口广告粘贴发布处),我公司是安宁、昆钢地区首家经劳动局审核、批准、备案的职业介绍服务机构。我公司致力于招聘、求职、房铺租售、学历提升、出国留学、人事外包等业务。二十三年的磨练,公司保持“信息准确、处理及时、服务周到、流程规范”的优势特点下,秉承“诚信第一,用心做事、服务至上”的工作理念,目前拥有安宁最大的信息市场、最大和最集中的发布平台、最多的关注人数,我们努力打造成为安宁信息市场的标杆。

项目预览图赏析

安宁尽览信息首页首屏预览

使用手册

新版移动端稍后开放

新版移动端稍后开放

移动端我们正在全力开发中,稍后可以直接通过手机浏览了解我们。

感谢您对我司的光临。

移动端我们正在全力开发中,稍后可以直接通过手机浏览了解我们。

感谢您对我司的光临。

使用手册

ThinkPHP框架建立企业官网的优势

ThinkPHP简介和历史以及近年来的发展

ThinkPHP 是一个免费开源的,快速、简单的面向对象的 轻量级PHP开发框架 ,创立于2006年初,遵循Apache2开源协议发布,是为了敏捷WEB应用开发和简化企业应用开发而诞生的。

ThinkPHP从诞生以来一直秉承简洁实用的设计原则,在保持出色的性能和至简的代码的同时,也注重易用性。并且拥有众多的原创功能和特性,在社区团队的积极参与下,在易用性、扩展性和性能方面不断优化和改进,已经成长为国内最领先和最具影响力的WEB应用开发框架,众多的典型案例确保可以稳定用于商业以及门户级的开发。

丰富的插件和模板是WordPress非常流行的一个特性。WordPress插件数据库中有超过18000个插件,包括SEO、控件等等。个人可以根据它的核心程序提供的规则自己开发模板和插件。这些插件可以快速地把你的博客改变成cms、forums、门户等各种类型的站点。

WordPress Theme 风格模板是世界上的程序里最多的,类型复杂,品质可嘉,样式繁多,只需要把不同的模板文件放到空间的 Theme目录下就可以自由的在后台变幻,方便使用,而且不管你安装的的什么语言包,都可以自由的使用这些风格。只需要把插件文件上传到你 FTP 的 plugin 目录下,就可以直接在后台启用管理,甚至功能强大点的插件会有一个自己的管理目录在后台出现,就像程序自带似的方便,这些插件囊括了几乎所有互联网上可以实现的功能

ThinkPHP安全守护者计划

ThinkPHP开发者扶持计划是针对ThinkPHP个人开发者以及小微企业的资源扶持,扶持内容包括但不限于官方推广资源及第三方生态合作资源等,希望通过扶持计划孵化和发现更多基于ThinkPHP的优质应用和服务,同时帮助优秀的个人开发者和产品获得更多行业关注和曝光

为了应对今后的安全问题,ThinkPHP联合国内知名安全团队的成员成立了ThinkPHP安全守护者计划,成员共6名,分别来自奇安信安全团队、360安全团队、腾讯安全团队以及ThinkPHP官方成员,共同致力于守护ThinkPHP核心框架的安全。

使用 ThinkPHP平台的发行商约占中国全球网站的39.7%。

2013年获得中国开源促进联盟推荐项目,2013年获得中日韩开源论坛技术优胜奖。开源中国GVP项目,在开源中国连续四年进入TOP20,2017年最受欢迎开源软件第17名,2018年开发框架第一名,2019年框架类第五名,2020年获得最佳人气项目和最积极运营项目,有广泛的用户基础和良好的业内口碑,是国内最有影响力的PHP框架和先驱者!

ThinkPHP框架是一个免费的开源项目

ThinkPHP是一个开源免费的,快速、简单的面向对象的轻量级PHP开发框架,是为了敏捷WEB应用开发和简化企业应用开发而诞生的。同时遵循Apache2开源许可协议发布,意味着你可以免费使用ThinkPHP,甚至允许把你基于ThinkPHP开发的应用开源或商业产品发布/销售。ThinkPHP商标持有人是上海顶想信息科技有限公司。

十四年来,我们一直坚持完善和迭代更新,在国内拥有领先的市场占有率和良好的用户口碑,相信是你值得信赖的PHP框架。

ThinkPHP导航作为官方的统一资源及推广入口,旨在构建ThinkPHP生态及合作共赢,我们会在导航站中展示生态及合作厂商的产品或服务。



使用手册

亚蓝官网全新升级

亚蓝官网全新升级

一直以来我们都在改变,每年都会修改官方网站的前端UI,只为给您带来全新浏览体验。

自2014年起,一转眼我们是一家走过七个年头本土技术性公司。

企业网站代表了公司的互联网形象。企业在中国经济的大潮中飞速发展,互联网技术也日新月异。这使得企业网站在网站建设完成后,经过大约3年的运营后,面临着网站改版的问题。也许有人会问:我的网站的修改会影响公司的在线业务还是百度关键词的排名?但是有一件事非常重要。安宁亚蓝公司(网站设计)认为,网站是企业的精神面貌,是企业互联网对外展示的形象窗口。  如果你的网站仍然停留在过去几年的形象,它能显示你目前的实力和企业文化吗?当然,事实并非如此  因此,根据公司的发展,网站建设应该不断修改,以显示最新的企业形象,企业文化和业绩。

为什么修改公司网站很重要?网站改版不仅展示了最新的企业形象,而且采用了最新的互联网技术,可以向客户展示大气、严谨的企业品牌形象,对企业品牌传播和在线绩效提升有较好的推广效果,从而克服了传统营销的一些不足,使一些潜在客户迅速成为潜在客户。

使用手册

关于近期服务器宕机问题

我司服务器8月份以来一直出现访问不稳定情况

虽然这个时候上网的人不多,但是对于我们公司网站来讲,很重要,是一件很大的事情,不过还好我们能够及时的解决问题,但同时也意识到了,我们服务器架构安全机制还不太健全,我总是觉得小公司的成长是有阶段的,每个阶段都有自己的那么一个规划,大公司的一些服务器安全机制如果照搬到小公司 ,我想也是不合事宜的。
所以我只在服务器端建立了很不错的架构,但是监控体系还不太健全。这个也是我们该改进的时候了,这也是我认为当前迫在眉睫的事情。
一直以为是网站本身问题 .. 但排除了所有网站问题和服务问题 , 更新了必要的程序 , 优化了很多网站设置. 依旧无故宕机 检查了服务器 日志,发现宕机时数据库无法启动,却近期出现内存卡死现象。
对此我们优化了程序本身同时也优化了服务器。我司服务器会在每天24小时内多次自动重启,如您在访问我司网站出现,“建立数据库连接时出错”这个错误,英文为“Error establishing a database connection”时,稍后刷新即可访问。

使用手册

OA办公系统对于企业的作用和意义

OA办公系统对于企业的作用和意义

企业在日常使用过程中,由于不了解OA的功能和使用方法,造成了OA使用上的困难。企业只有深入了解OA的作用和意义,才能准确的把控自身的需求,合理的进行规划和预算,才能合理的选择OA供应商,最终才能实现OA软件良好的应用效果,真正体现企业OA和信息化的核心意义。

只有了解一个事物,才能更好的发挥其作用,在企业OA信息化中更是尤为重要。很多用户单位OA使用效果不好,根本原因不是OA供应商选择的问题,而是自身对OA信息化的不了解,没有结合企业自身的实际需求去实施OA。不深入了解OA与信息化,就无法准确定位和结合自身需求,选择供应商方面也会偏离正确的方面(不同的OA厂商市场定位差异还是比较大的)。只有了解OA与信息化,才能更好的让OA软件服务于企业用户单位。

1、系统的了解OA和信息的作用

受自身信息化经验、水平的限制,企业负责人的信息化意思不强,OA的作用被企业负责人低估,OA在企业没有发挥到应有的作用,这是目前很多中小企业OA实施自身存在的问题。

企业负责从信息化的角度去了解OA,不能仅仅局限于OA产品中提供的功能。企业通过OA信息化提升内部沟通、协同和协作能力,节省相关资源和降低企业的经营成本,对外提升企业的快速反应能力,提升综合竞争力,同过将OA与企业自身特色的管理相结合,将会在本行业中更具优势和竞争力。

OA是企业信息化的基础应用,从整体的角度考虑,企业还需要构建核心业务的信息化,通过信息化手段实现对企业资源、客户、供应商以及其他合作伙伴的有效管理,而OA则可以和这些系统做到很好的集成应用。

因此了解OA与信息化,尤其是企业负责人需要要了解OA信息化的作用和意义,做到在整体上准确把握OA信息化的目标和方向。

2、准确的结合自身需求

只有结合自身需求的OA才能达到预期的效果,“OA实施需求先行”可以看出需求的重要性。也许有些用户会说我没有什么“需求”,只要使用标准产品中的功能就可以了,实际上这类用户只是自身的需求没有被发掘,对OA的使用还局限于厂商提供的标准产品上,这种OA实施的最终结果是“OA的作用不大,可有可无”。

而有些用户在实施OA前,想将所有的需求一次性完整的提出,期望达到“一劳永逸”,但是需求大而全需要厂商做大量的二次开发,增加了项目的开发的时间和成本,最终导致项目久拖不决,而很多不适用的功能增加了OA实施和推广的难度。对于这类用户我们一般给的建议是“整体规划,分步实施”。在前期可以整体规划OA和信息化的目标与方向,逐步的实施和推广,在具体的应用过程不断的调整和优化。

使用手册

Claude Code 完整开发指南

Claude Code — Hermes Orchestration Guide

Delegate coding tasks to Claude Code (Anthropic's autonomous coding agent CLI) via the Hermes terminal. Claude Code v2.x can read files, write code, run shell commands, spawn subagents, and manage git workflows autonomously.

Prerequisites

  • Install: npm install -g @anthropic-ai/claude-code
  • Auth: run claude once to log in (browser OAuth for Pro/Max, or set ANTHROPIC_API_KEY)
  • Console auth: claude auth login --console for API key billing
  • SSO auth: claude auth login --sso for Enterprise
  • Check status: claude auth status (JSON) or claude auth status --text (human-readable)
  • Health check: claude doctor — checks auto-updater and installation health
  • Version check: claude --version (requires v2.x+)
  • Update: claude update or claude upgrade

Two Orchestration Modes

Hermes interacts with Claude Code in two fundamentally different ways. Choose based on the task.

Mode 1: Print Mode (`-p`) — Non-Interactive (PREFERRED for most tasks)

Print mode runs a one-shot task, returns the result, and exits. No PTY needed. No interactive prompts. This is the cleanest integration path.


terminal(command="claude -p 'Add error handling to all API calls in src/' --allowedTools 'Read,Edit' --max-turns 10", workdir="/path/to/project", timeout=120)

When to use print mode:

  • One-shot coding tasks (fix a bug, add a feature, refactor)
  • CI/CD automation and scripting
  • Structured data extraction with --json-schema
  • Piped input processing (cat file | claude -p "analyze this")
  • Any task where you don't need multi-turn conversation

Print mode skips ALL interactive dialogs — no workspace trust prompt, no permission confirmations. This makes it ideal for automation.

Mode 2: Interactive PTY via tmux — Multi-Turn Sessions

Interactive mode gives you a full conversational REPL where you can send follow-up prompts, use slash commands, and watch Claude work in real time. Requires tmux orchestration.


# Start a tmux session
terminal(command="tmux new-session -d -s claude-work -x 140 -y 40")

# Launch Claude Code inside it
terminal(command="tmux send-keys -t claude-work 'cd /path/to/project && claude' Enter")

# Wait for startup, then send your task
# (after ~3-5 seconds for the welcome screen)
terminal(command="sleep 5 && tmux send-keys -t claude-work 'Refactor the auth module to use JWT tokens' Enter")

# Monitor progress by capturing the pane
terminal(command="sleep 15 && tmux capture-pane -t claude-work -p -S -50")

# Send follow-up tasks
terminal(command="tmux send-keys -t claude-work 'Now add unit tests for the new JWT code' Enter")

# Exit when done
terminal(command="tmux send-keys -t claude-work '/exit' Enter")

When to use interactive mode:

  • Multi-turn iterative work (refactor → review → fix → test cycle)
  • Tasks requiring human-in-the-loop decisions
  • Exploratory coding sessions
  • When you need to use Claude's slash commands (/compact, /review, /model)

PTY Dialog Handling (CRITICAL for Interactive Mode)

Claude Code presents up to two confirmation dialogs on first launch. You MUST handle these via tmux send-keys:

Dialog 1: Workspace Trust (first visit to a directory)


❯ 1. Yes, I trust this folder    ← DEFAULT (just press Enter)
  2. No, exit

Handling: tmux send-keys -t Enter — default selection is correct.

Dialog 2: Bypass Permissions Warning (only with --dangerously-skip-permissions)


❯ 1. No, exit                    ← DEFAULT (WRONG choice!)
  2. Yes, I accept

Handling: Must navigate DOWN first, then Enter:


tmux send-keys -t  Down && sleep 0.3 && tmux send-keys -t  Enter

Robust Dialog Handling Pattern


# Launch with permissions bypass
terminal(command="tmux send-keys -t claude-work 'claude --dangerously-skip-permissions "your task"' Enter")

# Handle trust dialog (Enter for default "Yes")
terminal(command="sleep 4 && tmux send-keys -t claude-work Enter")

# Handle permissions dialog (Down then Enter for "Yes, I accept")
terminal(command="sleep 3 && tmux send-keys -t claude-work Down && sleep 0.3 && tmux send-keys -t claude-work Enter")

# Now wait for Claude to work
terminal(command="sleep 15 && tmux capture-pane -t claude-work -p -S -60")

Note: After the first trust acceptance for a directory, the trust dialog won't appear again. Only the permissions dialog recurs each time you use --dangerously-skip-permissions.

CLI Subcommands

| Subcommand | Purpose |

|------------|---------|

| claude | Start interactive REPL |

| claude "query" | Start REPL with initial prompt |

| claude -p "query" | Print mode (non-interactive, exits when done) |

| cat file | claude -p "query" | Pipe content as stdin context |

| claude -c | Continue the most recent conversation in this directory |

| claude -r "id" | Resume a specific session by ID or name |

| claude auth login | Sign in (add --console for API billing, --sso for Enterprise) |

| claude auth status | Check login status (returns JSON; --text for human-readable) |

| claude mcp add -- | Add an MCP server |

| claude mcp list | List configured MCP servers |

| claude mcp remove | Remove an MCP server |

| claude agents | List configured agents |

| claude doctor | Run health checks on installation and auto-updater |

| claude update / claude upgrade | Update Claude Code to latest version |

| claude remote-control | Start server to control Claude from claude.ai or mobile app |

| claude install [target] | Install native build (stable, latest, or specific version) |

| claude setup-token | Set up long-lived auth token (requires subscription) |

| claude plugin / claude plugins | Manage Claude Code plugins |

| claude auto-mode | Inspect auto mode classifier configuration |

Print Mode Deep Dive

Structured JSON Output


terminal(command="claude -p 'Analyze auth.py for security issues' --output-format json --max-turns 5", workdir="/project", timeout=120)

Returns a JSON object with:


{
  "type": "result",
  "subtype": "success",
  "result": "The analysis text...",
  "session_id": "75e2167f-...",
  "num_turns": 3,
  "total_cost_usd": 0.0787,
  "duration_ms": 10276,
  "stop_reason": "end_turn",
  "terminal_reason": "completed",
  "usage": { "input_tokens": 5, "output_tokens": 603, ... },
  "modelUsage": { "claude-sonnet-4-6": { "costUSD": 0.078, "contextWindow": 200000 } }
}

Key fields: session_id for resumption, num_turns for agentic loop count, total_cost_usd for spend tracking, subtype for success/error detection (success, error_max_turns, error_budget).

Streaming JSON Output

For real-time token streaming, use stream-json with --verbose:


terminal(command="claude -p 'Write a summary' --output-format stream-json --verbose --include-partial-messages", timeout=60)

Returns newline-delimited JSON events. Filter with jq for live text:


claude -p "Explain X" --output-format stream-json --verbose --include-partial-messages | 
  jq -rj 'select(.type == "stream_event" and .event.delta.type? == "text_delta") | .event.delta.text'

Stream events include system/api_retry with attempt, max_retries, and error fields (e.g., rate_limit, billing_error).

Bidirectional Streaming

For real-time input AND output streaming:


claude -p "task" --input-format stream-json --output-format stream-json --replay-user-messages

--replay-user-messages re-emits user messages on stdout for acknowledgment.

Piped Input


# Pipe a file for analysis
terminal(command="cat src/auth.py | claude -p 'Review this code for bugs' --max-turns 1", timeout=60)

# Pipe multiple files
terminal(command="cat src/*.py | claude -p 'Find all TODO comments' --max-turns 1", timeout=60)

# Pipe command output
terminal(command="git diff HEAD~3 | claude -p 'Summarize these changes' --max-turns 1", timeout=60)

JSON Schema for Structured Extraction


terminal(command="claude -p 'List all functions in src/' --output-format json --json-schema '{"type":"object","properties":{"functions":{"type":"array","items":{"type":"string"}}},"required":["functions"]}' --max-turns 5", workdir="/project", timeout=90)

Parse structured_output from the JSON result. Claude validates output against the schema before returning.

Session Continuation


# Start a task
terminal(command="claude -p 'Start refactoring the database layer' --output-format json --max-turns 10 > /tmp/session.json", workdir="/project", timeout=180)

# Resume with session ID
terminal(command="claude -p 'Continue and add connection pooling' --resume $(cat /tmp/session.json | python3 -c 'import json,sys; print(json.load(sys.stdin)["session_id"])') --max-turns 5", workdir="/project", timeout=120)

# Or resume the most recent session in the same directory
terminal(command="claude -p 'What did you do last time?' --continue --max-turns 1", workdir="/project", timeout=30)

# Fork a session (new ID, keeps history)
terminal(command="claude -p 'Try a different approach' --resume  --fork-session --max-turns 10", workdir="/project", timeout=120)

Bare Mode for CI/Scripting


terminal(command="claude --bare -p 'Run all tests and report failures' --allowedTools 'Read,Bash' --max-turns 10", workdir="/project", timeout=180)

--bare skips hooks, plugins, MCP discovery, and CLAUDE.md loading. Fastest startup. Requires ANTHROPIC_API_KEY (skips OAuth).

To selectively load context in bare mode:

| To load | Flag |

|---------|------|

| System prompt additions | --append-system-prompt "text" or --append-system-prompt-file path |

| Settings | --settings |

| MCP servers | --mcp-config |

| Custom agents | --agents '' |

Fallback Model for Overload


terminal(command="claude -p 'task' --fallback-model haiku --max-turns 5", timeout=90)

Automatically falls back to the specified model when the default is overloaded (print mode only).

Complete CLI Flags Reference

Session & Environment

| Flag | Effect |

|------|--------|

| -p, --print | Non-interactive one-shot mode (exits when done) |

| -c, --continue | Resume most recent conversation in current directory |

| -r, --resume | Resume specific session by ID or name (interactive picker if no ID) |

| --fork-session | When resuming, create new session ID instead of reusing original |

| --session-id | Use a specific UUID for the conversation |

| --no-session-persistence | Don't save session to disk (print mode only) |

| --add-dir | Grant Claude access to additional working directories |

| -w, --worktree [name] | Run in an isolated git worktree at .claude/worktrees/ |

| --tmux | Create a tmux session for the worktree (requires --worktree) |

| --ide | Auto-connect to a valid IDE on startup |

| --chrome / --no-chrome | Enable/disable Chrome browser integration for web testing |

| --from-pr [number] | Resume session linked to a specific GitHub PR |

| --file | File resources to download at startup (format: file_id:relative_path) |

Model & Performance

| Flag | Effect |

|------|--------|

| --model | Model selection: sonnet, opus, haiku, or full name like claude-sonnet-4-6 |

| --effort | Reasoning depth: low, medium, high, max, auto | Both |

| --max-turns | Limit agentic loops (print mode only; prevents runaway) |

| --max-budget-usd | Cap API spend in dollars (print mode only) |

| --fallback-model | Auto-fallback when default model is overloaded (print mode only) |

| --betas | Beta headers to include in API requests (API key users only) |

Permission & Safety

| Flag | Effect |

|------|--------|

| --dangerously-skip-permissions | Auto-approve ALL tool use (file writes, bash, network, etc.) |

| --allow-dangerously-skip-permissions | Enable bypass as an *option* without enabling it by default |

| --permission-mode | default, acceptEdits, plan, auto, dontAsk, bypassPermissions |

| --allowedTools | Whitelist specific tools (comma or space-separated) |

| --disallowedTools | Blacklist specific tools |

| --tools | Override built-in tool set ("" = none, "default" = all, or tool names) |

Output & Input Format

| Flag | Effect |

|------|--------|

| --output-format | text (default), json (single result object), stream-json (newline-delimited) |

| --input-format | text (default) or stream-json (real-time streaming input) |

| --json-schema | Force structured JSON output matching a schema |

| --verbose | Full turn-by-turn output |

| --include-partial-messages | Include partial message chunks as they arrive (stream-json + print) |

| --replay-user-messages | Re-emit user messages on stdout (stream-json bidirectional) |

System Prompt & Context

| Flag | Effect |

|------|--------|

| --append-system-prompt | Add to the default system prompt (preserves built-in capabilities) |

| --append-system-prompt-file | Add file contents to the default system prompt |

| --system-prompt | Replace the entire system prompt (use --append instead usually) |

| --system-prompt-file | Replace the system prompt with file contents |

| --bare | Skip hooks, plugins, MCP discovery, CLAUDE.md, OAuth (fastest startup) |

| --agents '' | Define custom subagents dynamically as JSON |

| --mcp-config | Load MCP servers from JSON file (repeatable) |

| --strict-mcp-config | Only use MCP servers from --mcp-config, ignoring all other MCP configs |

| --settings | Load additional settings from a JSON file or inline JSON |

| --setting-sources | Comma-separated sources to load: user, project, local |

| --plugin-dir | Load plugins from directories for this session only |

| --disable-slash-commands | Disable all skills/slash commands |

Debugging

| Flag | Effect |

|------|--------|

| -d, --debug [filter] | Enable debug logging with optional category filter (e.g., "api,hooks", "!1p,!file") |

| --debug-file | Write debug logs to file (implicitly enables debug mode) |

Agent Teams

| Flag | Effect |

|------|--------|

| --teammate-mode | How agent teams display: auto, in-process, or tmux |

| --brief | Enable SendUserMessage tool for agent-to-user communication |

Tool Name Syntax for --allowedTools / --disallowedTools


Read                    # All file reading
Edit                    # File editing (existing files)
Write                   # File creation (new files)
Bash                    # All shell commands
Bash(git *)             # Only git commands
Bash(git commit *)      # Only git commit commands
Bash(npm run lint:*)    # Pattern matching with wildcards
WebSearch               # Web search capability
WebFetch                # Web page fetching
mcp____   # Specific MCP tool

Settings & Configuration

Settings Hierarchy (highest to lowest priority)

  1. CLI flags — override everything
  2. Local project: .claude/settings.local.json (personal, gitignored)
  3. Project: .claude/settings.json (shared, git-tracked)
  4. User: ~/.claude/settings.json (global)
  5. Permissions in Settings

    
    {
      "permissions": {
        "allow": ["Bash(npm run lint:*)", "WebSearch", "Read"],
        "ask": ["Write(*.ts)", "Bash(git push*)"],
        "deny": ["Read(.env)", "Bash(rm -rf *)"]
      }
    }
    

    Memory Files (CLAUDE.md) Hierarchy

    1. Global: ~/.claude/CLAUDE.md — applies to all projects
    2. Project: ./CLAUDE.md — project-specific context (git-tracked)
    3. Local: .claude/CLAUDE.local.md — personal project overrides (gitignored)
    4. Use the # prefix in interactive mode to quickly add to memory: # Always use 2-space indentation.

      Interactive Session: Slash Commands

      Session & Context

      | Command | Purpose |

      |---------|---------|

      | /help | Show all commands (including custom and MCP commands) |

      | /compact [focus] | Compress context to save tokens; CLAUDE.md survives compaction. E.g., /compact focus on auth logic |

      | /clear | Wipe conversation history for a fresh start |

      | /context | Visualize context usage as a colored grid with optimization tips |

      | /cost | View token usage with per-model and cache-hit breakdowns |

      | /resume | Switch to or resume a different session |

      | /rewind | Revert to a previous checkpoint in conversation or code |

      | /btw | Ask a side question without adding to context cost |

      | /status | Show version, connectivity, and session info |

      | /todos | List tracked action items from the conversation |

      | /exit or Ctrl+D | End session |

      Development & Review

      | Command | Purpose |

      |---------|---------|

      | /review | Request code review of current changes |

      | /security-review | Perform security analysis of current changes |

      | /plan [description] | Enter Plan mode with auto-start for task planning |

      | /loop [interval] | Schedule recurring tasks within the session |

      | /batch | Auto-create worktrees for large parallel changes (5-30 worktrees) |

      Configuration & Tools

      | Command | Purpose |

      |---------|---------|

      | /model [model] | Switch models mid-session (use arrow keys to adjust effort) |

      | /effort [level] | Set reasoning effort: low, medium, high, max, or auto |

      | /init | Create a CLAUDE.md file for project memory |

      | /memory | Open CLAUDE.md for editing |

      | /config | Open interactive settings configuration |

      | /permissions | View/update tool permissions |

      | /agents | Manage specialized subagents |

      | /mcp | Interactive UI to manage MCP servers |

      | /add-dir | Add additional working directories (useful for monorepos) |

      | /usage | Show plan limits and rate limit status |

      | /voice | Enable push-to-talk voice mode (20 languages; hold Space to record, release to send) |

      | /release-notes | Interactive picker for version release notes |

      Custom Slash Commands

      Create .claude/commands/.md (project-shared) or ~/.claude/commands/.md (personal):

      
      # .claude/commands/deploy.md
      Run the deploy pipeline:
      1. Run all tests
      2. Build the Docker image
      3. Push to registry
      4. Update the $ARGUMENTS environment (default: staging)
      

      Usage: /deploy production$ARGUMENTS is replaced with the user's input.

      Skills (Natural Language Invocation)

      Unlike slash commands (manually invoked), skills in .claude/skills/ are markdown guides that Claude invokes automatically via natural language when the task matches:

      
      # .claude/skills/database-migration.md
      When asked to create or modify database migrations:
      1. Use Alembic for migration generation
      2. Always create a rollback function
      3. Test migrations against a local database copy
      

      Interactive Session: Keyboard Shortcuts

      General Controls

      | Key | Action |

      |-----|--------|

      | Ctrl+C | Cancel current input or generation |

      | Ctrl+D | Exit session |

      | Ctrl+R | Reverse search command history |

      | Ctrl+B | Background a running task |

      | Ctrl+V | Paste image into conversation |

      | Ctrl+O | Transcript mode — see Claude's thinking process |

      | Ctrl+G or Ctrl+X Ctrl+E | Open prompt in external editor |

      | Esc Esc | Rewind conversation or code state / summarize |

      Mode Toggles

      | Key | Action |

      |-----|--------|

      | Shift+Tab | Cycle permission modes (Normal → Auto-Accept → Plan) |

      | Alt+P | Switch model |

      | Alt+T | Toggle thinking mode |

      | Alt+O | Toggle Fast Mode |

      Multiline Input

      | Key | Action |

      |-----|--------|

      | + Enter | Quick newline |

      | Shift+Enter | Newline (alternative) |

      | Ctrl+J | Newline (alternative) |

      Input Prefixes

      | Prefix | Action |

      |--------|--------|

      | ! | Execute bash directly, bypassing AI (e.g., !npm test). Use ! alone to toggle shell mode. |

      | @ | Reference files/directories with autocomplete (e.g., @./src/api/) |

      | # | Quick add to CLAUDE.md memory (e.g., # Use 2-space indentation) |

      | / | Slash commands |

      Pro Tip: "ultrathink"

      Use the keyword "ultrathink" in your prompt for maximum reasoning effort on a specific turn. This triggers the deepest thinking mode regardless of the current /effort setting.

      PR Review Pattern

      Quick Review (Print Mode)

      
      terminal(command="cd /path/to/repo && git diff main...feature-branch | claude -p 'Review this diff for bugs, security issues, and style problems. Be thorough.' --max-turns 1", timeout=60)
      

      Deep Review (Interactive + Worktree)

      
      terminal(command="tmux new-session -d -s review -x 140 -y 40")
      terminal(command="tmux send-keys -t review 'cd /path/to/repo && claude -w pr-review' Enter")
      terminal(command="sleep 5 && tmux send-keys -t review Enter")  # Trust dialog
      terminal(command="sleep 2 && tmux send-keys -t review 'Review all changes vs main. Check for bugs, security issues, race conditions, and missing tests.' Enter")
      terminal(command="sleep 30 && tmux capture-pane -t review -p -S -60")
      

      PR Review from Number

      
      terminal(command="claude -p 'Review this PR thoroughly' --from-pr 42 --max-turns 10", workdir="/path/to/repo", timeout=120)
      

      Claude Worktree with tmux

      
      terminal(command="claude -w feature-x --tmux", workdir="/path/to/repo")
      

      Creates an isolated git worktree at .claude/worktrees/feature-x AND a tmux session for it. Uses iTerm2 native panes when available; add --tmux=classic for traditional tmux.

      Parallel Claude Instances

      Run multiple independent Claude tasks simultaneously:

      
      # Task 1: Fix backend
      terminal(command="tmux new-session -d -s task1 -x 140 -y 40 && tmux send-keys -t task1 'cd ~/project && claude -p "Fix the auth bug in src/auth.py" --allowedTools "Read,Edit" --max-turns 10' Enter")
      
      # Task 2: Write tests
      terminal(command="tmux new-session -d -s task2 -x 140 -y 40 && tmux send-keys -t task2 'cd ~/project && claude -p "Write integration tests for the API endpoints" --allowedTools "Read,Write,Bash" --max-turns 15' Enter")
      
      # Task 3: Update docs
      terminal(command="tmux new-session -d -s task3 -x 140 -y 40 && tmux send-keys -t task3 'cd ~/project && claude -p "Update README.md with the new API endpoints" --allowedTools "Read,Edit" --max-turns 5' Enter")
      
      # Monitor all
      terminal(command="sleep 30 && for s in task1 task2 task3; do echo '=== '$s' ==='; tmux capture-pane -t $s -p -S -5 2>/dev/null; done")
      

      CLAUDE.md — Project Context File

      Claude Code auto-loads CLAUDE.md from the project root. Use it to persist project context:

      
      # Project: My API
      
      ## Architecture
      - FastAPI backend with SQLAlchemy ORM
      - PostgreSQL database, Redis cache
      - pytest for testing with 90% coverage target
      
      ## Key Commands
      - `make test` — run full test suite
      - `make lint` — ruff + mypy
      - `make dev` — start dev server on :8000
      
      ## Code Standards
      - Type hints on all public functions
      - Docstrings in Google style
      - 2-space indentation for YAML, 4-space for Python
      - No wildcard imports
      

      Be specific. Instead of "Write good code", use "Use 2-space indentation for JS" or "Name test files with .test.ts suffix." Specific instructions save correction cycles.

      Rules Directory (Modular CLAUDE.md)

      For projects with many rules, use the rules directory instead of one massive CLAUDE.md:

      • Project rules: .claude/rules/*.md — team-shared, git-tracked
      • User rules: ~/.claude/rules/*.md — personal, global

      Each .md file in the rules directory is loaded as additional context. This is cleaner than cramming everything into a single CLAUDE.md.

      Auto-Memory

      Claude automatically stores learned project context in ~/.claude/projects//memory/.

      • Limit: 25KB or 200 lines per project
      • This is separate from CLAUDE.md — it's Claude's own notes about the project, accumulated across sessions

      Custom Subagents

      Define specialized agents in .claude/agents/ (project), ~/.claude/agents/ (personal), or via --agents CLI flag (session):

      Agent Location Priority

      1. .claude/agents/ — project-level, team-shared
      2. --agents CLI flag — session-specific, dynamic
      3. ~/.claude/agents/ — user-level, personal
      4. Creating an Agent

        
        # .claude/agents/security-reviewer.md
        ---
        name: security-reviewer
        descripti
        

        ... (内容已截断)

使用手册

OpenClaw 智能体开发实战

一、OpenClaw 智能体框架概述

OpenClaw 是国产开源智能体框架,支持快速构建 AI Agent 应用,提供技能开发、工具集成、多智能体协作等核心能力。

1. 核心特性

  • 技能系统:通过 SKILL.md 定义技能,支持自动发现和加载
  • 多通道集成:Telegram、Discord、微信、飞书等 10+ 通道
  • 工具链:exec、web_fetch、cron、memory 等内置工具
  • 多智能体:subagent 协作、session 管理
  • 上下文管理:LCM 无损上下文压缩

二、安装部署

项目要求
Node.jsv22+
操作系统Windows / macOS / Linux
API KeyOpenAI / Claude / 火山引擎等

2. 安装步骤

  1. 安装 OpenClaw CLI
  2. 初始化工作区
  3. 配置 API Key 和模型
  4. 启动 Gateway 服务

三、最佳实践

  • 技能描述要精确,避免歧义触发
  • 利用 memory/ 目录持久化状态
  • 善用 subagent 处理并行任务
使用手册

OpenClaw个人AI智能体部署

一、OpenClaw 个人AI智能体部署

在本地电脑部署 OpenClaw 智能体,打造7x24小时在线的私人AI助手。

1. 部署方案

方案适合场景成本
本地Windows个人开发者免费(API按量)
云服务器团队共享约50元/月
Docker一键部署免费

二、安装步骤

  1. 安装 Node.js v22+
  2. npm install -g openclaw
  3. openclaw init 初始化工作区
  4. 配置 .env 文件
  5. openclaw gateway start

三、通道配置

支持 Telegram / Discord / 微信 / 飞书 / Web UI 等通道。

使用手册

One API 使用手册 - 快速入门指南

One API 是一个开源的 LLM API 管理与代理工具,支持多种大模型和服务商,提供丰富的管理功能。

一、支持多种大模型

  1. OpenAI ChatGPT 系列模型(支持 Azure OpenAI API)
  2. Anthropic Claude 系列模型(支持 AWS Claude)
  3. Google PaLM2 / Gemini 系列模型
  4. Mistral 系列模型
  5. 字节跳动豆包大模型(火山引擎)
  6. 百度文心一言系列模型
  7. 阿里通义千问系列模型
  8. 讯飞星火认知大模型
  9. 智谱 ChatGLM 系列模型
  10. 360 智脑
  11. 腾讯混元大模型
  12. Moonshot AI
  13. 百川大模型
  14. MINIMAX
  15. Groq
  16. Ollama
  17. 零一万物
  18. 阶跃星辰
  19. Coze
  20. Cohere
  21. DeepSeek
  22. Cloudflare Workers AI
  23. DeepL
  24. together.ai
  25. novita.ai
  26. 硅基流动 SiliconCloud
  27. xAI

二、支持配置镜像以及众多第三方代理服务

三、支持通过负载均衡的方式访问多个渠道

四、支持 stream 模式,可以通过流式传输实现打字机效果

五、支持多机部署

六、支持令牌管理

设置令牌的过期时间、额度、允许的 IP 范围以及允许的模型访问。

七、支持兑换码管理

支持批量生成和导出兑换码,可使用兑换码为账户进行充值。

八、支持渠道管理,批量创建渠道

九、支持用户分组以及渠道分组

支持为不同分组设置不同的倍率。

十、支持渠道设置模型列表

十一、支持查看额度明细

十二、支持用户邀请奖励

十三、支持以美元为单位显示额度

十四、支持发布公告

设置充值链接,设置新用户初始额度。

十五、支持模型映射

重定向用户的请求模型,如无必要请不要设置,设置之后会导致请求体被重新构造而非直接透传,会导致部分还未正式支持的字段无法传递成功。

十六、支持失败自动重试

十七、支持绘图接口

十八、支持 Cloudflare AI Gateway

渠道设置的代理部分填写 https://gateway.ai.cloudflare.com/v1/ACCOUNT_TAG/GATEWAY/openai 即可。

十九、支持丰富的自定义设置

  1. 支持自定义系统名称、logo 以及页脚。
  2. 支持自定义首页和关于页面,可以选择使用 HTML & Markdown 代码进行自定义,或者使用一个单独的网页通过 iframe 嵌入。

二十、支持通过系统访问令牌调用管理 API

在无需二开的情况下扩展和自定义 One API 的功能,详情请参考 API 文档。

二十一、支持 Cloudflare Turnstile 用户校验

二十二、支持用户管理

支持多种用户登录注册方式:

  1. 邮箱登录注册(支持注册邮箱白名单)以及通过邮箱进行密码重置
  2. 支持飞书授权登录
  3. 支持 GitHub 授权登录
  4. 微信公众号授权(需要额外部署 WeChat Server)

二十三、支持主题切换

设置环境变量 THEME 即可,默认为 default,欢迎 PR 更多主题。

二十四、配合 Message Pusher 可将报警信息推送到多种 App 上

使用手册

One API 部署与配置指南

中文 | English | 日本語

one-api logo

One API

_✨ 通过标准的 OpenAI API 格式访问所有的大模型,开箱即用 ✨_

license release docker pull release GoReportCard

部署教程 · 使用方法 · 意见反馈 · 截图展示 · 在线演示 · 常见问题 · 相关项目 · 赞赏支持

> [!NOTE] > 本项目为开源项目,使用者必须在遵循 OpenAI 的使用条款以及法律法规的情况下使用,不得用于非法用途。 > > 根据《生成式人工智能服务管理暂行办法》的要求,请勿对中国地区公众提供一切未经备案的生成式人工智能服务。 > [!NOTE] > 稳定版 / 预览版镜像地址:justsong/one-api > 或者 ghcr.io/songquanpeng/one-api > > alpha 版镜像地址:justsong/one-api-alpha > 或者 ghcr.io/songquanpeng/one-api-alpha > [!WARNING] > 使用 root 用户初次登录系统后,务必修改默认密码 123456

功能

1. 支持多种大模型: + [x] OpenAI ChatGPT 系列模型(支持 Azure OpenAI API) + [x] Anthropic Claude 系列模型 (支持 AWS Claude) + [x] Google PaLM2/Gemini 系列模型 + [x] Mistral 系列模型 + [x] 字节跳动豆包大模型(火山引擎) + [x] 百度文心一言系列模型 + [x] 阿里通义千问系列模型 + [x] 讯飞星火认知大模型 + [x] 智谱 ChatGLM 系列模型 + [x] 360 智脑 + [x] 腾讯混元大模型 + [x] Moonshot AI + [x] 百川大模型 + [x] MINIMAX + [x] Groq + [x] Ollama + [x] 零一万物 + [x] 阶跃星辰 + [x] Coze + [x] Cohere + [x] DeepSeek + [x] Cloudflare Workers AI + [x] DeepL + [x] together.ai + [x] novita.ai + [x] 硅基流动 SiliconCloud + [x] xAI 2. 支持配置镜像以及众多第三方代理服务。 3. 支持通过负载均衡的方式访问多个渠道。 4. 支持 stream 模式,可以通过流式传输实现打字机效果。 5. 支持多机部署详见此处。 6. 支持令牌管理,设置令牌的过期时间、额度、允许的 IP 范围以及允许的模型访问。 7. 支持兑换码管理,支持批量生成和导出兑换码,可使用兑换码为账户进行充值。 8. 支持渠道管理,批量创建渠道。 9. 支持用户分组以及渠道分组,支持为不同分组设置不同的倍率。 10. 支持渠道设置模型列表。 11. 支持查看额度明细。 12. 支持用户邀请奖励。 13. 支持以美元为单位显示额度。 14. 支持发布公告,设置充值链接,设置新用户初始额度。 15. 支持模型映射,重定向用户的请求模型,如无必要请不要设置,设置之后会导致请求体被重新构造而非直接透传,会导致部分还未正式支持的字段无法传递成功。 16. 支持失败自动重试。 17. 支持绘图接口。 18. 支持 Cloudflare AI Gateway,渠道设置的代理部分填写 https://gateway.ai.cloudflare.com/v1/ACCOUNT_TAG/GATEWAY/openai 即可。 19. 支持丰富的自定义设置, 1. 支持自定义系统名称,logo 以及页脚。 2. 支持自定义首页和关于页面,可以选择使用 HTML & Markdown 代码进行自定义,或者使用一个单独的网页通过 iframe 嵌入。 20. 支持通过系统访问令牌调用管理 API,进而在无需二开的情况下扩展和自定义 One API 的功能,详情请参考此处 API 文档。 21. 支持 Cloudflare Turnstile 用户校验。 22. 支持用户管理,支持多种用户登录注册方式: + 邮箱登录注册(支持注册邮箱白名单)以及通过邮箱进行密码重置。 + 支持飞书授权登录这里有 One API 的实现细节阐述供参考)。 + 支持 GitHub 授权登录。 + 微信公众号授权(需要额外部署 WeChat Server)。 23. 支持主题切换,设置环境变量 THEME 即可,默认为 default,欢迎 PR 更多主题,具体参考此处。 24. 配合 Message Pusher 可将报警信息推送到多种 App 上。

部署

基于 Docker 进行部署

使用 SQLite 的部署命令:

docker run --name one-api -d --restart always -p 3000:3000 -e TZ=Asia/Shanghai -v /home/ubuntu/data/one-api:/data justsong/one-api

使用 MySQL 的部署命令,在上面的基础上添加 -e SQL_DSN="root:123456@tcp(localhost:3306)/oneapi",请自行修改数据库连接参数,不清楚如何修改请参见下面环境变量一节。

例如:

docker run --name one-api -d --restart always -p 3000:3000 -e SQL_DSN="root:123456@tcp(localhost:3306)/oneapi" -e TZ=Asia/Shanghai -v /home/ubuntu/data/one-api:/data justsong/one-api
其中,-p 3000:3000 中的第一个 3000 是宿主机的端口,可以根据需要进行修改。 数据和日志将会保存在宿主机的 /home/ubuntu/data/one-api 目录,请确保该目录存在且具有写入权限,或者更改为合适的目录。 如果启动失败,请添加 --privileged=true,具体参考 https://github.com/songquanpeng/one-api/issues/482 。 如果上面的镜像无法拉取,可以尝试使用 GitHub 的 Docker 镜像,将上面的 justsong/one-api 替换为 ghcr.io/songquanpeng/one-api 即可。 如果你的并发量较大,务必设置 SQL_DSN,详见下面环境变量一节。 更新命令:docker run --rm -v /var/run/docker.sock:/var/run/docker.sock containrrr/watchtower -cR Nginx 的参考配置:
server{
   server_name openai.justsong.cn;  # 请根据实际情况修改你的域名

   location / {
          client_max_body_size  64m;
          proxy_http_version 1.1;
          proxy_pass http://localhost:3000;  # 请根据实际情况修改你的端口
          proxy_set_header Host $host;
          proxy_set_header X-Forwarded-For $remote_addr;
          proxy_cache_bypass $http_upgrade;
          proxy_set_header Accept-Encoding gzip;
          proxy_read_timeout 300s;  # GPT-4 需要较长的超时时间,请自行调整
   }
}
之后使用 Let's Encrypt 的 certbot 配置 HTTPS:

Ubuntu 安装 certbot:

sudo snap install --classic certbot sudo ln -s /snap/bin/certbot /usr/bin/certbot

生成证书 & 修改 Nginx 配置

sudo certbot --nginx

根据指示进行操作

重启 Nginx

sudo service nginx restart
初始账号用户名为 root,密码为 123456

通过宝塔面板进行一键部署

1. 安装宝塔面板9.2.0及以上版本,前往 宝塔面板 官网,选择正式版的脚本下载安装; 2. 安装后登录宝塔面板,在左侧菜单栏中点击 Docker,首次进入会提示安装 Docker 服务,点击立即安装,按提示完成安装; 3. 安装完成后在应用商店中搜索 One-API,点击安装,配置域名等基本信息即可完成安装;

基于 Docker Compose 进行部署

> 仅启动方式不同,参数设置不变,请参考基于 Docker 部署部分

目前支持 MySQL 启动,数据存储在 ./data/mysql 文件夹内

docker-compose up -d

查看部署状态

docker-compose ps

手动部署

1. 从 GitHub Releases 下载可执行文件或者从源码编译:
   git clone https://github.com/songquanpeng/one-api.git

   # 构建前端
   cd one-api/web/default
   npm install
   npm run build

   # 构建后端
   cd ../..
   go mod download
   go build -ldflags "-s -w" -o one-api
   
2. 运行:
   chmod u+x one-api
   ./one-api --port 3000 --log-dir ./logs
   
3. 访问 http://localhost:3000/ 并登录。初始账号用户名为
root,密码为 123456。 更加详细的部署教程参见此处

多机部署

1. 所有服务器
SESSION_SECRET 设置一样的值。 2. 必须设置 SQL_DSN,使用 MySQL 数据库而非 SQLite,所有服务器连接同一个数据库。 3. 所有从服务器必须设置 NODE_TYPEslave,不设置则默认为主服务器。 4. 设置 SYNC_FREQUENCY 后服务器将定期从数据库同步配置,在使用远程数据库的情况下,推荐设置该项并启用 Redis,无论主从。 5. 从服务器可以选择设置 FRONTEND_BASE_URL,以重定向页面请求到主服务器。 6. 从服务器上分别装好 Redis,设置好 REDIS_CONN_STRING,这样可以做到在缓存未过期的情况下数据库零访问,可以减少延迟(Redis 集群或者哨兵模式的支持请参考环境变量说明)。 7. 如果主服务器访问数据库延迟也比较高,则也需要启用 Redis,并设置 SYNC_FREQUENCY,以定期从数据库同步配置。 环境变量的具体使用方法详见此处

宝塔部署教程

详见 #175。 如果部署后访问出现空白页面,详见 #97

部署第三方服务配合 One API 使用

> 欢迎 PR 添加更多示例。 #### ChatGPT Next Web 项目主页:https://github.com/Yidadaa/ChatGPT-Next-Web
docker run --name chat-next-web -d -p 3001:3000 yidadaa/chatgpt-next-web
注意修改端口号,之后在页面上设置接口地址(例如:https://openai.justsong.cn/ )和 API Key 即可。 #### ChatGPT Web 项目主页:https://github.com/Chanzhaoyu/chatgpt-web
docker run --name chatgpt-web -d -p 3002:3002 -e OPENAI_API_BASE_URL=https://openai.justsong.cn -e OPENAI_API_KEY=sk-xxx chenzhaoyu94/chatgpt-web
注意修改端口号、
OPENAI_API_BASE_URLOPENAI_API_KEY。 #### QChatGPT - QQ机器人 项目主页:https://github.com/RockChinQ/QChatGPT 根据文档完成部署后,在 data/provider.json设置requester.openai-chat-completions.base-url为 One API 实例地址,并填写 API Key 到 keys.openai 组中,设置 model 为要使用的模型名称。 运行期间可以通过!model命令查看、切换可用模型。

部署到第三方平台

部署到 Sealos
> Sealos 的服务器在国外,不需要额外处理网络问题,支持高并发 & 动态伸缩。 点击以下按钮一键部署(部署后访问出现 404 请等待 3~5 分钟): ![Deploy-on-Sealos.svg](https://cloud.sealos.io/?openapp=system-fastdeploy?templateName=one-api)
部署到 Zeabur
> Zeabur 的服务器在国外,自动解决了网络的问题,同时免费的额度也足够个人使用 ![Deploy on Zeabur](https://zeabur.com/templates/7Q0KO3) 1. 首先 fork 一份代码。 2. 进入 Zeabur,登录,进入控制台。 3. 新建一个 Project,在 Service -> Add Service 选择 Marketplace,选择 MySQL,并记下连接参数(用户名、密码、地址、端口)。 4. 复制链接参数,运行 `create database one-api ` 创建数据库。 5. 然后在 Service -> Add Service,选择 Git(第一次使用需要先授权),选择你 fork 的仓库。 6. Deploy 会自动开始,先取消。进入下方 Variable,添加一个 PORT,值为 3000,再添加一个 SQL_DSN,值为 :@tcp(:)/one-api ,然后保存。 注意如果不填写 SQL_DSN,数据将无法持久化,重新部署后数据会丢失。 7. 选择 Redeploy。 8. 进入下方 Domains,选择一个合适的域名前缀,如 "my-one-api",最终域名为 "my-one-api.zeabur.app",也可以 CNAME 自己的域名。 9. 等待部署完成,点击生成的域名进入 One API。
部署到 Render
> Render 提供免费额度,绑卡后可以进一步提升额度 Render 可以直接部署 docker 镜像,不需要 fork 仓库:https://dashboard.render.com

配置

系统本身开箱即用。 你可以通过设置环境变量或者命令行参数进行配置。 等到系统启动后,使用
root 用户登录系统并做进一步的配置。 Note:如果你不知道某个配置项的含义,可以临时删掉值以看到进一步的提示文字。

使用方法

渠道页面中添加你的 API Key,之后在令牌页面中新增访问令牌。 之后就可以使用你的令牌访问 One API 了,使用方式与 OpenAI API 一致。 你需要在各种用到 OpenAI API 的地方设置 API Base 为你的 One API 的部署地址,例如:https://openai.justsong.cn,API Key 则为你在 One API 中生成的令牌。 注意,具体的 API Base 的格式取决于你所使用的客户端。 例如对于 OpenAI 的官方库:
OPENAI_API_KEY="sk-xxxxxx"
OPENAI_API_BASE="https://:/v1"
graph LR
    A(用户)
    A --->|使用 One API 分发的 key 进行请求| B(One API)
    B -->|中继请求| C(OpenAI)
    B -->|中继请求| D(Azure)
    B -->|中继请求| E(其他 OpenAI API 格式下游渠道)
    B -->|中继并修改请求体和返回体| F(非 OpenAI API 格式下游渠道)
可以通过在令牌后面添加渠道 ID 的方式指定使用哪一个渠道处理本次请求,例如:
Authorization: Bearer ONE_API_KEY-CHANNEL_ID。 注意,需要是管理员用户创建的令牌才能指定渠道 ID。 不加的话将会使用负载均衡的方式使用多个渠道。

环境变量

> One API 支持从
.env 文件中读取环境变量,请参照 .env.example 文件,使用时请将其重命名为 .env。 1. REDIS_CONN_STRING:设置之后将使用 Redis 作为缓存使用。 + 例子:REDIS_CONN_STRING=redis://default:redispw@localhost:49153 + 如果数据库访问延迟很低,没有必要启用 Redis,启用后反而会出现数据滞后的问题。 + 如果需要使用哨兵或者集群模式: + 则需要把该环境变量设置为节点列表,例如:localhost:49153,localhost:49154,localhost:49155。 + 除此之外还需要设置以下环境变量: + REDIS_PASSWORD:Redis 集群或者哨兵模式下的密码设置。 + REDIS_MASTER_NAME:Redis 哨兵模式下主节点的名称。 2. SESSION_SECRET:设置之后将使用固定的会话密钥,这样系统重新启动后已登录用户的 cookie 将依旧有效。 + 例子:SESSION_SECRET=random_string 3. SQL_DSN:设置之后将使用指定数据库而非 SQLite,请使用 MySQL 或 PostgreSQL。 + 例子: + MySQL:SQL_DSN=root:123456@tcp(localhost:3306)/oneapi + PostgreSQL:SQL_DSN=postgres://postgres:123456@localhost:5432/oneapi(适配中,欢迎反馈) + 注意需要提前建立数据库 oneapi,无需手动建表,程序将自动建表。 + 如果使用本地数据库:部署命令可添加 --network="host" 以使得容器内的程序可以访问到宿主机上的 MySQL。 + 如果使用云数据库:如果云服务器需要验证身份,需要在连接参数中添加 ?tls=skip-verify。 + 请根据你的数据库配置修改下列参数(或者保持默认值): + SQL_MAX_IDLE_CONNS:最大空闲连接数,默认为 100。 + SQL_MAX_OPEN_CONNS:最大打开连接数,默认为 1000。 + 如果报错 Error 1040: Too many connections,请适当减小该值。 + SQL_CONN_MAX_LIFETIME:连接的最大生命周期,默认为 60,单位分钟。 4. LOG_SQL_DSN:设置之后将为 logs 表使用独立的数据库,请使用 MySQL 或 PostgreSQL。 5. FRONTEND_BASE_URL:设置之后将重定向页面请求到指定的地址,仅限从服务器设置。 + 例子:FRONTEND_BASE_URL=https://openai.justsong.cn 6. MEMORY_CACHE_ENABLED:启用内存缓存,会导致用户额度的更新存在一定的延迟,可选值为 truefalse,未设置则默认为 false。 + 例子:MEMORY_CACHE_ENABLED=true 7. SYNC_FREQUENCY:在启用缓存的情况下与数据库同步配置的频率,单位为秒,默认为 600 秒。 + 例子:SYNC_FREQUENCY=60 8. NODE_TYPE:设置之后将指定节点类型,可选值为 masterslave,未设置则默认为 master。 + 例子:NODE_TYPE=slave 9. CHANNEL_UPDATE_FREQUENCY:设置之后将定期更新渠道余额,单位为分钟,未设置则不进行更新。 + 例子:CHANNEL_UPDATE_FREQUENCY=1440 10. CHANNEL_TEST_FREQUENCY:设置之后将定期检查渠道,单位为分钟,未设置则不进行检查。 +例子:CHANNEL_TEST_FREQUENCY=1440 11. POLLING_INTERVAL:批量更新渠道余额以及测试可用性时的请求间隔,单位为秒,默认无间隔。 + 例子:POLLING_INTERVAL=5 12. BATCH_UPDATE_ENABLED:启用数据库批量更新聚合,会导致用户额度的更新存在一定的延迟可选值为 truefalse,未设置则默认为 false。 + 例子:BATCH_UPDATE_ENABLED=true + 如果你遇到了数据库连接数过多的问题,可以尝试启用该选项。 13. BATCH_UPDATE_INTERVAL=5:批量更新聚合的时间间隔,单位为秒,默认为 5。 + 例子:BATCH_UPDATE_INTERVAL=5 14. 请求频率限制: + GLOBAL_API_RATE_LIMIT:全局 API 速率限制(除中继请求外),单 ip 三分钟内的最大请求数,默认为 180。 + GLOBAL_WEB_RATE_LIMIT:全局 Web 速率限制,单 ip 三分钟内的最大请求数,默认为 60。 15. 编码器缓存设置: + TIKTOKEN_CACHE_DIR:默认程序启动时会联网下载一些通用的词元的编码,如:gpt-3.5-turbo,在一些网络环境不稳定,或者离线情况,可能会导致启动有问题,可以配置此目录缓存数据,可迁移到离线环境。 + DATA_GYM_CACHE_DIR:目前该配置作用与 TIKTOKEN_CACHE_DIR 一致,但是优先级没有它高。 16. RELAY_TIMEOUT:中继超时设置,单位为秒,默认不设置超时时间。 17. RELAY_PROXY:设置后使用该代理来请求 API。 18. USER_CONTENT_REQUEST_TIMEOUT:用户上传内容下载超时时间,单位为秒。 19. USER_CONTENT_REQUEST_PROXY:设置后使用该代理来请求用户上传的内容,例如图片。 20. SQLITE_BUSY_TIMEOUT:SQLite 锁等待超时设置,单位为毫秒,默认 3000。 21. GEMINI_SAFETY_SETTING:Gemini 的安全设置,默认 BLOCK_NONE。 22. GEMINI_VERSION:One API 所使用的 Gemini 版本,默认为 v1。 23. THEME:系统的主题设置,默认为 default,具体可选值参考此处。 24. ENABLE_METRIC:是否根据请求成功率禁用渠道,默认不开启,可选值为 truefalse。 25. METRIC_QUEUE_SIZE:请求成功率统计队列大小,默认为 10。 26. METRIC_SUCCESS_RATE_THRESHOLD:请求成功率阈值,默认为 0.8。 27. INITIAL_ROOT_TOKEN:如果设置了该值,则在系统首次启动时会自动创建一个值为该环境变量值的 root 用户令牌。 28. INITIAL_ROOT_ACCESS_TOKEN:如果设置了该值,则在系统首次启动时会自动创建一个值为该环境变量的 root 用户创建系统管理令牌。 29. ENFORCE_INCLUDE_USAGE:是否强制在 stream 模型下返回 usage,默认不开启,可选值为 truefalse。 30. TEST_PROMPT:测试模型时的用户 prompt,默认为 Print your model name exactly and do not output without any other text.

命令行参数

1.
--port : 指定服务器监听的端口号,默认为 3000。 + 例子:--port 3000 2. --log-dir : 指定日志文件夹,如果没有设置,默认保存至工作目录的 logs 文件夹下。 + 例子:--log-dir ./logs 3. --version: 打印系统版本号并退出。 4. --help: 查看命令的使用帮助和参数说明。

演示

在线演示

注意,该演示站不提供对外服务: https://openai.justsong.cn

截图展示

!channel !token

常见问题

1. 额度是什么?怎么计算的?One API 的额度计算有问题? + 额度 = 分组倍率 * 模型倍率 * (提示 token 数 + 补全 token 数 * 补全倍率) + 其中补全倍率对于 GPT3.5 固定为 1.33,GPT4 为 2,与官方保持一致。 + 如果是非流模式,官方接口会返回消耗的总 token,但是你要注意提示和补全的消耗倍率不一样。 + 注意,One API 的默认倍率就是官方倍率,是已经调整过的。 2. 账户额度足够为什么提示额度不足? + 请检查你的令牌额度是否足够,这个和账户额度是分开的。 + 令牌额度仅供用户设置最大使用量,用户可自由设置。 3. 提示无可用渠道? + 请检查的用户分组和渠道分组设置。 + 以及渠道的模型设置。 4. 渠道测试报错:
invalid character '<' looking for beginning of value + 这是因为返回值不是合法的 JSON,而是一个 HTML 页面。 + 大概率是你的部署站的 IP 或代理的节点被 CloudFlare 封禁了。 5. ChatGPT Next Web 报错:Failed to fetch + 部署的时候不要设置 BASE_URL。 + 检查你的接口地址和 API Key 有没有填对。 + 检查是否启用了 HTTPS,浏览器会拦截 HTTPS 域名下的 HTTP 请求。 6. 报错:当前分组负载已饱和,请稍后再试 + 上游渠道 429 了。 7. 升级之后我的数据会丢失吗? + 如果使用 MySQL,不会。 + 如果使用 SQLite,需要按照我所给的部署命令挂载 volume 持久化 one-api.db 数据库文件,否则容器重启后数据会丢失。 8. 升级之前数据库需要做变更吗? + 一般情况下不需要,系统将在初始化的时候自动调整。 + 如果需要的话,我会在更新日志中说明,并给出脚本。 9. 手动修改数据库后报错:数据库一致性已被破坏,请联系管理员`? + 这是检测到 ability 表里有些记录的渠道 id 是不存在的,这大概率是因为你删了 channel 表里的记录但是没有同步在 ability 表里清理无效的渠道。 + 对于每一个渠道,其所支持的模型都需要有一个专门的 ability 表的记录,表示该渠道支持该模型。

相关项目

* FastGPT: 基于 LLM 大语言模型的知识库问答系统 * ChatGPT Next Web: 一键拥有你自己的跨平台 ChatGPT 应用 * VChart: 不只是开箱即用的多端图表库,更是生动灵活的数据故事讲述者。 * VMind: 不仅自动,还很智能。开源智能可视化解决方案。 * CherryStudio: 全平台支持的AI客户端, 多服务商集成管理、本地知识库支持。

注意

本项目使用 MIT 协议进行开源,在此基础上,必须在页面底部保留署名以及指向本项目的链接。如果不想保留署名,必须首先获得授权。 同样适用于基于本项目的二开项目。 依据 MIT 协议,使用者需自行承担使用本项目的风险与责任,本开源项目开发者与此无关。
使用手册

One API 部署与使用手册

概述

One API 是一个开源的 API 管理和分发平台,支持将多种 AI 模型提供商(OpenAI、Anthropic、Google、DeepSeek 等)统一到一个兼容 OpenAI 格式的 API 接口下,方便管理和调用。

Docker 部署

快速启动

docker run --name one-api -d 
  --restart always 
  -p 3000:3000 
  -e TZ=Asia/Shanghai 
  -v /home/ubuntu/data/one-api:/data 
  justsong/one-api

Docker Compose

version: '3'
services:
  one-api:
    image: justsong/one-api
    container_name: one-api
    restart: always
    ports:
      - "3000:3000"
    environment:
      - TZ=Asia/Shanghai
    volumes:
      - ./data:/data

Nginx 反向代理配置

server {
    listen 443 ssl http2;
    server_name api.eake.cn;

    ssl_certificate /etc/ssl/api.eake.cn.pem;
    ssl_certificate_key /etc/ssl/api.eake.cn.key;

    location / {
        proxy_pass http://127.0.0.1:3000;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;

        # SSE 支持
        proxy_buffering off;
        proxy_cache off;
        chunked_transfer_encoding on;
    }
}

渠道配置

添加 OpenAI 渠道

  1. 进入管理后台 → 渠道管理 → 添加渠道
  2. 类型选择:OpenAI
  3. 填写 Base URL 和 API Key
  4. 选择要支持的模型

添加其他渠道

提供商类型Base URL
AnthropicAnthropichttps://api.anthropic.com
GoogleGoogle Geminihttps://generativelanguage.googleapis.com
DeepSeekDeepSeekhttps://api.deepseek.com

令牌管理

在「令牌」页面创建 API Token,设定额度、过期时间和可用模型。创建后获得的 sk-xxx 即为统一调用密钥。

统一调用示例

from openai import OpenAI

client = OpenAI(
    api_key="sk-your-one-api-token",
    base_url="https://api.eake.cn/v1"
)

# 调用任何已配置的模型
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Hello"}]
)
使用手册

One API 部署与配置完全指南

One API 简介

One API 是一个开源的 AI API 管理和分发平台,支持将多个 AI 供应商的API统一为一个接口格式(兼容OpenAI格式),实现负载均衡、令牌管理、用量计费等功能。非常适合需要管理多个API Key或搭建API中转服务的场景。

Docker 部署(推荐)

创建数据目录

mkdir -p /opt/one-api/data

启动容器

docker run --name one-api -d 
  --restart always 
  -p 3000:3000 
  -e TZ=Asia/Shanghai 
  -v /opt/one-api/data:/data 
  justsong/one-api

Nginx 反向代理配置

server {
    listen 443 ssl http2;
    server_name api.example.com;

    ssl_certificate /etc/ssl/certs/api.example.com.pem;
    ssl_certificate_key /etc/ssl/certs/api.example.com.key;

    location / {
        proxy_pass http://127.0.0.1:3000;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;

        # SSE支持
        proxy_buffering off;
        proxy_cache off;
        chunked_transfer_encoding on;
    }
}

初始化配置

登录管理后台

访问 https://api.example.com,默认管理员账号:

  • 用户名:root
  • 密码:123456

⚠️ 首次登录后立即修改密码!

添加渠道(Channel)

渠道是API供应商的接入配置:

字段说明
类型选择供应商(OpenAI、Anthropic、DeepSeek等)
名称自定义渠道名称
Base URLAPI端点地址
密钥API Key
模型选择该渠道支持的模型

创建令牌(Token)

令牌是分发给用户的访问密钥:

  • 设置额度限制
  • 限制可用模型
  • 设置过期时间
  • 启用/禁用IP白名单

渠道配置示例

OpenAI 渠道

类型OpenAI
Base URLhttps://api.openai.com
密钥sk-xxx
模型gpt-4o, gpt-4o-mini, gpt-5.2

DeepSeek 渠道

类型DeepSeek
Base URLhttps://api.deepseek.com
密钥sk-xxx
模型deepseek-v4-pro, deepseek-v4-flash

Anthropic 渠道

类型Anthropic
Base URLhttps://api.anthropic.com
密钥sk-ant-xxx
模型claude-sonnet-4-20250514, claude-opus-4-20250514

负载均衡策略

同一模型可配置多个渠道,One API自动负载均衡:

  • 优先级:数字越小优先级越高
  • 权重:同优先级按权重分配
  • 自动重试:某渠道失败自动切换

使用方式

部署完成后,将 Base URL 改为 One API 地址,使用 One API 生成的令牌即可:

from openai import OpenAI

client = OpenAI(
    api_key="sk-one-api-token-xxx",  # One API 令牌
    base_url="https://api.example.com/v1"  # One API 地址
)

# 像使用 OpenAI 一样调用
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Hello!"}]
)

数据备份

# 备份SQLite数据库
cp /opt/one-api/data/one-api.db /opt/one-api/data/one-api.db.bak

# 或导出MySQL
mysqldump -u root -p one_api > one_api_backup.sql

常见问题

Q: 渠道报错 401?
A: 检查API Key是否正确,是否已过期。

Q: 流式输出中断?
A: Nginx需关闭 proxy_buffering,确保SSE正常传输。

Q: 如何查看日志?
A: docker logs one-api -f --tail 100

使用手册

OpenAI API 使用手册

一、概述

OpenAI API 提供 GPT 系列模型的程序化访问,支持文本生成、对话、函数调用、图像生成、语音合成与识别、嵌入向量等功能。所有接口兼容 OpenAI 格式,可通过 REST API 或官方 SDK 调用。

二、认证

所有请求需在 HTTP Header 中携带 API Key:

Authorization: Bearer sk-xxxxxxxxxxxxxxxx

API Key 在 platform.openai.com/api-keys 创建,建议通过环境变量管理:

export OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxx

三、Base URL

https://api.openai.com/v1

四、模型列表

模型ID类型上下文窗口训练数据
gpt-5.2旗舰对话256K2026年4月
gpt-4o通用对话128K2025年10月
gpt-4o-mini轻量对话128K2025年10月
o3推理专用200K2026年4月
o4-mini轻量推理128K2026年3月
dall-e-3图像生成--
whisper-1语音识别--
tts-1语音合成--
text-embedding-3-large文本嵌入8191-

五、Chat Completions

请求

POST /v1/chat/completions

{
  "model": "gpt-4o",
  "messages": [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Hello!"}
  ],
  "temperature": 0.7,
  "top_p": 1,
  "max_tokens": 4096,
  "stream": false,
  "stop": null,
  "presence_penalty": 0,
  "frequency_penalty": 0
}

参数说明

参数类型必填说明
modelstring模型ID
messagesarray消息数组,每条含 role + content
temperaturefloat0-2,默认1。越低越确定性
top_pfloat核采样,0-1,默认1
max_tokensint最大生成token数
streambool是否流式输出,默认false
stopstring/array停止序列
presence_penaltyfloat-2到2,正值鼓励新话题
frequency_penaltyfloat-2到2,正值降低重复
toolsarray函数定义列表
tool_choicestring/object"auto"/"none"/"required"/指定函数
response_formatobject{"type":"json_object"} 强制JSON输出
seedint随机种子,可复现结果

响应

{
  "id": "chatcmpl-xxx",
  "object": "chat.completion",
  "created": 1717100000,
  "model": "gpt-4o",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "Hello! How can I help you today?"
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 20,
    "completion_tokens": 8,
    "total_tokens": 28
  }
}

六、Function Calling(函数调用)

定义函数

"tools": [{
  "type": "function",
  "function": {
    "name": "get_weather",
    "description": "获取指定城市的当前天气",
    "parameters": {
      "type": "object",
      "properties": {
        "city": {"type": "string", "description": "城市名称"},
        "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}
      },
      "required": ["city"]
    }
  }
}]

处理函数调用

// 模型返回 tool_calls
if (response.choices[0].finish_reason === "tool_calls") {
  const toolCall = response.choices[0].message.tool_calls[0];
  // 执行实际函数
  const result = await getWeather(toolCall.function.arguments);
  // 将结果返回给模型
  const followUp = await client.chat.completions.create({
    model: "gpt-4o",
    messages: [
      ...previousMessages,
      response.choices[0].message,
      {
        role: "tool",
        tool_call_id: toolCall.id,
        content: JSON.stringify(result)
      }
    ]
  });
}

七、图像生成(DALL·E)

POST /v1/images/generations

{
  "model": "dall-e-3",
  "prompt": "A white siamese cat in a cyberpunk city",
  "n": 1,
  "size": "1024x1024",
  "quality": "hd",
  "style": "vivid"
}

可选尺寸:1024x1024, 1792x1024, 1024x1792

八、语音识别(Whisper)

POST /v1/audio/transcriptions
Content-Type: multipart/form-data

file: audio.mp3
model: whisper-1
language: zh

九、语音合成(TTS)

POST /v1/audio/speech

{
  "model": "tts-1",
  "input": "你好,世界!",
  "voice": "alloy"
}

可用声音:alloy, echo, fable, onyx, nova, shimmer

十、文本嵌入

POST /v1/embeddings

{
  "model": "text-embedding-3-large",
  "input": "The food was delicious"
}

十一、速率限制

层级RPMTPM
Free340,000
Tier 1 ($5+)500200,000
Tier 2 ($50+)5,0002,000,000

遇到 429 错误时使用指数退避重试。

十二、错误码

状态码含义处理建议
400请求格式错误检查参数
401API Key 无效检查密钥
429速率限制退避重试
500服务器错误稍后重试
503服务过载稍后重试
使用手册

Anthropic Claude API 使用手册

一、概述

Anthropic Claude API 提供 Claude 系列模型的访问,以长上下文、高质量输出和安全对齐著称。API 同时支持 OpenAI 兼容格式和原生 Anthropic 格式。

二、认证

x-api-key: sk-ant-xxxxxxxxxxxxxxxx
anthropic-version: 2023-06-01

API Key 在 console.anthropic.com 创建。

三、Base URL

原生格式:https://api.anthropic.com/v1
OpenAI兼容:https://api.anthropic.com/v1/openai

四、模型列表

模型ID上下文最大输出定位
claude-opus-4-20250514200K32K最强推理
claude-sonnet-4-20250514200K64K通用最佳
claude-haiku-3-5-20241022200K8K快速轻量

五、Messages API

请求

POST /v1/messages

{
  "model": "claude-sonnet-4-20250514",
  "max_tokens": 4096,
  "system": "You are a helpful assistant.",
  "messages": [
    {"role": "user", "content": "Hello!"}
  ],
  "temperature": 0.7,
  "top_p": 1,
  "top_k": 0,
  "stream": false
}

参数说明

参数类型必填说明
modelstring模型ID
messagesarray消息数组,交替 user/assistant
max_tokensint最大生成token数
systemstring系统提示词(与messages同级)
temperaturefloat0-1,默认1
top_pfloat核采样,0-1
top_kintTop-K采样
streambool流式输出
stop_sequencesarray停止序列
toolsarray工具定义
tool_choiceobject工具选择策略
thinkingobject扩展思考配置

响应

{
  "id": "msg_xxx",
  "type": "message",
  "role": "assistant",
  "content": [
    {"type": "text", "text": "Hello! How can I help you?"}
  ],
  "model": "claude-sonnet-4-20250514",
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 12,
    "output_tokens": 10,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0
  }
}

六、多模态输入

图像(Base64)

"messages": [{
  "role": "user",
  "content": [
    {
      "type": "image",
      "source": {
        "type": "base64",
        "media_type": "image/png",
        "data": "iVBORw0KGgo..."
      }
    },
    {"type": "text", "text": "描述这张图片"}
  ]
}]

图像(URL)

"content": [
  {
    "type": "image",
    "source": {
      "type": "url",
      "url": "https://example.com/photo.jpg"
    }
  },
  {"type": "text", "text": "分析这张图"}
]

PDF文档

"content": [
  {
    "type": "document",
    "source": {
      "type": "base64",
      "media_type": "application/pdf",
      "data": "JVBERi0xLjQ..."
    }
  },
  {"type": "text", "text": "总结文档要点"}
]

七、Tool Use(工具调用)

定义工具

"tools": [{
  "name": "calculator",
  "description": "执行数学计算",
  "input_schema": {
    "type": "object",
    "properties": {
      "expression": {"type": "string", "description": "数学表达式"}
    },
    "required": ["expression"]
  }
}]

处理工具调用

// 模型返回 tool_use block
if (response.stop_reason === "tool_use") {
  const toolBlock = response.content.find(b => b.type === "tool_use");
  
  // 执行函数并返回结果
  const result = await calculator(toolBlock.input.expression);
  
  const followUp = await client.messages.create({
    model: "claude-sonnet-4-20250514",
    max_tokens: 4096,
    tools: tools,
    messages: [
      {"role": "user", "content": "计算 2+2"},
      {"role": "assistant", "content": response.content},
      {
        "role": "user",
        "content": [{
          "type": "tool_result",
          "tool_use_id": toolBlock.id,
          "content": result.toString()
        }]
      }
    ]
  });
}

八、扩展思考(Extended Thinking)

{
  "model": "claude-sonnet-4-20250514",
  "max_tokens": 16000,
  "thinking": {
    "type": "enabled",
    "budget_tokens": 10000
  },
  "messages": [
    {"role": "user", "content": "证明费马大定理的特殊情况n=4"}
  ]
}

响应中会包含 thinking 类型的 content block,展示推理过程。

九、流式输出

const stream = client.messages.stream({
  model: "claude-sonnet-4-20250514",
  max_tokens: 1024,
  messages: [{"role": "user", "content": "Hello!"}]
});

stream.on("text", (text) => {
  process.stdout.write(text);
});

十、Prompt Caching(提示缓存)

标记可缓存的内容块,减少重复计费:

"system": [{
  "type": "text",
  "text": "很长的系统指令...",
  "cache_control": {"type": "ephemeral"}
}]

缓存命中的 token 价格降低 90%。

十一、速率限制

层级并发请求数TPM
Free5-
Tier 15080,000
Tier 2200400,000
Tier 31,0002,000,000

十二、错误码

状态码类型处理建议
400invalid_request_error检查参数
401authentication_error检查API Key
403permission_error检查访问权限
429rate_limit_error退避重试
500api_error稍后重试
529overloaded_error稍后重试
使用手册

DeepSeek API 使用手册

一、概述

DeepSeek API 完全兼容 OpenAI API 格式,现有 OpenAI SDK 和代码可零成本迁移。同时提供 Anthropic API 兼容格式。DeepSeek 以极低价格提供顶级模型能力,性价比业界领先。

二、认证

Authorization: Bearer your-deepseek-api-key

API Key 在 platform.deepseek.com/api_keys 创建。

三、Base URL

OpenAI兼容格式:https://api.deepseek.com
Anthropic兼容格式:https://api.deepseek.com/anthropic
聊天补全端点:https://api.deepseek.com/chat/completions

四、模型列表

模型ID上下文最大输出说明
deepseek-v4-pro128K16K最新旗舰,支持思考模式
deepseek-v4-flash128K16K快速版,高性价比
deepseek-chat128K8K⚠️将废弃(2026/07/24),等同v4-flash非思考
deepseek-reasoner128K8K⚠️将废弃(2026/07/24),等同v4-flash思考

五、使用 OpenAI SDK 调用

from openai import OpenAI

client = OpenAI(
    api_key="your-deepseek-api-key",
    base_url="https://api.deepseek.com"
)

# 非思考模式
response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"}
    ],
    stream=False
)
print(response.choices[0].message.content)

六、思考模式

DeepSeek 独有的深度推理能力,模型在回答前进行长链推理:

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "user", "content": "求解 x^2 + 5x + 6 = 0"}
    ],
    thinking={"type": "enabled"},
    reasoning_effort="high",  # low / medium / high
    stream=False
)

思考模式响应结构

{
  "choices": [{
    "message": {
      "role": "assistant",
      "content": "方程 x^2 + 5x + 6 = 0 的解为 x = -2 或 x = -3",
      "reasoning_content": "这是一个一元二次方程...n使用因式分解...n(x+2)(x+3)=0..."
    }
  }]
}

reasoning_effort 参数

效果适用场景
low快速推理,思考短简单问题
medium平衡推理一般问题
high深度推理,思考长复杂数学/编程/逻辑

七、流式输出

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "写一首诗"}],
    stream=True
)

for chunk in stream:
    # 普通内容
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")
    # 思考内容(思考模式下)
    if hasattr(chunk.choices[0].delta, 'reasoning_content') and chunk.choices[0].delta.reasoning_content:
        # 可选择不输出思考过程
        pass

八、cURL 调用示例

curl https://api.deepseek.com/chat/completions 
  -H "Content-Type: application/json" 
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" 
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Hello!"}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "high",
    "stream": false
  }'

九、Function Calling

与 OpenAI 格式完全一致:

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "获取天气信息",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string", "description": "城市名"}
            },
            "required": ["city"]
        }
    }
}]

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "北京天气如何?"}],
    tools=tools
)

十、JSON 输出

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "列出中国前5大城市"}],
    response_format={"type": "json_object"}
)

十一、定价

模型输入价格输出(含思考)缓存命中
deepseek-v4-pro¥4/1M tokens¥16/1M tokens¥1/1M tokens
deepseek-v4-flash¥1/1M tokens¥4/1M tokens¥0.1/1M tokens

十二、Agent 工具集成

无需编码,直接在主流AI工具中使用:

工具配置方式
Claude Code自定义API端点 → https://api.deepseek.com
GitHub Copilot选择 DeepSeek 模型
One API添加 DeepSeek 渠道
OpenCode直接支持

十三、速率限制

默认限制(付费用户):

  • RPM: 60(v4-pro)/ 120(v4-flash)
  • TPM: 2,000,000

余额不足时自动降级为免费层级限速。

十四、错误码

状态码含义处理
400请求格式错误检查参数
401API Key 无效检查密钥
402余额不足充值
429速率限制退避重试
500服务器错误稍后重试
503服务过载稍后重试
使用手册

Google Gemini API 使用手册

一、概述

Google Gemini API 提供 Gemini 系列模型的访问,支持文本生成、多模态理解、代码执行、搜索增强、图像/视频/音乐生成等能力。以超长上下文(1M tokens)和丰富的多模态生态著称。

二、认证

API Key 方式(简单)

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

API Key 在 Google AI Studio 创建。

服务账号方式(生产环境)

export GOOGLE_APPLICATION_CREDENTIALS="/path/to/service-account.json"

三、Base URL

REST API: https://generativelanguage.googleapis.com/v1beta
OpenAI兼容: https://generativelanguage.googleapis.com/v1beta/openai

四、模型列表

模型ID上下文最大输出定位
gemini-3-pro1M64K最强推理
gemini-3-flash1M64K快速高效
gemini-2.5-pro1M64K上一代旗舰
gemini-2.5-flash1M64K上一代快速
gemini-3-pro-vision1M64K多模态专用
text-embedding-004--文本嵌入

五、文本生成

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel('gemini-3-pro')

# 单次生成
response = model.generate_content(
    "解释量子计算的原理",
    generation_config=genai.types.GenerationConfig(
        temperature=0.7,
        top_p=0.95,
        top_k=40,
        max_output_tokens=2048,
        candidate_count=1
    )
)
print(response.text)

参数说明

参数类型说明
temperaturefloat0-2,默认1
top_pfloat核采样,0-1,默认0.95
top_kintTop-K采样,默认40
max_output_tokensint最大输出token数
candidate_countint候选回复数,默认1
stop_sequenceslist停止序列
response_mime_typestring"text/plain" 或 "application/json"

六、多轮对话

chat = model.start_chat(history=[])

response1 = chat.send_message("我想学习Python")
response2 = chat.send_message("推荐一些入门项目")

# 查看历史
for msg in chat.history:
    print(f"{msg.role}: {msg.parts[0].text}")

七、系统指令

model = genai.GenerativeModel(
    'gemini-3-pro',
    system_instruction=[
        "你是一位专业的Python讲师。",
        "回答使用Markdown格式,包含代码示例。",
        "语气友好且专业。"
    ]
)

八、多模态输入

图像

import PIL.Image

img = PIL.Image.open('photo.jpg')
response = model.generate_content(["描述这张图片", img])

多图

img1 = PIL.Image.open('img1.jpg')
img2 = PIL.Image.open('img2.jpg')
response = model.generate_content([
    "比较这两张图片的异同",
    img1, img2
])

视频

# 上传视频文件
video = genai.upload_file("video.mp4")

# 等待处理完成
while video.state.name == "PROCESSING":
    time.sleep(5)
    video = genai.get_file(video.name)

response = model.generate_content([
    "总结这个视频的内容",
    video
])

音频

audio = genai.upload_file("speech.mp3")
response = model.generate_content([
    "转录这段音频",
    audio
])

九、搜索增强(Grounding)

response = model.generate_content(
    "2026年最新的AI新闻",
    tools="google_search_retrieval"
)
# 回答中包含搜索来源引用

十、代码执行

response = model.generate_content(
    "计算斐波那契数列前100项的和",
    tools="code_execution"
)
# 模型自动编写并执行Python代码

十一、图像生成(多模态输出)

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-pro",
    contents="生成一张日落风景画",
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"]
    )
)

十二、文件上传与RAG

# 上传文件
file = genai.upload_file("document.pdf",
    mime_type="application/pdf"
)

# 缓存大文件(减少重复上传费用)
cache = genai.caching.CachedContent.create(
    model="gemini-3-pro",
    contents=[file],
    ttl=datetime.timedelta(hours=2)
)

model = genai.GenerativeModel.from_cached_content(cache)
response = model.generate_content("总结文档要点")

十三、流式输出

response = model.generate_content("写一首诗", stream=True)
for chunk in response:
    print(chunk.text, end="")

十四、定价

模型输入(≤128K)输入(>128K)输出
Gemini 3 Pro$1.25/1M$2.50/1M$5.00/1M
Gemini 3 Flash$0.15/1M$0.30/1M$0.60/1M

免费额度:15 RPM, 1M TPM, 1500 RPD(Flash模型)

十五、错误码

状态码含义处理
400请求错误检查参数
403权限不足检查API Key/配额
429速率限制退避重试
500内部错误稍后重试
503服务不可用稍后重试
使用手册

Midjourney 使用手册

一、概述

Midjourney 是基于AI的图像生成平台,通过文本提示词创建高质量艺术作品。当前版本 V6.1,同时提供 Niji 6 动漫专用模型。平台通过 Discord 运行,支持 Web 界面编辑。

二、入门配置

注册与订阅

  1. 访问 midjourney.com 注册
  2. 加入官方 Discord 服务器
  3. 选择订阅方案

订阅方案

方案月费快速时长最大并发隐身模式
Basic$10约200分钟3
Standard$3015小时3
Pro$6030小时12
Mega$12060小时12

三、核心命令

命令语法说明
生成图像/imagine prompt:描述根据提示词生成4张图
混合图片/blend 图片1 图片2混合2-5张图片
描述图片/describe上传图片反推提示词
缩短提示词/shorten prompt:描述精简提示词
查看信息/info查看订阅和用量
设置/settings模型版本等偏好设置
帮助/help帮助信息

四、生成后操作

按钮说明
U1-U4放大对应位置的图片(单独输出)
V1-V4基于对应图片生成变体
Vary (Strong)大幅修改(放大后可用)
Vary (Subtle)微调修改
Vary (Region)局部重绘(选中区域修改)
Zoom Out 2x画面缩小2倍
Zoom Out 1.5x画面缩小1.5倍
Pan ←↑→↓向指定方向扩展画面
⬆️ Web在Web界面中打开编辑

五、参数完整列表

参数语法默认值说明
宽高比--ar W:H1:1图片宽高比
混沌度--c 0-1000结果随机性
风格化--s 0-1000100艺术化程度
风格--style raw-减少默认美化
负面提示--no item1, item2-排除元素
图片权重--iw 0-21图片提示的影响力
种子--seed 0-4294967295随机可复现生成
停止--stop 10-100100提前结束生成
平铺--tile-无缝平铺图案
版本--v 6.16.1模型版本
Niji--niji 6-动漫模型
角色参考--cref URL-角色一致性
角色权重--cw 0-1001000=仅脸, 100=脸+服装
风格参考--sref URL-风格一致性
风格权重--sw 0-1000100风格参考强度
重复--r 1-41一次生成多组

六、版本对比

版本启用方式特点
V6.1--v 6.1当前最新,细节精细,一致性好
V6--v 6文字渲染,提示词理解强
V5.2--v 5.2美学提升
Niji 6--niji 6动漫专用
Niji 6 cute--niji 6 --style cuteQ版可爱
Niji 6 expressive--niji 6 --style expressive表现力强
Niji 6 scenic--niji 6 --style scenic场景优先

七、提示词最佳实践

基本公式

主体 + 场景/环境 + 光照/氛围 + 风格/媒介 + 参数

示例

/imagine prompt: a lone samurai standing on a cliff edge, cherry blossoms in wind, golden hour cinematic lighting, ukiyo-e style with modern colors, highly detailed --ar 16:9 --s 750 --v 6.1

技巧

  • 英文提示词效果优于中文
  • 用逗号分隔关键词,不要写长句
  • 材质词提升质感:crystal, marble, neon, holographic
  • 镜头词控制构图:close-up, wide angle, bird's eye, macro
  • 艺术家参考设定风格:in the style of Greg Rutkowski
  • 用 --no 排除不需要的元素
  • 迭代优化:生成 → 选择最佳 → 变体 → 放大 → 局部修改

八、角色一致性工作流

  1. 生成满意的角色图
  2. 复制该图的URL
  3. 在后续提示词中使用 --cref URL --cw 100
  4. 保持提示词中角色描述一致
  5. 可同时使用 --sref 保持风格一致

九、常见问题

Q: 快速时长用完了怎么办?
A: 切换到 Relax 模式(Standard及以上),生成时间约1-2分钟。

Q: 可以商用吗?
A: Pro及Mega方案生成的图片可商用。General商用条款需遵守。

Q: 如何获取图片URL?
A: 点击生成的图片 → 右键 → 复制图片地址。

Q: 生成的图片有手部问题怎么办?
A: V6.1大幅改善了手部,用 --style raw 减少风格化干扰,或使用 Vary (Region) 局部重绘手部。

使用手册

通义千问 API 使用手册

一、概述

通义千问是阿里云推出的大语言模型服务,提供 Qwen 系列模型的 API 访问。兼容 OpenAI API 格式,支持文本生成、对话、函数调用、长文档理解、图像理解、语音合成等能力。以超高性价比和完善的中文能力著称。

二、认证

通过阿里云 DashScope 平台管理 API Key:

Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxx

API Key 在 DashScope 控制台 创建。

三、Base URL

OpenAI兼容格式:https://dashscope.aliyuncs.com/compatible-mode/v1
原生格式:https://dashscope.aliyuncs.com/api/v1

四、模型列表

模型ID上下文最大输出说明
qwen-max128K8K旗舰模型,最强能力
qwen-plus128K8K能力与性价比均衡
qwen-turbo128K8K快速响应,低成本
qwen-long1M6K超长上下文专用
qwen-vl-max32K8K多模态旗舰
qwen-vl-plus32K8K多模态均衡
qwen2.5-coder-32b128K8K代码专用
qwen-audio-turbo8K2K语音理解
text-embedding-v38K-文本嵌入

五、使用 OpenAI SDK 调用

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxxxxxxx",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

response = client.chat.completions.create(
    model="qwen-max",
    messages=[
        {"role": "system", "content": "你是通义千问助手。"},
        {"role": "user", "content": "你好!"}
    ],
    temperature=0.7,
    top_p=0.8,
    max_tokens=2048,
    stream=False
)
print(response.choices[0].message.content)

六、cURL 调用示例

curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions 
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" 
  -H "Content-Type: application/json" 
  -d '{
    "model": "qwen-max",
    "messages": [
      {"role": "user", "content": "你好"}
    ]
  }'

七、流式输出

stream = client.chat.completions.create(
    model="qwen-max",
    messages=[{"role": "user", "content": "写一首诗"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

八、Function Calling

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "获取天气信息",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string", "description": "城市名"}
            },
            "required": ["city"]
        }
    }
}]

response = client.chat.completions.create(
    model="qwen-max",
    messages=[{"role": "user", "content": "上海今天天气如何?"}],
    tools=tools,
    tool_choice="auto"
)

九、多模态(图像理解)

import base64

with open("image.jpg", "rb") as f:
    img_b64 = base64.b64encode(f.read()).decode()

response = client.chat.completions.create(
    model="qwen-vl-max",
    messages=[{
        "role": "user",
        "content": [
            {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{img_b64}"}},
            {"type": "text", "text": "描述这张图片"}
        ]
    }]
)

十、超长上下文(qwen-long)

response = client.chat.completions.create(
    model="qwen-long",
    messages=[
        {"role": "system", "content": "你是一个文档分析助手。"},
        {"role": "user", "content": very_long_text}  # 支持百万级token
    ],
    max_tokens=4096
)

十一、定价

模型输入价格输出价格
qwen-max¥20/1M tokens¥60/1M tokens
qwen-plus¥4/1M tokens¥12/1M tokens
qwen-turbo¥1/1M tokens¥3/1M tokens
qwen-long¥0.5/1M tokens¥2/1M tokens

新用户赠送 100 万 tokens 免费额度。

十二、速率限制

层级TPMRPM
免费60,00060
付费300,000300

十三、错误码

状态码含义处理
400请求格式错误检查参数
401API Key 无效检查密钥
429速率限制/额度不足退避重试或充值
500服务端错误稍后重试
使用手册

百度文心一言 API 使用手册

一、概述

文心一言(ERNIE Bot)是百度推出的大语言模型服务,提供 ERNIE 系列模型的 API 访问。支持文本生成、对话、函数调用、图像理解、文生图等能力。国内首批通过大模型备案,企业级服务成熟。

二、认证

采用 Access Token 方式认证,通过 API Key + Secret Key 获取:

# 获取 Access Token
curl https://aip.baidubce.com/oauth/2.0/token 
  -d "grant_type=client_credentials&client_id=YOUR_API_KEY&client_secret=YOUR_SECRET_KEY"

# 返回
{"access_token": "24.xxxxxxxxxxxx", "expires_in": 2592000}

Access Token 有效期30天,建议缓存复用。

API Key 和 Secret Key 在 千帆控制台 创建。

三、Base URL

https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop

四、模型列表

模型端点路径上下文说明
ERNIE 4.0/chat/completions_pro128K旗舰模型
ERNIE 3.5/chat/completions96K通用模型
ERNIE Speed/chat/ernie-speed-128k128K快速模型
ERNIE Lite/chat/ernie-lite-8k8K轻量模型
ERNIE Character/chat/ernie-char-8k8K角色扮演
ERNIE Functions/chat/ernie-func-8k8K函数调用
ERNIE-ViLG/txt2img-文生图

五、Chat 请求

POST https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro?access_token=xxx

{
  "messages": [
    {"role": "user", "content": "你好"}
  ],
  "temperature": 0.7,
  "top_p": 0.9,
  "max_output_tokens": 2048,
  "stream": false,
  "system": "你是文心一言助手"
}

参数说明

参数类型必填说明
messagesarray消息数组
temperaturefloat0-1,默认0.95
top_pfloat0-1,默认0.7
max_output_tokensint最大输出
streambool流式输出
systemstring系统提示词
functionsarray函数定义(Function Calling)
penalty_scorefloat1-2,重复惩罚

响应

{
  "id": "as-xxx",
  "object": "chat.completion",
  "created": 1717100000,
  "result": "你好!我是文心一言,有什么可以帮你的?",
  "is_truncated": false,
  "need_clear_history": false,
  "usage": {
    "prompt_tokens": 5,
    "completion_tokens": 15,
    "total_tokens": 20
  }
}

六、Function Calling

"functions": [{
  "name": "get_weather",
  "description": "获取天气信息",
  "parameters": {
    "type": "object",
    "properties": {
      "city": {"type": "string", "description": "城市名"}
    },
    "required": ["city"]
  }
}]

模型返回 function_call 字段时,执行对应函数并将结果追加到 messages 中继续对话。

七、流式输出

curl "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro?access_token=xxx" 
  -H "Content-Type: application/json" 
  -d '{"messages":[{"role":"user","content":"你好"}],"stream":true}'

返回 Server-Sent Events (SSE) 格式数据流。

八、文生图

POST https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/txt2img?access_token=xxx

{
  "prompt": "一只在赛博朋克城市中的白色猫",
  "n": 1,
  "size": "1024x1024",
  "style": "vivid"
}

九、OpenAI 兼容模式

千帆平台同时提供 OpenAI 兼容接口,可直接使用 OpenAI SDK:

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://qianfan.baidubce.com/v1"
)

response = client.chat.completions.create(
    model="ernie-4.0-8k",
    messages=[{"role": "user", "content": "你好"}]
)

十、定价

模型输入价格输出价格
ERNIE 4.0¥30/1M tokens¥90/1M tokens
ERNIE 3.5¥4/1M tokens¥8/1M tokens
ERNIE Speed免费免费
ERNIE Lite免费免费

ERNIE Speed 和 ERNIE Lite 免费使用,适合开发测试。

十一、速率限制

层级RPMTPM
免费3-10限制较低
付费60-300按模型不同

十二、错误码

错误码含义处理
1参数错误检查请求参数
2服务暂不可用稍后重试
3权限不足检查 Access Token
17请求频率超限退避重试
18QPS 超限降低并发
110Access Token 无效重新获取
336100内容合规拦截修改输入内容
使用手册

字节豆包 API 使用手册

一、概述

豆包是字节跳动推出的大语言模型服务,提供 Doubao 系列模型的 API 访问。通过火山引擎平台调用,兼容 OpenAI API 格式。以极低价格和中文理解能力著称,Doubao-Pro 价格仅为同级别模型的十分之一。

二、认证

通过火山引擎 API Key 认证:

Authorization: Bearer xxxxxxxxxx

API Key 在 火山引擎方舟控制台 创建。

三、Base URL

OpenAI兼容格式:https://ark.cn-beijing.volces.com/api/v3

四、模型列表

模型ID上下文最大输出说明
doubao-1.5-pro-256k256K16K旗舰模型,超长上下文
doubao-1.5-pro-32k32K8K旗舰模型,标准版
doubao-1.5-lite-32k32K8K轻量模型,高性价比
doubao-1.5-vision-pro-32k32K8K多模态旗舰
doubao-1.5-vision-lite-32k32K4K多模态轻量
doubao-embedding--文本嵌入

五、使用 OpenAI SDK 调用

from openai import OpenAI

client = OpenAI(
    api_key="your-ark-api-key",
    base_url="https://ark.cn-beijing.volces.com/api/v3"
)

response = client.chat.completions.create(
    model="doubao-1.5-pro-32k",
    messages=[
        {"role": "system", "content": "你是豆包助手。"},
        {"role": "user", "content": "你好!"}
    ],
    temperature=0.7,
    max_tokens=2048
)
print(response.choices[0].message.content)

六、推理模型(深度思考)

response = client.chat.completions.create(
    model="doubao-1.5-pro-32k",
    messages=[{"role": "user", "content": "证明根号2是无理数"}],
    extra_body={
        "thinking": {"type": "enabled"},
        "reasoning_effort": "high"
    }
)

# 思考过程在 reasoning_content 中
print(response.choices[0].message.reasoning_content)
print(response.choices[0].message.content)

七、流式输出

stream = client.chat.completions.create(
    model="doubao-1.5-pro-32k",
    messages=[{"role": "user", "content": "解释量子计算"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

八、Function Calling

tools = [{
    "type": "function",
    "function": {
        "name": "search_web",
        "description": "搜索互联网信息",
        "parameters": {
            "type": "object",
            "properties": {
                "query": {"type": "string", "description": "搜索关键词"}
            },
            "required": ["query"]
        }
    }
}]

response = client.chat.completions.create(
    model="doubao-1.5-pro-32k",
    messages=[{"role": "user", "content": "最新AI新闻"}],
    tools=tools,
    tool_choice="auto"
)

九、多模态(图像理解)

response = client.chat.completions.create(
    model="doubao-1.5-vision-pro-32k",
    messages=[{
        "role": "user",
        "content": [
            {"type": "image_url", "image_url": {"url": "https://example.com/photo.jpg"}},
            {"type": "text", "text": "描述这张图片"}
        ]
    }]
)

十、定价

模型输入价格输出价格说明
doubao-1.5-pro-32k¥4/1M tokens¥16/1M tokens旗舰级性价比
doubao-1.5-pro-256k¥8/1M tokens¥32/1M tokens超长上下文
doubao-1.5-lite-32k¥0.5/1M tokens¥2/1M tokens极低成本
doubao-1.5-vision-pro¥6/1M tokens¥24/1M tokens多模态

新用户赠送 50 万 tokens 免费额度。

十一、速率限制

层级RPMTPM
免费340,000
基础60300,000
标准3001,000,000

十二、错误码

状态码含义处理
400请求格式错误检查参数
401认证失败检查API Key
403权限不足开通模型访问权限
429速率限制退避重试
500服务端错误稍后重试
使用手册

智谱 GLM API 使用手册

一、概述

智谱 AI 推出的 GLM(General Language Model)系列大模型,提供从轻量到旗舰的完整模型矩阵。兼容 OpenAI API 格式,支持文本生成、对话、函数调用、图像理解、文生图、代码执行等能力。GLM-4V 多模态模型支持超高分辨率图像理解。

二、认证

Authorization: Bearer xxxxxxxxxx.xxxxxxxx

API Key 在 智谱开放平台 创建。

三、Base URL

https://open.bigmodel.cn/api/paas/v4

四、模型列表

模型ID上下文最大输出说明
glm-5128K16K最新旗舰
glm-4-plus128K8K上一代旗舰
glm-4-flash128K8K免费模型
glm-4-air128K8K高性价比
glm-4-long1M8K超长上下文
glm-4v-plus8K4K多模态旗舰
glm-4v-flash8K4K多模态免费
cogview-4--文生图
embedding-3--文本嵌入

五、使用 OpenAI SDK 调用

from openai import OpenAI

client = OpenAI(
    api_key="your-zhipu-api-key",
    base_url="https://open.bigmodel.cn/api/paas/v4"
)

response = client.chat.completions.create(
    model="glm-5",
    messages=[
        {"role": "system", "content": "你是智谱AI助手。"},
        {"role": "user", "content": "你好!"}
    ],
    temperature=0.7,
    top_p=0.7,
    max_tokens=2048,
    stream=False
)
print(response.choices[0].message.content)

六、原生 SDK 调用

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="your-api-key")

response = client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)

七、流式输出

response = client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "写一首关于春天的诗"}],
    stream=True
)

for chunk in response:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

八、Function Calling

tools = [{
    "type": "function",
    "function": {
        "name": "query_weather",
        "description": "查询天气",
        "parameters": {
            "type": "object",
            "properties": {
                "location": {"type": "string", "description": "城市"}
            },
            "required": ["location"]
        }
    }
}]

response = client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "北京天气"}],
    tools=tools
)

if response.choices[0].finish_reason == "tool_calls":
    tool_call = response.choices[0].message.tool_calls[0]
    # 执行函数并返回结果
    result = query_weather(json.loads(tool_call.function.arguments)["location"])
    
    follow_up = client.chat.completions.create(
        model="glm-5",
        messages=[
            {"role": "user", "content": "北京天气"},
            response.choices[0].message,
            {"role": "tool", "tool_call_id": tool_call.id, "content": result}
        ],
        tools=tools
    )

九、多模态(图像理解)

response = client.chat.completions.create(
    model="glm-4v-plus",
    messages=[{
        "role": "user",
        "content": [
            {"type": "image_url", "image_url": {"url": "https://example.com/photo.jpg"}},
            {"type": "text", "text": "详细描述这张图片"}
        ]
    }]
)

十、文生图(CogView)

response = client.images.generations(
    model="cogview-4",
    prompt="一只在水墨画风格的山间行走的猫",
    size="1024x1024"
)
print(response.data[0].url)

十一、定价

模型输入价格输出价格
glm-5¥30/1M tokens¥90/1M tokens
glm-4-plus¥25/1M tokens¥75/1M tokens
glm-4-flash免费免费
glm-4-air¥1/1M tokens¥1/1M tokens
glm-4-long¥1/1M tokens¥1/1M tokens
cogview-4¥0.05/张-

十二、速率限制

模型RPM(免费)RPM(付费)
glm-4-flash10100
glm-4-air560
glm-5560

十三、错误码

状态码含义处理
400参数错误检查请求格式
401认证失败检查API Key
429速率限制退避重试
1301内容合规拦截修改输入
1302模型过载稍后重试
使用手册

Moonshot Kimi API 使用手册

一、概述

Moonshot AI(月之暗面)推出的 Kimi 系列模型,以超长上下文和卓越的文档理解能力著称。Kimi K2 支持 128K 上下文,擅长处理长文档、学术论文、代码仓库等场景。兼容 OpenAI API 格式。

二、认证

Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

API Key 在 Moonshot 开放平台 创建。

三、Base URL

https://api.moonshot.cn/v1

四、模型列表

模型ID上下文最大输出说明
kimi-k2128K8K最新旗舰
moonshot-v1-128k128K8K上一代旗舰
moonshot-v1-32k32K8K标准版
moonshot-v1-8k8K8K基础版

五、使用 OpenAI SDK 调用

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxxxxxxx",
    base_url="https://api.moonshot.cn/v1"
)

response = client.chat.completions.create(
    model="kimi-k2",
    messages=[
        {"role": "system", "content": "你是 Kimi 智能助手。"},
        {"role": "user", "content": "你好!"}
    ],
    temperature=0.7,
    max_tokens=2048
)
print(response.choices[0].message.content)

六、cURL 调用示例

curl https://api.moonshot.cn/v1/chat/completions 
  -H "Content-Type: application/json" 
  -H "Authorization: Bearer $MOONSHOT_API_KEY" 
  -d '{
    "model": "kimi-k2",
    "messages": [
      {"role": "user", "content": "你好"}
    ]
  }'

七、流式输出

stream = client.chat.completions.create(
    model="kimi-k2",
    messages=[{"role": "user", "content": "解释量子纠缠"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

八、Function Calling

tools = [{
    "type": "function",
    "function": {
        "name": "search_web",
        "description": "搜索互联网",
        "parameters": {
            "type": "object",
            "properties": {
                "query": {"type": "string", "description": "搜索词"}
            },
            "required": ["query"]
        }
    }
}]

response = client.chat.completions.create(
    model="kimi-k2",
    messages=[{"role": "user", "content": "搜索最新的AI新闻"}],
    tools=tools,
    tool_choice="auto"
)

九、文件处理(核心特色)

Kimi 支持上传文件并在对话中引用,适合长文档分析:

# 1. 上传文件
file = client.files.create(
    file=open("paper.pdf", "rb"),
    purpose="file-extract"
)

# 2. 获取文件内容
file_content = client.files.content(file.id)
text = file_content.text

# 3. 在对话中使用
response = client.chat.completions.create(
    model="kimi-k2",
    messages=[
        {"role": "system", "content": "你是文档分析助手。"},
        {"role": "user", "content": f"以下是文档内容:n{text}nn请总结要点。"}
    ]
)

支持格式:PDF、Word、Excel、PPT、TXT、Markdown、CSV 等。

十、定价

模型输入价格输出价格
kimi-k2¥12/1M tokens¥36/1M tokens
moonshot-v1-128k¥14/1M tokens¥42/1M tokens
moonshot-v1-32k¥6/1M tokens¥18/1M tokens
moonshot-v1-8k¥4/1M tokens¥12/1M tokens

十一、速率限制

模型RPMTPM并发
moonshot-v1-8k30300,0005
moonshot-v1-32k30300,0005
moonshot-v1-128k10300,0003
kimi-k210300,0003

十二、错误码

状态码含义处理
400参数错误检查请求
401认证失败检查API Key
429速率限制退避重试
500服务端错误稍后重试
使用手册

MiniMax API 使用手册

一、概述

MiniMax 是国内领先的 AI 模型服务商,提供文本生成、语音合成(TTS)、语音识别(ASR)、音乐生成、视频生成等全栈 AI 能力。以语音合成质量业界领先著称,同时提供高性价比的文本模型。兼容 OpenAI API 格式。

二、认证

Authorization: Bearer xxxxxxxxxx.xxxxxxxx

API Key 在 MiniMax 开放平台 创建。

三、Base URL

https://api.minimax.chat/v1

四、模型列表

模型ID上下文最大输出说明
MiniMax-M2.7128K8K最新旗舰文本模型
abab6.5s-chat128K8K上一代快速模型
abab6.5g-chat32K8K上一代旗舰
speech-01-turbo--语音合成(TTS)
speech-01--高质量语音合成
video-01--视频生成
music-01--音乐生成

五、文本生成

from openai import OpenAI

client = OpenAI(
    api_key="your-minimax-api-key",
    base_url="https://api.minimax.chat/v1"
)

response = client.chat.completions.create(
    model="MiniMax-M2.7",
    messages=[
        {"role": "system", "content": "你是MiniMax助手。"},
        {"role": "user", "content": "你好!"}
    ],
    temperature=0.7,
    max_tokens=2048
)
print(response.choices[0].message.content)

六、语音合成(TTS)— 核心特色

MiniMax 的语音合成被认为是国内最自然的 TTS 服务之一:

POST https://api.minimax.chat/v1/t2a_v2?GroupId=your-group-id

{
  "model": "speech-01-turbo",
  "text": "你好,欢迎使用MiniMax语音合成服务。",
  "stream": false,
  "voice_setting": {
    "voice_id": "Chinese_Female_Gentle",
    "speed": 1.0,
    "vol": 1.0,
    "pitch": 0
  },
  "audio_setting": {
    "sample_rate": 32000,
    "format": "mp3"
  }
}

预设声音列表(部分)

voice_id风格
Chinese_Female_Gentle温柔女声
Chinese_Male_Storyteller沉稳男声
Chinese_Female_Vivid活泼女声
Chinese_Male_Calm平静男声
presenter_female主持女声
presenter_male主持男声

支持声音克隆:上传10-30秒音频即可创建自定义音色。

流式TTS

{
  "model": "speech-01-turbo",
  "text": "这是一段很长的文本...",
  "stream": true,
  "voice_setting": {
    "voice_id": "Chinese_Female_Gentle"
  }
}

返回 SSE 格式音频流,实现边生成边播放。

七、语音识别(ASR)

POST https://api.minimax.chat/v1/asr?GroupId=your-group-id

{
  "model": "speech-01",
  "file": "base64-encoded-audio",
  "language": "zh"
}

八、视频生成

POST https://api.minimax.chat/v1/video_generation

{
  "model": "video-01",
  "prompt": "一只猫在雨中撑伞漫步",
  "aspect_ratio": "16:9"
}

视频生成异步任务,需轮询查询状态。

九、音乐生成

POST https://api.minimax.chat/v1/music_generation

{
  "model": "music-01",
  "prompt": "轻快的电子音乐,节奏明快",
  "duration": 30
}

十、Function Calling

tools = [{
    "type": "function",
    "function": {
        "name": "get_stock_price",
        "description": "查询股票价格",
        "parameters": {
            "type": "object",
            "properties": {
                "symbol": {"type": "string", "description": "股票代码"}
            },
            "required": ["symbol"]
        }
    }
}]

response = client.chat.completions.create(
    model="MiniMax-M2.7",
    messages=[{"role": "user", "content": "茅台股价多少?"}],
    tools=tools
)

十一、定价

服务价格
MiniMax-M2.7 输入¥4/1M tokens
MiniMax-M2.7 输出¥12/1M tokens
TTS (speech-01-turbo)¥0.1/千字符
TTS (speech-01)¥0.2/千字符
声音克隆¥50/个音色
视频生成¥0.5/秒
音乐生成¥0.3/首(30秒)

十二、错误码

状态码含义处理
400参数错误检查请求
401认证失败检查API Key
429速率限制退避重试
500服务端错误稍后重试
使用手册

API密钥管理指南

API密钥管理指南

一、什么是 API 密钥

API 密钥(API Key)是调用 AI 模型服务的通行证,每个密钥对应一个独立账户,用于身份认证和用量统计。

二、获取密钥

模型平台获取地址注意
OpenAIplatform.openai.com需要国际信用卡
火山引擎console.volcengine.com新用户有免费额度
NVIDIA NIMcatalog.ngc.nvidia.com提供免费试用
硅基流动account.siliconflow.cn注册送额度
Groqconsole.groq.com免费额度充足

三、安全规范

风险说明防护措施
密钥泄露代码提交到 GitHub,密钥公开使用环境变量,不写进代码
用量超支密钥被他人滥用设置用量限额,及时轮换
跨平台混用一个密钥用于多个服务一个服务对应一个密钥

四、常见问题

1. 密钥显示无效怎么办?

检查密钥是否过期或被平台吊销,重新到对应平台控制台生成新密钥。

2. 费用异常如何处理?

第一时间在平台后台关闭密钥,排查用量记录,联系客服申诉。

使用手册

模型选择指南

模型选择指南

一、按任务类型选择

任务类型推荐模型原因
代码生成Claude 4.7 OpusSWE-bench Pro 64.3%,代码能力最强
长文档分析Gemini 3.1 Pro1M 上下文,科学推理 94.3%
中文内容豆包 Seed 2.0 Pro中文场景专项优化
成本敏感DeepSeek V4-Flash¥0.14/M tokens,性价比最高
快速响应GPT-5.5 Instant免费+极速,日常对话首选

二、性能对比

能力维度第1第2第3第4第5
推理能力ClaudeGPT-5.5GeminiQwenDeepSeek
代码能力ClaudeDeepSeek V4GPT-5.5QwenGemini
中文能力Qwen豆包DeepSeekGPT-5.5Claude
速度GPT-5.5 InstantDeepSeekQwenGeminiClaude
性价比DeepSeek豆包QwenGeminiClaude

三、模型特点详解

1. Claude 4.7 Opus

  • 优势:代码生成、复杂推理、长文本理解
  • 上下文:200K tokens
  • 适用场景:软件开发、技术文档、研究分析

2. GPT-5.5 Instant

  • 优势:响应速度快、免费额度充足
  • 上下文:128K tokens
  • 适用场景:日常对话、快速问答、内容生成

3. DeepSeek V4-Flash

  • 优势:成本极低、中文友好
  • 上下文:64K tokens
  • 适用场景:批量处理、成本敏感项目

4. Gemini 3.1 Pro

  • 优势:超长上下文、科学推理
  • 上下文:1M tokens
  • 适用场景:论文分析、多文档处理

四、使用建议

优先选择:复杂任务用 Claude,日常对话用 GPT-5.5 Instant,中文场景用豆包,成本敏感用 DeepSeek V4-Flash
使用手册

API 中转站使用指南

API 中转站使用指南

一、什么是 API 中转站

API 中转站(API Relay)统一管理多个 AI 平台的 API 分发,简化接入流程,支持密钥轮换和流量控制。

二、快速开始

步骤操作说明
1获取令牌在个人中心生成访问令牌
2配置模型选择需要的 AI 模型
3发起请求向中转站地址发送 API 请求
4查看用量在面板查看调用统计

三、支持的模型

模型状态说明
GPT-5.5可用最新 GPT 模型,速度快
Claude Opus 4.7可用代码能力强,推理优秀
DeepSeek V4可用性价比高,中文友好
Gemini 3.1 Pro可用长上下文,科学推理强
豆包 Seed 2.0可用国产优质模型

四、常见问题

1. 请求超时怎么办?

尝试切换模型或稍后重试,高峰期可能响应较慢。

2. 如何查看账单?

登录后在「用量统计」页面查看详细消费记录。

使用手册

One API 管理后台使用指南

One API 管理后台使用指南

一、One API 是什么

One API 是一款开源的 API 中转管理平台,支持多渠道统一管理、AI 模型接入与分发,适合个人或企业搭建 API 分发站。

二、核心功能

功能说明
渠道管理添加和管理不同的 AI API 渠道
令牌管理创建访问令牌,控制权限和额度
用量统计实时查看各渠道调用量和费用
智能路由根据负载自动分配请求到最优渠道

三、操作指南

1. 添加渠道

在「渠道」页面点击「新增渠道」,填写 API 端点、密钥和模型名称。

2. 创建令牌

在「令牌」页面创建新令牌,设置额度限制和有效期。

3. 查看日志

在「日志」页面查看每次 API 请求的详情,便于排查问题。


四、常见问题

1. 渠道显示离线?

检查密钥是否正确,API 端点是否可达,网络连接是否正常。

2. 如何限制用户额度?

在令牌管理中设置额度上限,超出后自动封禁该令牌。

使用手册

API密钥获取与使用完全指南

一、获取API密钥

使用EAKE AI平台的API服务,首先需要获取API密钥:

  1. 注册并登录 api.eake.cn
  2. 进入「令牌」页面,点击「创建新令牌」
  3. 设置令牌名称和额度,点击创建
  4. 复制生成的API密钥(仅显示一次,请妥善保存)

二、API基础调用

2.1 接口地址

https://api.eake.cn/v1/chat/completions

2.2 请求示例

curl https://api.eake.cn/v1/chat/completions -H Content-Type: application/json -H Authorization: Bearer YOUR_API_KEY -d {model:claude-sonnet-4-20250514,messages:[{role:user,content:hello}]}

2.3 Python调用

from openai import OpenAI
client = OpenAI(api_key=YOUR_API_KEY, base_url=https://api.eake.cn/v1)
response = client.chat.completions.create(model=claude-sonnet-4-20250514, messages=[{role:user,content:hello}])
print(response.choices[0].message.content)

三、支持的模型

  • Anthropic:Claude Opus 4、Sonnet 4、Sonnet 3.5
  • OpenAI:GPT-4.1、GPT-4.1 mini、o3
  • Google:Gemini 2.5 Pro、Gemini 2.5 Flash
  • 国产:DeepSeek R1、Qwen 3、GLM-5、Kimi K2

四、计费说明

平台采用预充值模式,按实际token用量计费。

五、常见问题

Q: 提示Insufficient quota怎么办?余额不足,请前往充值页面充值。

Q: 支持流式输出吗?支持,请求中设置stream:true即可。

使用手册

Hermes Agent 部署与配置完全指南

Hermes Agent 部署与配置完全指南

Hermes Agent 是 Nous Research 开发的开源 AI 智能体,支持15+平台接入,具备记忆、技能学习、语音交互等能力。本指南覆盖从零部署到生产使用的全流程。

一、环境要求

  • Python 3.11+
  • Node.js 20+(浏览器工具依赖)
  • Git、ffmpeg、ripgrep
  • uv 包管理器

二、一键安装

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

三、模型配置

运行 hermes model 交互式选择模型和 provider,或手动编辑 ~/.hermes/config.yaml

model:
  default: doubao-seed-2-0-pro-260215
  provider: custom
  base_url: " http://localhost:8866/v1\
 api_key: \your-api-key\
 context_length: 128000

四、平台接入

Hermes 支持 Telegram、Discord、微信、Slack 等 15+ 平台:

hermes gateway setup # 交互式配置
hermes gateway run # 前台运行
hermes gateway install # 安装为系统服务

五、语音功能

在 config.yaml 中添加:

voice:
 stt:
 enabled: true
 provider: local
 local:
 model: base
 tts:
 enabled: true
 provider: edge
 edge:
 voice: zh-CN-XiaoxiaoNeural

安装本地 STT:pip install faster-whisper

在聊天中发送 /voice on 启用语音模式。

六、Skills 管理

hermes skills list # 查看已装skills
hermes skills search \关键词\ # 搜索skills
hermes skills install identifier # 安装skill

七、Web UI 部署

npm install -g hermes-web-ui
hermes-web-ui start 8648 # 启动Web界面

配合 Nginx 反向代理即可对外提供 Web 访问。

常见问题

Q: 502 Bad Gateway?
A: 检查 hermes-web-ui 是否在运行,端口是否匹配 nginx 配置。

Q: 回复出现英文/配置内容?
A: 在 AGENTS.md 中添加强制中文和禁止输出文档的规则,并考虑升级模型。

Q: 语音不生效?
A: 确认 faster-whisper 已安装,voice 配置已写入,发送 /voice on 开启。

使用手册

Claude Code 终端编程完全指南

Claude Code 是 Anthropic 官方推出的终端编程工具,基于 Claude 3.5 Sonnet 模型,支持直接在命令行中与 AI 协作完成代码编写、调试、重构和解释等任务。

核心能力

  • 智能代码生成:通过自然语言描述需求,自动生成完整代码文件
  • 代码审查与优化:分析代码逻辑,提供改进建议和性能优化方案
  • 多轮对话迭代:支持持续对话,可完成从设计到实现的完整流程
  • 文件批量处理:支持一次处理多个文件,适合大型项目重构
  • 安全沙箱执行:所有代码操作在隔离环境中执行

安装方法

npm install -g @anthropic-ai/claude-code
npx claude-code

基本使用

claude-code
# 解释代码
"请解释 src/utils/auth.js 的工作原理"
# 重构代码
"将这个函数重构为 TypeScript,并添加类型注解"
# 写测试
"为这个模块生成 Jest 单元测试"

进阶技巧

  • 使用 @ 引用本地文件:@src/main.ts 请分析这个模块
  • 使用 /approval 查看所有待执行的写操作
  • 使用 /model 切换不同 Claude 模型
  • 设置 CLAUDE_API_KEY 环境变量使用自有 API Key

适用场景

  • 快速原型开发:用自然语言描述即可生成功能代码
  • 遗留代码维护:自动分析并重构老旧代码
  • 代码评审:辅助进行代码审查和 Bug 定位
  • 学习新技术:通过对话方式快速理解陌生代码库

Claude Code 是现代 AI 原生开发工具的代表,让开发者从繁琐的重复编码中解放出来,专注于更具创造性的工作。

使用手册

One API 中转站高可用部署方案

One API 是一个开源的 API 中转管理平台,支持将多个 AI 服务商的 API 统一接入,通过自定义渠道实现负载均衡、限流控制和成本优化。

架构设计

                    ┌─────────────┐
                    │   Nginx     │  (HTTPS 443)
                    └──────┬──────┘
                           │
        ┌──────────────────┼──────────────────┐
        │                  │                  │
  ┌─────▼─────┐      ┌────▼────┐      ┌─────▼─────┐
  │ One API 1 │      │ One API2│      │ One API 3│
  │  :3000    │      │  :3001   │      │  :3002   │
  └─────┬─────┘      └────┬────┘      └─────┬─────┘
        └──────────────────┼──────────────────┘
                           │
              ┌────────────▼────────────┐
              │      MySQL 共享存储       │
              └──────────────────────────┘

Docker Compose 部署

version: "3.8"
services:
  one-api:
    image: ssawing/one-api:latest
    container_name: one-api
    restart: unless-stopped
    ports:
      - "3000:3000"
    volumes:
      - ./data:/data
    depends_on:
      - mysql
  mysql:
    image: mysql:8.0
    container_name: one-api-mysql
    restart: unless-stopped
    environment:
      MYSQL_ROOT_PASSWORD: your_strong_password
      MYSQL_DATABASE: one_api
    volumes:
      - ./mysql:/var/lib/mysql

高可用配置要点

  • 多实例部署:通过 Nginx upstream 配置多个 One API 实例,轮询负载均衡
  • 会话共享:所有实例连接同一个 MySQL 数据库,渠道配置实时同步
  • 健康检查:Nginx upstream 配置 max_fails 和 fail_timeout,自动摘除故障节点
  • SSL 终端:在 Nginx 层处理 HTTPS,容器间通信走 HTTP
  • 数据持久化:MySQL 主从复制,One API /data 目录映射到宿主机

安全加固

  • 修改管理后台路径(如 /admin-secret-path/)防止扫描
  • 设置复杂的渠道 Token,定期轮换
  • 通过 Nginx limit_req 限制单 IP 请求频率
  • 配置 Key 鉴权白名单

高可用部署的核心是冗余 + 故障自动切换。生产环境建议使用 K8s 进行容器编排和自动恢复。

使用手册

Claude Code 完全指南 — 从安装到高效使用

Claude Code 完全指南

指南概述

Claude Code 完全指南 —— 从安装到高效使用 是一份从入门到精通的完整教程,帮助你快速掌握该工具的核心用法。

前置要求

  • 基础的命令行操作能力
  • 已安装必要的运行环境(如 Node.js、Python、Docker 等)
  • 拥有对应的 API 密钥或账号

安装步骤

  1. 环境准备:检查并安装所需依赖
  2. 获取凭证:注册账号并获取 API Key
  3. 初始化配置:按照向导完成初始设置
  4. 验证安装:运行测试命令确认可用

核心功能详解

本指南将逐一介绍各项核心功能的使用方法和最佳实践,包括但不限于:基本操作、高级配置、常见问题排查、性能优化建议等。

进阶技巧

  • 自定义快捷键和工作流
  • 与现有工具链的集成方案
  • 团队协作的最佳实践
  • 安全性和权限管理

故障排除

汇总了用户最常遇到的问题及其解决方案,包括网络连接问题、认证失败、输出异常等典型情况的排查思路。

使用手册

One API 部署指南 — 统一管理多个AI模型接口

One API 部署指南

指南概述

One API 部署指南 —— 统一管理多个AI模型接口 是一份从入门到精通的完整教程,帮助你快速掌握该工具的核心用法。

前置要求

  • 基础的命令行操作能力
  • 已安装必要的运行环境(如 Node.js、Python、Docker 等)
  • 拥有对应的 API 密钥或账号

安装步骤

  1. 环境准备:检查并安装所需依赖
  2. 获取凭证:注册账号并获取 API Key
  3. 初始化配置:按照向导完成初始设置
  4. 验证安装:运行测试命令确认可用

核心功能详解

本指南将逐一介绍各项核心功能的使用方法和最佳实践,包括但不限于:基本操作、高级配置、常见问题排查、性能优化建议等。

进阶技巧

  • 自定义快捷键和工作流
  • 与现有工具链的集成方案
  • 团队协作的最佳实践
  • 安全性和权限管理

故障排除

汇总了用户最常遇到的问题及其解决方案,包括网络连接问题、认证失败、输出异常等典型情况的排查思路。

使用手册

Gemini CLI 快速上手 — Google免费AI编程助手

Gemini CLI 快速上手

指南概述

Gemini CLI 快速上手 —— Google免费AI编程助手 是一份从入门到精通的完整教程,帮助你快速掌握该工具的核心用法。

前置要求

  • 基础的命令行操作能力
  • 已安装必要的运行环境(如 Node.js、Python、Docker 等)
  • 拥有对应的 API 密钥或账号

安装步骤

  1. 环境准备:检查并安装所需依赖
  2. 获取凭证:注册账号并获取 API Key
  3. 初始化配置:按照向导完成初始设置
  4. 验证安装:运行测试命令确认可用

核心功能详解

本指南将逐一介绍各项核心功能的使用方法和最佳实践,包括但不限于:基本操作、高级配置、常见问题排查、性能优化建议等。

进阶技巧

  • 自定义快捷键和工作流
  • 与现有工具链的集成方案
  • 团队协作的最佳实践
  • 安全性和权限管理

故障排除

汇总了用户最常遇到的问题及其解决方案,包括网络连接问题、认证失败、输出异常等典型情况的排查思路。

使用手册

Cursor AI 使用手册 — AI驱动的代码编辑器

Cursor AI 使用手册

指南概述

Cursor AI 使用手册 —— AI驱动的代码编辑器 是一份从入门到精通的完整教程,帮助你快速掌握该工具的核心用法。

前置要求

  • 基础的命令行操作能力
  • 已安装必要的运行环境(如 Node.js、Python、Docker 等)
  • 拥有对应的 API 密钥或账号

安装步骤

  1. 环境准备:检查并安装所需依赖
  2. 获取凭证:注册账号并获取 API Key
  3. 初始化配置:按照向导完成初始设置
  4. 验证安装:运行测试命令确认可用

核心功能详解

本指南将逐一介绍各项核心功能的使用方法和最佳实践,包括但不限于:基本操作、高级配置、常见问题排查、性能优化建议等。

进阶技巧

  • 自定义快捷键和工作流
  • 与现有工具链的集成方案
  • 团队协作的最佳实践
  • 安全性和权限管理

故障排除

汇总了用户最常遇到的问题及其解决方案,包括网络连接问题、认证失败、输出异常等典型情况的排查思路。

使用手册

OpenAI API 快速接入指南

OpenAI API 快速接入指南

指南概述

OpenAI API 快速接入指南 是一份从入门到精通的完整教程,帮助你快速掌握该工具的核心用法。

前置要求

  • 基础的命令行操作能力
  • 已安装必要的运行环境(如 Node.js、Python、Docker 等)
  • 拥有对应的 API 密钥或账号

安装步骤

  1. 环境准备:检查并安装所需依赖
  2. 获取凭证:注册账号并获取 API Key
  3. 初始化配置:按照向导完成初始设置
  4. 验证安装:运行测试命令确认可用

核心功能详解

本指南将逐一介绍各项核心功能的使用方法和最佳实践,包括但不限于:基本操作、高级配置、常见问题排查、性能优化建议等。

进阶技巧

  • 自定义快捷键和工作流
  • 与现有工具链的集成方案
  • 团队协作的最佳实践
  • 安全性和权限管理

故障排除

汇总了用户最常遇到的问题及其解决方案,包括网络连接问题、认证失败、输出异常等典型情况的排查思路。

使用手册

Docker入门 — AI项目容器化部署

Docker入门

指南概述

Docker入门 —— AI项目容器化部署 是一份从入门到精通的完整教程,帮助你快速掌握该工具的核心用法。

前置要求

  • 基础的命令行操作能力
  • 已安装必要的运行环境(如 Node.js、Python、Docker 等)
  • 拥有对应的 API 密钥或账号

安装步骤

  1. 环境准备:检查并安装所需依赖
  2. 获取凭证:注册账号并获取 API Key
  3. 初始化配置:按照向导完成初始设置
  4. 验证安装:运行测试命令确认可用

核心功能详解

本指南将逐一介绍各项核心功能的使用方法和最佳实践,包括但不限于:基本操作、高级配置、常见问题排查、性能优化建议等。

进阶技巧

  • 自定义快捷键和工作流
  • 与现有工具链的集成方案
  • 团队协作的最佳实践
  • 安全性和权限管理

故障排除

汇总了用户最常遇到的问题及其解决方案,包括网络连接问题、认证失败、输出异常等典型情况的排查思路。