欢迎回来

登录 EAKE AI,继续您的智能之旅

忘记密码?
还没有账号?立即注册
OpenAI

OpenAI Python SDK 使用指南

概述

OpenAI Python库提供从任何Python 3.9+应用程序方便地访问OpenAI REST API。该库为所有请求参数和响应字段提供类型定义,并提供由httpx驱动的同步和异步客户端。

安装

pip install openai

快速开始

from openai import OpenAI

client = OpenAI(
    api_key=os.environ.get("OPENAI_API_KEY"),
)

response = client.responses.create(
    model="gpt-5.2",
    instructions="You are a helpful assistant.",
    input="Hello, world!",
)

print(response.output_text)

认证方式

API Key认证

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key"
)

工作负载身份认证

适用于Kubernetes、Azure和Google Cloud Platform等云环境:

from openai import OpenAI
from openai.auth import k8s_service_account_token_provider

client = OpenAI(
    workload_identity={
        "client_id": "your-client-id",
        "identity_provider_id": "idp-123",
        "service_account_id": "sa-456",
        "provider": k8s_service_account_token_provider(
            "/var/run/secrets/kubernetes.io/serviceaccount/token"
        ),
    },
)

图像识别

支持输入图像进行视觉理解:

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.2",
    input=[
        {
            "role": "user",
            "content": [
                {"type": "input_text", "text": "这张图片里有什么?"},
                {"type": "input_image", "image_url": "https://example.com/image.jpg"},
            ],
        }
    ],
)

异步调用

import asyncio
from openai import AsyncOpenAI

client = AsyncOpenAI()

async def main():
    response = await client.responses.create(
        model="gpt-5.2",
        input="Explain quantum computing"
    )
    print(response.output_text)

asyncio.run(main())

流式输出

from openai import OpenAI

client = OpenAI()

stream = client.responses.create(
    model="gpt-5.2",
    input="Write a story",
    stream=True,
)

for event in stream:
    print(event)

实时API

支持低延迟多模态对话:

import asyncio
from openai import AsyncOpenAI

async def main():
    client = AsyncOpenAI()

    async with client.realtime.connect(model="gpt-realtime") as conn:
        await conn.session.update(
            session={"type": "realtime", "output_modalities": ["text"]}
        )

        await conn.conversation.item.create(
            item={
                "type": "message",
                "role": "user",
                "content": [{"type": "input_text", "text": "你好!"}]
            }
        )
        await conn.response.create()

        async for event in conn:
            if event.type == "response.output_text.delta":
                print(event.delta, end="")
            elif event.type == "response.done":
                break

asyncio.run(main())

主要API端点

端点方法描述
/completionsclient.completions.create文本补全
/chat/completionsclient.chat.completions.create对话补全
/responsesclient.responses.create响应API
/embeddingsclient.embeddings.create嵌入向量
/imagesclient.images.generate图像生成
/audio/transcriptionsclient.audio.transcriptions.create语音转文字
/fine_tuning/jobsclient.fine_tuning.jobs.create微调训练

错误处理

from openai import OpenAI
from openai import RateLimitError, APIError

client = OpenAI()

try:
    response = client.responses.create(
        model="gpt-5.2",
        input="Hello"
    )
except RateLimitError:
    print("请求频率超限,请稍后重试")
except APIError as e:
    print(f"API错误: {e.message}")
OpenAI

OpenAI API 快速入门:文本生成与对话开发

OpenAI API 概览

OpenAI API 提供了对 GPT 系列模型的程序化访问能力,支持文本生成、对话、函数调用、图像生成、语音合成等多种功能。开发者可以通过 REST API 或官方 SDK 快速集成到应用中。

获取 API Key

  1. 访问 platform.openai.com 注册/登录
  2. 进入 API Keys 页面,点击 "Create new secret key"
  3. 保存密钥(仅显示一次)
  4. 设置环境变量:export OPENAI_API_KEY=sk-xxx

Python SDK 安装

pip install openai

基础文本生成

Chat Completions API

from openai import OpenAI

client = OpenAI()  # 自动读取 OPENAI_API_KEY

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "你是一个专业的技术顾问。"},
        {"role": "user", "content": "解释什么是大语言模型?"}
    ],
    temperature=0.7,
    max_tokens=1000
)

print(response.choices[0].message.content)

流式输出

stream = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "写一首关于AI的诗"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

函数调用(Function Calling)

让模型决定何时调用预定义的函数:

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "获取指定城市的天气",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string", "description": "城市名称"}
            },
            "required": ["city"]
        }
    }
}]

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "北京今天天气怎么样?"}],
    tools=tools
)

模型选择指南

模型适用场景上下文
GPT-4o通用,性价比最优128K
GPT-4o-mini轻量任务,成本低128K
GPT-5.2最强推理能力256K
o3复杂推理,数学/编程200K
DALL·E 3图像生成-
Whisper语音转文字-
TTS文字转语音-

定价参考

模型输入价格输出价格
GPT-4o$2.50/1M tokens$10.00/1M tokens
GPT-4o-mini$0.15/1M tokens$0.60/1M tokens
GPT-5.2$10.00/1M tokens$30.00/1M tokens

最佳实践

  • 使用 system message 设定角色和行为约束
  • 善用 temperature:0=确定性输出,1=创意性输出
  • 长对话使用 消息摘要 控制上下文长度
  • 实现 重试机制 处理速率限制
  • 敏感内容使用 moderation API 过滤
OpenAI

OpenAI GPT-5 与 Codex 深度解析

GPT-5 系列:新一代智能

2025年,OpenAI 发布了 GPT-5 系列,标志着大语言模型能力的又一次飞跃。GPT-5 在推理、编程、多模态理解方面均有显著提升,同时推出了多个版本满足不同需求。

模型版本对比

模型参数规模上下文核心能力
GPT-5未公开256K通用最强
GPT-5.2未公开256K推理增强版
o3-200K推理专用
o4-mini-128K轻量推理

关键能力提升

1. 推理能力

GPT-5 引入了更强的链式思维(Chain-of-Thought)推理能力,在数学、逻辑、科学问题上的表现大幅提升。结合 o3 系列的推理优化,复杂多步问题的准确率显著提高。

2. 编程能力

在 HumanEval、SWE-Bench 等编程基准测试中,GPT-5 系列表现优异。配合 Codex 工具,实现了从需求描述到完整代码生成的端到端能力。

3. 多模态理解

GPT-5 原生支持文本、图像、音频的混合输入,视觉理解能力大幅增强,可准确解读图表、文档、UI截图等复杂视觉内容。

Codex:AI 编程助手

Codex 是 OpenAI 推出的云端编程代理工具,基于 GPT-5 系列模型,能够:

  • 理解自然语言描述的需求
  • 自主规划代码实现方案
  • 编写、测试、调试代码
  • 执行终端命令和文件操作
  • 在沙盒环境中验证结果

使用 Codex

# 安装
npm install -g @openai/codex

# 设置 API Key
export OPENAI_API_KEY=sk-xxx

# 启动
codex "创建一个Express服务器,支持用户注册和登录"

API 调用示例

from openai import OpenAI

client = OpenAI()

# GPT-5.2 推理模式
response = client.chat.completions.create(
    model="gpt-5.2",
    messages=[
        {"role": "user", "content": "证明根号2是无理数"}
    ],
    reasoning={"effort": "high"},  # 推理强度
    max_tokens=4096
)

# o3 推理专用
response = client.chat.completions.create(
    model="o3",
    messages=[
        {"role": "user", "content": "解决这个数学问题..."}
    ],
    reasoning={"effort": "high"}
)

迁移指南

从 GPT-4 升级到 GPT-5 主要变更:

  • 模型名:gpt-4gpt-5gpt-5.2
  • 上下文窗口:128K → 256K
  • 新增 reasoning 参数控制推理深度
  • 函数调用格式兼容,无需修改
OpenAI

OpenAI Function Calling 实战

## OpenAI Function Calling 实战 ### 什么是Function Calling 让GPT模型能够调用外部函数,实现与真实世界交互。 ### 基本用法 ```python from openai import OpenAI client = OpenAI() tools = [{ "type": "function", "function": { "name": "get_weather", "description": "获取城市天气", "parameters": { "type": "object", "properties": { "city": {"type": "string", "description": "城市名称"} }, "required": ["city"] } } }] response = client.chat.completions.create( model="gpt-4.5-turbo", messages=[{"role": "user", "content": "北京天气?"}], tools=tools ) ```
OpenAI

GPT-5.5 完整功能指南

## GPT-5.5 完整功能指南 ### 三个版本 | 版本 | 定位 | 用户群体 | |------|------|----------| | GPT-5.5 Standard | API标准版 | 开发者 | | GPT-5.5 Thinking | 扩展推理 | 复杂任务 | | GPT-5.5 Pro | 最高精度 | Pro/Business/Enterprise | ### GPT-5.5 Instant(2026年5月6日上线) 2026年5月6日,GPT-5.5 Instant 成为 ChatGPT 默认模型,面向所有用户免费开放。 核心升级: - AIME 2025 数学测试 81.2 分(前代 65.4 分) - MMMU-Pro 多模态推理 76 分 - 高敏感领域幻觉率下降 52.5% - 不准确率降低 37.3% ### 个性化记忆功能 Plus 和 Pro 用户可跨会话调取历史对话、上传文件和 Gmail 信息。官方测试显示: - 提示词长度缩短 62% - 任务完成效率提升 47% ### API 调用 ```python from openai import OpenAI client = OpenAI() # Standard response = client.chat.completions.create( model="gpt-5.5", messages=[{"role": "user", "content": "Hello"}] ) # Thinking response = client.chat.completions.create( model="gpt-5.5-thinking", messages=[{"role": "user", "content": "Solve this math problem"}] ) ``` ### API 定价 - 输入/输出:$5.00/$30.00 每百万 token - 比 GPT-5.4 翻倍,但 Token 效率提升 35 倍 ### 适用场景 - Agent 工作流(Terminal-Bench 82.7%) - 代码编写调试 - 数据分析与在线研究
OpenAI

GPT-5.5 Agent 能力解析

## GPT-5.5 Agent 能力解析 ### Agent 编码 GPT-5.5 可在较少指令引导下自主完成多步骤复杂任务: - 自主规划执行路径 - 调用工具并校验结果 - 持续推进直到任务完成 ### 计算机操控 从"改善中"升级为"生产可用级"多步工具链: ```python from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="gpt-5.5", messages=[ {"role": "system", "content": "You are a computer use agent"}, {"role": "user", "content": "打开浏览器,搜索最新的AI论文"} ], tools=[{"type": "computer_use"}] ) ``` ### 深度研究 GPT-5.5 支持长时间深度研究任务,自动收集信息、整理分析、生成报告。 ### Codex 集成 GPT-5.5 已深度集成到 Codex 编程产品: - 自主代码审查 - 多文件重构 - 测试生成与运行 ### 能力对比 | 能力 | GPT-5.4 | GPT-5.5 | |------|---------|---------| | 上下文 | 1.05M | 1M (Codex 400K) | | 多模态 | 文本+图像+音频 | 原生全模态(含视频) | | 计算机操控 | 改善中 | 生产可用 | | 幻觉率 | 基线 | -60% |