亚蓝智能体中心

Gemini 3.5 Flash — Google极速多模态模型

厂商：Google DeepMind

⬇ 10K+ 调用 ★ 4.5 评分 📄 128K 上下文

模型介绍

Gemini 3.5 Flash 是 Google DeepMind 在 Flash 系列上的最新迭代，专注于极速响应和多模态理解能力的双重提升。作为 Gemini 3.5 系列的轻量版本，它在保持强大能力的同时大幅优化了延迟和成本。

核心优势

极速响应：针对延迟敏感场景优化，首 token 响应时间显著缩短
百万上下文：尽管主打快速，但同样支持 1M tokens 超长上下文
原生多模态：文本、图像、视频、音频统一处理
代码执行：内置 Python 沙箱支持，可自动运行代码验证结果
成本优化：相比 Pro 版本大幅降低使用成本，适合高并发场景

适用场景

实时对话：聊天机器人、虚拟助手等需要快速响应的场景
批量处理：文档批量摘要、内容审核等大规模任务
多模态理解：图片标注、视频内容分析等视觉任务
API 中转站：作为高速平替，在成本和速度之间取得最佳平衡

API 调用示例

curl https://api.eake.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{"model":"gemini-3.5-flash","messages":[{"role":"user","content":"分析这张图片的内容"}]}'

Gemini 3.5 Flash 是追求极致性价比的用户的首选，适合需要大规模部署 AI 能力但对成本敏感的业务场景。

模型文件

📄 config.json 1.2 KB

📄 tokenizer.json 2.4 MB

📦 model.safetensors 需下载

📄 README.md 8.5 KB

API 调用示例

# Python OpenAI SDK 调用示例
import openai

client = openai.OpenAI(
    api_key="your-api-key",
    base_url="https://api.eake.cn/v1"
)

response = client.chat.completions.create(
    model="gemini-3-5-flash-google",
    messages=[
        {"role": "user", "content": "你好！"}
    ],
    temperature=0.7,
    max_tokens=2048
)

print(response.choices[0].message.content)

📡 API 端点

https://api.eake.cn/v1

完全兼容 OpenAI API 格式，可直接使用官方 SDK 调用

💬 讨论区

登录后参与讨论，分享使用心得

模型信息

厂商 Google DeepMind

上下文长度 128K

最大输出 16K

API定价 USD 0.075/0.30 per M tokens

能力标签

多模态

快捷操作

← 浏览更多模型

欢迎回来

创建账号

Gemini 3.5 Flash — Google极速多模态模型

模型介绍

核心优势

适用场景

API 调用示例

模型文件

API 调用示例

📡 API 端点

💬 讨论区