跳转到主要内容
Gemini 主要有两条线 —— Pro 和 Flash —— 选哪个通常看你更看重什么:质量上限,还是速度和成本。这页帮你按任务选模型、看清 Gemini 能干什么。技术接入 —— 怎么走 OpenAI 兼容端点 —— 见快速入门

两条线的区别

线擅长速度 / 价格什么时候用
Gemini Pro复杂任务、长文分析、推理更慢、更贵代码、解析大文档、多步任务
Gemini Flash大批量下的快速回复更快、更便宜聊天机器人、分类、批处理
请求量大就用 Flash —— 明显更快更便宜。Flash 扛不住的复杂度,再上 Pro。

Gemini 能干什么

  • 超长上下文 —— Gemini 一向的强项,整篇大文档能塞进窗口。
  • 图片输入 —— 模型可以连同文本一起接受图片。怎么传图见图像输入
  • 函数调用(tool use) —— 模型能返回结构化的工具调用,智能体就建在这上面;完整示例见函数调用
model 字段填的是 ID,例如快模型用 gemini-3.5-flash。精确 ID、版本和单价见 www.ruapi.ai 的**「价格」**页。名称跟 Google 官方一致,新版本自动进目录。

按任务怎么选

  • 流量大的聊天机器人 → Flash,图快和便宜。
  • 解析长文档、整份报告 → 带长上下文的 Pro。
  • 代码和多步任务 → Pro。
  • 批量分类、打标 → Flash。
  • 图片输入 → 两条线都支持图片。

怎么接

Gemini 走 OpenAI 兼容协议,不用装 Google 那套单独的库 —— 拿任意 OpenAI SDK 改 base_url 就行。分步骤见快速入门

常见问题

Flash —— 请求多、看重速度和成本时(聊天机器人、分类)。Pro —— 需要最大深度时:复杂代码、解析长文档、推理。
很大 —— 这是这条线一贯的强项,整篇文档都装得下。具体上限看版本,跟 Google 官方一致。
能,模型可以连同文本提示一起接受图片输入。
不需要。端点是 OpenAI 兼容的,普通 OpenAI SDK 就行,Cursor、Cline、n8n、LangChain 也行 —— 不用 google-generativeai 库。
主站价格页。名称跟 Google 官方一致。

接下来

接入与第一个请求

base_url、密钥、Python 和 curl 代码。

Claude 模型

同一个密钥 —— Claude 的选型与能力。

流式输出

让回答逐字打出来。