两条线的区别
| 线 | 擅长 | 速度 / 价格 | 什么时候用 |
|---|---|---|---|
| Gemini Pro | 复杂任务、长文分析、推理 | 更慢、更贵 | 代码、解析大文档、多步任务 |
| Gemini Flash | 大批量下的快速回复 | 更快、更便宜 | 聊天机器人、分类、批处理 |
Gemini 能干什么
- 超长上下文 —— Gemini 一向的强项,整篇大文档能塞进窗口。
- 图片输入 —— 模型可以连同文本一起接受图片。怎么传图见图像输入。
- 函数调用(tool use) —— 模型能返回结构化的工具调用,智能体就建在这上面;完整示例见函数调用。
model 字段填的是 ID,例如快模型用 gemini-3.5-flash。精确 ID、版本和单价见 www.ruapi.ai 的**「价格」**页。名称跟 Google 官方一致,新版本自动进目录。按任务怎么选
- 流量大的聊天机器人 → Flash,图快和便宜。
- 解析长文档、整份报告 → 带长上下文的 Pro。
- 代码和多步任务 → Pro。
- 批量分类、打标 → Flash。
- 图片输入 → 两条线都支持图片。
怎么接
Gemini 走 OpenAI 兼容协议,不用装 Google 那套单独的库 —— 拿任意 OpenAI SDK 改base_url 就行。分步骤见快速入门。
常见问题
Pro 还是 Flash?
Pro 还是 Flash?
Flash —— 请求多、看重速度和成本时(聊天机器人、分类)。Pro —— 需要最大深度时:复杂代码、解析长文档、推理。
Gemini 上下文多大?
Gemini 上下文多大?
很大 —— 这是这条线一贯的强项,整篇文档都装得下。具体上限看版本,跟 Google 官方一致。
Gemini 能看图吗?
Gemini 能看图吗?
能,模型可以连同文本提示一起接受图片输入。
需要 Google 单独的 SDK 吗?
需要 Google 单独的 SDK 吗?
不需要。端点是 OpenAI 兼容的,普通 OpenAI SDK 就行,Cursor、Cline、n8n、LangChain 也行 —— 不用 google-generativeai 库。
精确模型名在哪看?
精确模型名在哪看?
主站价格页。名称跟 Google 官方一致。
接下来
接入与第一个请求
base_url、密钥、Python 和 curl 代码。
Claude 模型
同一个密钥 —— Claude 的选型与能力。
流式输出
让回答逐字打出来。