| 计费路径 | 当日 token 数 | 单价 | 费用 |
|---|---|---|---|
| 输入(命中缓存) | 395,374,336 | $0.30 / MTok | $118.61 |
| 输入(未命中缓存) | 8,509,057 | $3.00 / MTok | $25.53 |
| 输出 | 1,540,240 | $15.00 / MTok | $23.10 |
| 合计 | 405,423,633 | — | $167.24 |
同样一天,换成 DeepSeek V4 Pro
还是那三行,只把单价换成deepseek-v4-pro——这个系列的旗舰,按任务档次最接近 Sonnet:
| 计费路径 | 当日 token 数 | 单价 | 费用 |
|---|---|---|---|
| 输入(命中缓存) | 395,374,336 | $0.004 / MTok | $1.58 |
| 输入(未命中缓存) | 8,509,057 | $0.435 / MTok | $3.70 |
| 输出 | 1,540,240 | $0.87 / MTok | $1.34 |
| 合计 | 405,423,633 | — | $6.62 |
同样一天,换成 DeepSeek V4 Flash
deepseek-v4-flash 是这个系列里最便宜的一档,速度也快,量大而简单的活儿一般用它:
| 计费路径 | 当日 token 数 | 单价 | 费用 |
|---|---|---|---|
| 输入(命中缓存) | 395,374,336 | $0.01 / MTok | $3.95 |
| 输入(未命中缓存) | 8,509,057 | $0.14 / MTok | $1.19 |
| 输出 | 1,540,240 | $0.28 / MTok | $0.43 |
| 合计 | 405,423,633 | — | $5.57 |
一张表看结果
| 模型 | 一天成本 | 差距 |
|---|---|---|
| Claude Sonnet | $167.24 | — |
| DeepSeek V4 Pro | $6.62 | 便宜约 25 倍 |
| DeepSeek V4 Flash | $5.57 | 便宜约 30 倍 |
差距从哪来
差距来自两处,而且两处都站 DeepSeek 这边。 每 token 单价。 新输入 Sonnet 是 $3.00/百万,Pro 是 $0.435,差不多七分之一。输出 $15.00 对 $0.87,差了十七倍多。输出这块省得最明显:模型答得越长,两边账单拉得越开。 读缓存的单价。 缓存占了这份账单的大头——97.5% 的 token。就算比读缓存,DeepSeek 也更便宜:Pro $0.004/百万,Sonnet $0.30。折到这一天,读缓存 Claude 花了 $118.61,Pro 只花 $1.58。 两头一叠加,同样一批 token,差距就到了 25~30 倍。价格是这次测算当时的,以后会变。最新的每 token 费率见价格页和 www.ruapi.ai。这里重要的不是具体金额,而是几个模型之间的量级差距。
该选哪个
便宜不等于「永远更好」,看你干什么活。deepseek-v4-pro——日常主力:写代码、重构、推理、agent。质量紧咬顶级模型,价钱却低一大截。如果你现在正用 Claude Code 或类似的 agent,它是第一个可以换上去的。deepseek-v4-flash——走量:分类、打标签、短回复、粗加工。用在价格和速度比极致质量更重要的地方。- Claude——需要读图时(DeepSeek 没有 vision),或者最难的任务要顶格质量。一把 RuAPI token 通用,几个模型可以在一个项目里混着用。
DeepSeek 是纯文本模型:图片、图表、截图它都读不了。要 vision 就看 Claude、Gemini 或 GLM-5V。这条线本身的介绍在 DeepSeek API 页。
怎么切过去
如果项目已经在走 RuAPI 的 OpenAI 兼容协议,要改的只有一行——模型 ID。base_url 和 key 都不动:
下一步
DeepSeek API
Pro 与 Flash:区别和能力。
Claude 模型
系列、版本,以及什么时候值得用 Claude。
计费方式
按 token 实际用量计费,每次请求都有日志。
快速入门
base_url、key 和第一个请求。