跳转到主要内容
比价格,与其看价目表,不如看一张真实账单。下面是 Claude Code 跑一天的用量导出——很普通的一天:一个 agent 读仓库、改文件、跑测试。一天下来 4 亿多 token,账单 $167.24:
计费路径当日 token 数单价费用
输入(命中缓存)395,374,336$0.30 / MTok$118.61
输入(未命中缓存)8,509,057$3.00 / MTok$25.53
输出1,540,240$15.00 / MTok$23.10
合计405,423,633$167.24
有一行值得停下来看看。绝大部分——4.05 亿里有 3.95 亿——都是命中缓存的读取,而不是新输入。Claude 会把重复的上下文缓存起来:系统提示、打开的文件内容、对话历史。读缓存只要 $0.30/百万,而不是 $3.00,便宜十倍。要是没有缓存,这一天大概得花 $1235。所以 $167 已经是打了大折的价,不是原价。 接下来的问题很简单:同样这些 token,换到 DeepSeek 上要多少钱。

同样一天,换成 DeepSeek V4 Pro

还是那三行,只把单价换成 deepseek-v4-pro——这个系列的旗舰,按任务档次最接近 Sonnet:
计费路径当日 token 数单价费用
输入(命中缓存)395,374,336$0.004 / MTok$1.58
输入(未命中缓存)8,509,057$0.435 / MTok$3.70
输出1,540,240$0.87 / MTok$1.34
合计405,423,633$6.62
$167.24 对 $6.62——同样的活儿,便宜 25 倍

同样一天,换成 DeepSeek V4 Flash

deepseek-v4-flash 是这个系列里最便宜的一档,速度也快,量大而简单的活儿一般用它:
计费路径当日 token 数单价费用
输入(命中缓存)395,374,336$0.01 / MTok$3.95
输入(未命中缓存)8,509,057$0.14 / MTok$1.19
输出1,540,240$0.28 / MTok$0.43
合计405,423,633$5.57
这里差得更多——大约 30 倍

一张表看结果

模型一天成本差距
Claude Sonnet$167.24
DeepSeek V4 Pro$6.62便宜约 25 倍
DeepSeek V4 Flash$5.57便宜约 30 倍

差距从哪来

差距来自两处,而且两处都站 DeepSeek 这边。 每 token 单价。 新输入 Sonnet 是 $3.00/百万,Pro 是 $0.435,差不多七分之一。输出 $15.00 对 $0.87,差了十七倍多。输出这块省得最明显:模型答得越长,两边账单拉得越开。 读缓存的单价。 缓存占了这份账单的大头——97.5% 的 token。就算比读缓存,DeepSeek 也更便宜:Pro $0.004/百万,Sonnet $0.30。折到这一天,读缓存 Claude 花了 $118.61,Pro 只花 $1.58。 两头一叠加,同样一批 token,差距就到了 25~30 倍。
价格是这次测算当时的,以后会变。最新的每 token 费率见价格页和 www.ruapi.ai。这里重要的不是具体金额,而是几个模型之间的量级差距。

该选哪个

便宜不等于「永远更好」,看你干什么活。
  • deepseek-v4-pro——日常主力:写代码、重构、推理、agent。质量紧咬顶级模型,价钱却低一大截。如果你现在正用 Claude Code 或类似的 agent,它是第一个可以换上去的。
  • deepseek-v4-flash——走量:分类、打标签、短回复、粗加工。用在价格和速度比极致质量更重要的地方。
  • Claude——需要读图时(DeepSeek 没有 vision),或者最难的任务要顶格质量。一把 RuAPI token 通用,几个模型可以在一个项目里混着用。
DeepSeek 是纯文本模型:图片、图表、截图它都读不了。要 vision 就看 ClaudeGemini 或 GLM-5V。这条线本身的介绍在 DeepSeek API 页。

怎么切过去

如果项目已经在走 RuAPI 的 OpenAI 兼容协议,要改的只有一行——模型 ID。base_url 和 key 都不动:
from openai import OpenAI

client = OpenAI(
    api_key="你的_RUAPI_KEY",
    base_url="https://www.ruapi.ai/v1",
)

resp = client.chat.completions.create(
    model="deepseek-v4-pro",   # 原来是 claude-sonnet-4-6
    messages=[{"role": "user", "content": "重构这个函数,并说明你改了什么"}],
)
print(resp.choices[0].message.content)
从零开始配置——拿 key、用 Python 和 curl 发第一个请求——见快速入门

下一步

DeepSeek API

Pro 与 Flash:区别和能力。

Claude 模型

系列、版本,以及什么时候值得用 Claude。

计费方式

按 token 实际用量计费,每次请求都有日志。

快速入门

base_url、key 和第一个请求。