deepseek-v4-pro 上——界面照旧、改文件照旧、跑命令照旧,价钱却是 DeepSeek 的。折算到真实的一天工作量,大约便宜 25 倍。
原理是这样:RuAPI 收下 Claude Code 发来的 Anthropic 格式请求(/v1/messages),自己转成 DeepSeek 的格式。在 Claude Code 看来,它连的就是普通的 Claude——不需要代理,也不需要路由器。
这是 Claude Code 基础配置 的补充。如果还没装 Claude Code,先去那边;这里只讲换成 DeepSeek 要改的地方。
需要准备
- RuAPI token(
sk-...)且有余额。注册在 www.ruapi.ai,用 USDT 充值见充值。 - 装好的 Claude Code——
claude --version应显示版本号。安装步骤见 Claude Code 页面。
配置
打开~/.claude/settings.json(Windows 是 %USERPROFILE%\.claude\settings.json),写入:
每个字段是干嘛的
每个字段是干嘛的
| 字段 | 含义 |
|---|---|
ANTHROPIC_BASE_URL | RuAPI 入口。结尾不要加 /v1 |
ANTHROPIC_API_KEY | 你的 RuAPI token(sk-...),不是 Anthropic 的 key |
ANTHROPIC_MODEL | 主力模型。活儿基本都靠 deepseek-v4-pro |
ANTHROPIC_SMALL_FAST_MODEL | 处理零碎内部任务的小模型(生成会话标题之类)。deepseek-v4-flash 最省 |
deepseek-v4-pro 和 deepseek-v4-flash。
第一次跑
开一个新终端(让配置生效),进到项目里:deepseek-v4-pro(而不是 Claude),并扣掉相应 token——看这条就知道请求确实走了 DeepSeek。
会是什么体验
- 工具能用。 读写文件、跑命令、全项目搜索——Claude Code 的整个 agent 循环都跑在 DeepSeek 上。
- 流式输出开着,回答边生成边打出来。
- 能看到推理过程。 DeepSeek V4 是带推理的模型,所以回答前 Claude Code 有时会先显示一段思考。这是正常的。
DeepSeek 读不了图。 如果你在 Claude Code 里贴截图,DeepSeek 处理不了——这个系列没有 vision。这类活儿在会话里用
/model claude-sonnet-5 切到带 vision 的模型。什么时候切回 Claude
DeepSeek V4 Pro 几乎什么都能扛,但偶尔要顶格质量。不用退出会话,直接切模型:deepseek-v4-pro。日常挂着 DeepSeek,只在最难的地方或要读图的活儿上把 Claude 顶上来,这样最省心。一把 RuAPI token 通用所有模型,切换不额外收费。
到底省多少
省钱正是这套组合的意义。真实的一天 Claude Code 工作量(4 亿多 token),用 Claude Sonnet 要 $167,换deepseek-v4-pro 大约 $7。逐行拆解见 DeepSeek 还是 Claude:一天的活儿到底花多少钱。
排查问题
401 / Invalid token
401 / Invalid token
ANTHROPIC_API_KEY 得是 RuAPI token(sk-...),不是 Anthropic 的 key(sk-ant-...)。检查复制时有没有带上多余空格,以及这个 token 在控制台 → 令牌 里是否还有效。404 / model not found
404 / model not found
核对拼写:
deepseek-v4-pro 和 deepseek-v4-flash。另外别在 ANTHROPIC_BASE_URL 结尾加 /v1。402 / 余额不足
402 / 余额不足
用 USDT 充值,见充值。DeepSeek 上 token 烧得慢,但带工具的长会话照样会花钱。
图片处理不了
图片处理不了
这是预期的:DeepSeek 没有 vision。用
/model 切到带 vision 的模型——见 Claude 模型。下一步
Claude Code 基础配置
安装、几种配置方式,以及切换供应商。
DeepSeek 还是 Claude:一天多少钱
逐行拆解账单,差 25~30 倍。
DeepSeek API
Pro 与 Flash:区别和能力。
充值
USDT、网络和充值折扣。