Claude 设计、DeepSeek 干活、Codex 审查:AI 编程成本砍到 1/100
DeepSeekV4 + Claude Code = 100X Cheaper
本报告由 AI 深度分析生成,基于视频完整字幕。
导读
如果你长期用 Claude Code 写东西,多半早就被账单吓到过——一次稍长的 Opus 4.7 会话能花掉 60 多美金,单月几百块的开销不是新闻。开源模型一直在追,但「便宜但不能用」是过去两年的常态。
Jack Roberts 是一位独立开发者兼内容创作者。他的上一家科技初创积累了 6 万多名客户,被卖掉之后他转向 AI 创业,频道里的核心受众是「想用 Claude Code 真正交付东西、但又心疼成本」的 solo dev。他不是只看 Benchmark 跑分的人——视频里他自己讲:「She looks great on the Tinder profile, but how does Deep Seek actually show up when we take it on a date?」(她在交友档案上看着挺好,但真约出去吃饭的时候表现如何?)
这期视频要演示的是 2026 年 4 月底刚发布的 DeepSeek V4——1.6 万亿参数、100 万 token 上下文、MIT 开源权重——加上一个开源代理仓库,把它「插」进 Claude Code 的 harness(脚手架)里。Claude Opus 4.7 一个会话 $62.50,同等任务 DeepSeek V4 Flash 一个 4 小时会话只要 $0.20——Jack 算的是 312 倍便宜,标题向上取整成 100 倍。
但视频真正值得读的不是「换个便宜模型」这件事,而是 Jack 给出的多模型分工心法:Claude 守住设计与品味的高地、DeepSeek 接管所有非视觉的"脏活累活"、ChatGPT Plus 里的 Codex 做免费 code review。这才是降本 100 倍的真正配方——不是替换,是编排。
一句话核心论点:用单一最强模型干全部活,是 2025 年的老办法;2026 年的新算法是把任务拆成「设计 / 实现 / 审查」三段,每段配最便宜又够用的模型,然后用 dual terminal 把它们并排串起来。
核心观点速览
-
100 倍降本的秘密不是换模型,是分工编排:Claude 守住「需要审美和创意」的活(UI/UX、品牌一致性、多文件重构),DeepSeek 接管「不需要审美的脏活累活」(算法、自动化脚本、单元测试、后端实现),Codex(用现成的 ChatGPT Plus 订阅)做 code review——三段流水线把成本结构压扁。
-
DeepSeek V4 的关键卖点不是参数大,是 tool calling 兼容:1.6 万亿参数和 100 万上下文是噱头,真正让它能"接管 Claude Code"的是 MIT 开源权重 + 兼容 Anthropic 的工具调用协议——意味着 Claude Code 的 skills 系统、SubAgents、MCP Atlas 等全套生态都能继续用,只是底层换了发动机。
-
"双终端"工作流(dual terminal)是关键操作模式:一个终端里跑 DeepSeek 接管的 Claude Code、另一个终端跑真正的 Claude、再开第三个终端跑免费模型——让你按任务实时切换底层模型,而不是事先选好一个用到底。
-
不要走 OpenRouter,要直连 DeepSeek 平台:OpenRouter 这种聚合 API 在 DeepSeek 上限流极重,"basically unusable"(基本上不能用)。直接去
platform.deepseek.com充 2-5 美金,用 API key 接进开源代理——这是 Jack 反复强调的避坑点。 -
DeepSeek 的两条红线:① 数据流经中国服务器,绝不能粘贴 API keys、URL、敏感代码——chat 框是 sacred;② UI 设计能力差,"like in crayons in the corner thinking about things"(像拿着蜡笔在角落里发呆),只能在已有的设计框架内做填充,不能让它从零做视觉。
-
真正的降本判断标准是任务的"创意密度",不是任务的难度:困难的算法题、多文件重构这类「难但不需要审美」的活,DeepSeek 做得又快又好;简单的 landing page 设计、品牌色调整这类「不难但需要品味」的活,反而要留给 Claude——便宜模型并不是只能干简单的活,关键看活有没有审美属性。
主体
一、降本 100 倍的真正算法:从「单模型干全活」到「多模型分工」
很多人理解 DeepSeek + Claude Code 的组合是「拿便宜的替换贵的」,这是错的。Jack 的核心方法论是把开发任务拆成三段,每段配不同模型,三模型并排跑——这才是 100 倍降本的真正来源。
他给出的分工表是这样的:
| 任务类型 | 用什么模型 | 原因 |
|---|---|---|
| 创意性视觉设计、UI/UX 打磨、品牌一致性 | Claude(设计王 / design king) | 视觉审美和创意密度只有 Claude 能稳定输出 |
| 多文件重构、文档撰写 | Claude | 长上下文一致性 + 命名品味 |
| 算法问题、自动化、快速脚本 | DeepSeek | 不需要审美,要的是正确性 |
| 单元测试、后端实现、API 接入 | DeepSeek | "幕后的脏活累活"(dirty work behind the scenes) |
| Code review 与审计 | Codex (GPT 5.5) | 用现成的 ChatGPT Plus 订阅,等于免费 |
这个分工表的关键洞察在于反直觉的一点:很多人以为便宜模型只能干简单的活,但 Jack 说反了——便宜模型可以干非常困难的活,只要这些活不涉及审美。一个 1000 行的算法实现、一个复杂的爬虫架构、一个数据迁移脚本,DeepSeek V4 完全胜任,因为这类任务的好坏可以被自动化测试客观验证;反过来,一个看起来简单的"调整 hero section 的留白和字号",反而要 Claude 来做,因为它的好坏靠的是审美直觉。
核心洞察:判断该不该用便宜模型,看的不是任务难度,是任务有没有审美属性——这个判断维度比"难/易"更准确。
为什么这样能降本 100 倍?因为大多数项目里,真正需要审美判断的任务只占 10-20%,剩下 80% 都是后端实现、算法、脚本、测试这类纯工程活。如果把这 80% 全部从 Claude Opus 4.7($62.50/会话)切到 DeepSeek V4 Flash($0.20/4 小时会话),数学上就是 312 倍降本,向上取整就是视频标题里的"100X cheaper"。
二、DeepSeek V4 为什么能"接管"Claude Code:兼容性比性能更重要
DeepSeek V4 的纸面规格很唬人:
- 1.6 万亿参数——但 Jack 直接说:"Not something you can probably run on your own computer, put it that way."(不是你电脑能跑得动的,就这么说吧。)这个参数量需要云端推理,本地部署不现实。
- 100 万 token 上下文窗口——足够装下一个中型代码库。
- MIT 开源权重——这是关键,意味着无任何商用限制。
但 Jack 强调的真正卖点不是规格,而是工具调用(tool calling)兼容性。原话:"One of the biggest benefits of DeepSeek is its tool calling ability. So all the tool calling we do on Anthropic, we can now do on DeepSeek."(DeepSeek 最大的优势之一是它的工具调用能力。所有我们在 Anthropic 上做的工具调用,现在可以在 DeepSeek 上做。)
为什么这件事这么重要? 因为 Claude Code 不是一个聊天框,它是一整套围绕 Anthropic API 协议建立的生态:
- Skills 系统——用户自定义的能力扩展
- SubAgents——并发子任务调度
- MCP(Model Context Protocol) ——外部工具集成
- Hooks——事件钩子
这些全部依赖一种特定的"模型如何调用外部工具"的协议。如果一个新模型不能 1:1 兼容这个协议,你就只能拿它当聊天模型用,所有围绕 Claude Code 建立的工作流全部作废。DeepSeek V4 的核心价值在于它把这套协议复刻得足够好,让 Claude Code 的整个 harness 可以无缝跑在它上面——这才是「100 倍降本」能成立的技术前提。
Benchmark 验证:Jack 提到 DeepSeek V4 在 SWE-bench verified、Terminal Bench、MCP Atlas 三个基准上和 Sonnet 4.6、Opus 4.7 做了对比,整体表现"hitting benchmarks and baseline performance is good"(达到基准、底线性能不错)。但他立刻提醒:"We don't want just to be a benchmark queen. We want it to actually work in practice."(我们不想只是个基准跑分大姐,我们想要它真在实战里有用。)
这是 2026 年所有模型对比的标准免责声明:纸面跑分和实战表现的相关度越来越低,因为大量模型在 SWE-bench 上专门做了 RL 微调,跑分高不代表真能写出能用的代码。
三、双终端工作流:技术架构与安装步骤
整个方案的技术核心是一个 GitHub 上正在快速涨星的开源项目(Jack 在视频里没念全名,从他演示的步骤看是一个 代理服务器(proxy server) )。它的工作原理是:
Claude Code (你的本地命令行)
↓ 发出 Anthropic API 请求
代理服务器(拦截)
↓ 翻译成 DeepSeek 协议
platform.deepseek.com
↓ 返回 DeepSeek 响应
代理服务器(翻译回 Anthropic 格式)
↑
Claude Code (拿到响应,以为是 Claude 在回复)
Jack 原话:"It's a proxy server that intercepts cloud API which enables us to have these multi conversations. Then we just provide our DeepSeek API key."(这是个代理服务器,拦截 Claude API 调用,让我们可以做多模型对话。然后我们只要提供 DeepSeek 的 API key 就行。)
这个设计的精妙之处在于对 Claude Code 完全透明——本地的 claude 命令行不知道自己其实在和 DeepSeek 对话,所有 skills、tool calling、subagents 全部继续工作。这就是为什么不需要任何代码改动就能切换底层模型。
完整安装步骤(按 Jack 演示顺序):
- 去
platform.deepseek.com注册账号,不要用 OpenRouter(限流严重) - 充 2-5 美金(够跑很久)
- 在左侧 API Keys 创建一把 key 并复制
- 打开 Antigravity(Jack 用的 IDE)或任意 AI IDE
- 让 AI 帮你 clone 那个开源代理 repo(输入"hey, clone this repo"+ 链接)
- 让 AI 配置 DeepSeek API key
- 让 AI 创建两个 shortcut:
ds——普通模式启动 DeepSeekds-yolo——dangerously skip permissions模式(不会弹权限确认,慎用)
- 在终端里
ds→ 启动接入 DeepSeek 的 Claude code - 新开一个终端
claude→ 同时启动真正的 Claude Code
第 9 步就是「双终端」的关键——你现在有两个并排的 Claude Code 实例,一个用 DeepSeek、一个用真正的 Claude,** 可以根据当前任务的"创意密度"实时切换窗口**。Jack 演示了第三个终端跑免费模型的玩法(用 OpenRouter 免费模型轮询),最多可以三窗口同时操作。
一个有趣的小坑:你在 DeepSeek 终端里问"who are you",模型会回答"I'm Claude Sonnet 4.6"——这是因为代理服务器在 system prompt 里嵌入了 Claude 的身份信息让 harness 正常工作,不是真的模型搞错了。Jack 说:"That's because they're reading the data that sits in it. That's not the actual model."(那是因为它在读 prompt 里塞进去的数据,不是真正的模型。)
四、实战拆解:Apple 风格咖啡网站演示
视频后半段 Jack 真的造了一个网站演示分工流程。这一段最值得看,因为它把抽象的「分工方法论」落到了具体的项目流上。
项目目标:做一个 Apple 设计风格的咖啡品牌网站,带一个「咖啡因 ROI 计算器」。
Jack 的工具准备:
- GitHub repo
awesome-design-systems:开源项目,收录了 BMW、Apple、Nike 等大公司的完整设计系统(颜色、字体、组件、动效规范)。让 AI 引用这个 repo 就能拿到品牌一致性参考。 - shadcn-ui 类组件库 repo(10 万星):拿来做 React 组件基础。
执行流程:
[Claude 终端]
↓
"用 awesome-design-systems 里的 Apple 设计语言,
帮我做一个咖啡网站,调用 [组件库] 里的 UI 组件"
↓
Claude 出第一版网站(视觉、信息架构、整体感)
↓
[切到 DeepSeek 终端]
↓
"在这个网站上加一个复杂的 ROI 计算器,
输入:咖啡因摄入、生产力倍数等多变量
让它'as sophisticated and intelligent as humanly possible'"
↓
DeepSeek 出计算器(算法、状态管理、表单逻辑)
Jack 自己也意外的结果:DeepSeek 不仅算法做得好,居然把 HTML 风格也复刻得相当准确。原话:
"Now guys, check this out. Now I'll be honest, this is surprising to me. It's actually managed, if you look at this, to capture the exact HTML style. This is a cool thing. DeepSeek by itself, if I asked it to do this, would struggle. It'd probably be in crayons in the corner thinking about things. But because I've got an existing brand guidelines and style, it's just replicated." (兄弟们看这个。说实话,这让我有点意外。它居然,你看,把精确的 HTML 风格捕捉到了。这点挺酷。DeepSeek 自己单独做的话会很挣扎,大概率拿着蜡笔在角落里思考。但因为我已经有了既有的品牌指南和风格,它就直接复刻了。)
关键洞察:DeepSeek 不擅长"从零创造视觉",但擅长"在已有视觉框架里填充"。这意味着工作流的最佳模式是:
- Claude 先建框架——做出第一版能看的设计(颜色、字号、布局、组件库选择)
- DeepSeek 后续填充——所有"在框架内增加新页面、新组件、新功能"的活,DeepSeek 都能保持一致性
这是个很实用的避坑指南:不要让便宜模型从空白画布开始,要让它在已有的画布上加东西。
额外小 hack:Jack 提到一个偷设计的方法——找到任何你喜欢的网站 → Google "HTML website extractor" → 把 URL 丢进去 → 下载源码 → 喂给 AI 当设计参考。这是绕开「让 AI 凭空想象设计」的最便宜路径。
五、DeepSeek 的红线与避坑:什么时候千万别用
Jack 在视频后段花了不少时间讲限制——这部分比降本演示更值得记。
红线一:数据隐私(最严重)
DeepSeek 的服务器在中国,所有 prompt 和数据都会经过中国境内。Jack 用很重的措辞:
"If you do not want to paste naked URLs, API keys into DeepSeek, that is a big big big no no. So never do that. Don't post anything in here that you wouldn't be okay with popping up on internet." (如果你不想把裸 URL、API key 粘到 DeepSeek 里——那是个特别特别特别大的禁区。绝对不要做。任何你不希望出现在互联网上的东西,都不要发到 chat 里。)
实操层面这意味着什么:
- 写代码时,DeepSeek 看到的代码片段不能包含真实的 API key、数据库连接字符串、客户数据
- 调试时不能把生产环境的 log 直接贴进去
- 处理公司专有 IP(核心算法、专利相关代码)时不要用
- chat 框是 sacred——这是 Jack 的原话,任何敏感内容都视同公开
这个红线和 OpenAI / Anthropic 的等级不在一个维度——OpenAI/Anthropic 至少签了企业数据处理协议、有 SOC2 认证;DeepSeek 没有等价的保障。
红线二:UI 审美能力差
"It is not great at UI. The one caveat I found is if it's already within an existing UI framework, like you saw, I thought that did really well personally. So I think it's good for adding additional things within frameworks, but don't use it as your first design artist. It's no kind of Michelangelo if you like." (它在 UI 上不行。我发现一个例外是如果它在已有的 UI 框架里——你看到的那段,我个人觉得做得不错。所以它适合在框架里"加东西",但不要让它当你的第一设计师。它不是米开朗琪罗。)
实操规则:DeepSeek 永远不做"第一笔设计"。框架由 Claude 出,DeepSeek 只在框架内填充。
红线三:内容审查
"What about Tiananmen Square? What if I want to talk about Tiananmen Square? Well, if you want to talk about that, don't use DeepSeek." (想聊天安门怎么办?嗯,要聊那个就别用 DeepSeek。)
Jack 的语气是半开玩笑,但点出来一个现实:DeepSeek 对中国政治议题、特定历史事件有训练层的过滤。如果你的产品涉及全球新闻、政治评论、历史教育这类内容,输出会突然在某些 topic 上变得诡异——最好别用。
红线四:促销期限制
视频拍摄时(2026-04 末),DeepSeek 在搞促销,价格更便宜。5 月 5 日之后促销结束,价格回到"仍然显著便宜但没有 100 倍那么夸张"的水平——所以"100X cheaper"这个数字本身有时效性。Jack 自己也提了:"Instead of getting 100 times cheaper, it might be slightly less than that."
六、谁应该用、谁不应该用:场景白名单
Jack 给了一个非常清晰的场景判断表:
❌ 不要用 DeepSeek 的场景:
- 企业开发——公司有自己的数据库、合规要求
- 医疗、金融行业——高度受监管,数据离境会触发合规问题
- 核心 IP 项目——你那个"准备改变世界的算法",别送出去
- 客户敏感数据处理——任何 PII(个人可识别信息)相关的代码
✅ 适合用 DeepSeek 的场景:
- Solo 开发者——一个人维护项目,没有合规压力
- 学习 Claude Code 工作流——便宜,可以无脑试
- 开源项目开发——代码本来就要公开
- 原型 / 硬件抛弃式脚本("prototyping hardware throw scripts")——一次性的、不上生产的
- 个人副业 / Side project——成本敏感、不涉及高价值数据
判断方法:问自己一个问题——「如果我这段代码 / 这段对话被截屏发到 X / Reddit 上,我会不会出问题? 」会就别用 DeepSeek。
行动启示:怎么把这套方法落地到自己的工作流
如果你现在正在用 Claude Code 干活,下面是把这期视频变成实际行动的最小路径:
Step 1(10 分钟):准备工具
- 去
platform.deepseek.com注册账号,充 5 美金(够你跑一两个月) - 拿到 API key
Step 2(15 分钟):装代理
- 找 Jack 提到的那个开源代理 repo(视频里没给完整名,搜 "claude code deepseek proxy" 应该能找到)
- 让 Claude Code 自己 clone + 配置("clone this repo and set up DeepSeek with my key: xxx")
- 创建
ds和ds-yolo两个快捷命令
Step 3(5 分钟):建立分工心智模型
把这九个字打印出来贴在显示器上:
Claude 设计、DeepSeek 干活、Codex 审查
每次开任务前,问自己一个问题:「这个任务有没有审美属性?」
- 有审美 → Claude
- 没审美 → DeepSeek
- 写完了 → 切 Codex 审查
Step 4(持续):监控成本变化
- 每周看一次 Claude 控制台的 spend
- 切换前的基线是多少?切换后降到多少?
- 如果没降到 1/5 以上,说明你的任务里"审美属性"占比比想象高,重新审视分工
最值得记住的元洞察:2025 年 AI 编程的成本结构是「贵在没必要贵的地方」。Claude 是个万能选手但定价对应的是它最难的能力(创意、审美、复杂推理);当你拿它做单元测试、后端实现、批量数据处理这种「不需要审美」的活,** 你在为它的贵能力付费,但用的是它的便宜能力**——这是结构性浪费。
DeepSeek + Claude Code 的方案本质是把这种结构性浪费消除掉,让每个任务只为"它真正需要的能力"付费。100 倍降本只是结果,真正的认知升级是「为按需付费的 AI 编排能力」这件事的觉醒。
附录
金句收录
"Now guys, check this out. Now I'll be honest, this is surprising to me. It's actually managed, if you look at this, to capture the exact HTML style." 兄弟们看这个。说实话,这让我有点意外。它居然把精确的 HTML 风格捕捉到了。 ——Jack 看到 DeepSeek 复刻品牌设计后的反应
"DeepSeek by itself, if I asked it to do this, would struggle. It'd probably be in crayons in the corner thinking about things." DeepSeek 单独做这个会很挣扎,大概率拿着蜡笔在角落里发呆。 ——对 DeepSeek 视觉能力的精准比喻
"She looks great on the Tinder profile, but how does Deep Seek actually show up when we take it on a date?" 她在交友档案上看着挺好,但真约出去吃饭的时候表现如何? ——对纯看 benchmark 评判模型的讽刺
"We don't want just to be a benchmark queen. We want it to actually work in practice." 我们不想只是个基准跑分大姐,我们想要它真在实战里有用。 ——2026 年所有模型评测的标准免责声明
"If you do not want to paste naked URLs, API keys into DeepSeek, that is a big big big no no. So never do that. Don't post anything in here that you wouldn't be okay with popping up on internet." 如果你不想把裸 URL、API key 粘到 DeepSeek 里——那是个特别特别特别大的禁区。绝对不要做。任何你不希望出现在互联网上的东西,都不要发到 chat 里。 ——DeepSeek 的核心红线
"Don't use it as your first design artist. It's no kind of Michelangelo if you like." 不要让它当你的第一设计师。它不是米开朗琪罗。 ——对 DeepSeek 视觉能力的清晰定位
"Free is not free because actually the quality is less, you get charged more." 免费不是真的免费,因为质量更差,你最后被收费更多。 ——为什么不要走 OpenRouter 的免费模型路径
"Claude for the hard stuff and then tag in obviously ChatGPT to do the reviews." Claude 干硬活,然后明显地 tag in ChatGPT 做审查。 ——三模型分工 pipeline 的最简表述
术语表
- harness(脚手架):围绕一个 AI 模型建立的工程化框架,包括 CLI、skills、tool calling、subagents 等。Claude Code 就是 Anthropic 的官方 harness。
- tool calling(工具调用):模型通过特定协议调用外部函数/工具的能力。Claude 和 DeepSeek 现在用的是同一套协议规范。
- MCP(Model Context Protocol) :Anthropic 推动的标准化外部工具接入协议。
- skills:Claude Code 用户可定义的可复用技能模块(例如视频里 Jack 用的
bit.ly短链 skill)。 - proxy server(代理服务器):拦截一种协议的请求并翻译成另一种协议——本视频核心组件。
- dangerously skip permissions(危险跳权限模式):Claude Code 一种模式,跳过所有工具执行确认,速度快但有风险。
- Antigravity:一个 AI-first 的 IDE,Jack 在视频里用它做演示环境。
- awesome-design-systems:GitHub 开源项目,收录主流公司的完整设计系统规范。
- ROI 计算器:return on investment,演示项目里的具体功能(咖啡因摄入与生产力的换算)。
时间线索引
[00:00]引子:100 倍降本的承诺,Jack 自我介绍[01:30]DeepSeek V4 规格:1.6 万亿参数 / 100 万上下文 / MIT 开源[01:45]价格对比:Claude Opus 4.7 一会话 $62.50 vs DeepSeek V4 Flash 4 小时 $0.20[02:30]Benchmark 对比:SWE-bench、Terminal Bench、MCP Atlas 与 Sonnet/Opus 对照[03:00]"benchmark queen" 讽刺:跑分高 ≠ 实战好用[03:15]双终端架构介绍[03:30]接入流程开始:注册 platform.deepseek.com[04:30]不要走 OpenRouter(限流严重)[05:00]让 AI clone 开源代理 repo + 配置 API key[05:30]创建ds和ds-yoloshortcut[06:00]测试:DeepSeek 终端 + Claude 终端并排运行[06:30]模型自我认知 trick:DeepSeek 自称 "Claude Sonnet 4.6" 的解释[06:45]Skills 兼容性测试(bit.ly 缩短 URL)[07:30]"Claude Code is only as good as its ability to use skills" 论点[08:00]任务分工框架登场:Claude 设计 / DeepSeek 苦力 / Codex 审查[09:20]Design strategy 章节开始[09:30]介绍 awesome-design-systems repo(BMW、Apple 等品牌设计语言)[10:30]DeepSeek 的隐私红线:不要粘 naked URLs / API keys[11:30]实战开始:Apple 风格咖啡网站设计[12:30]New Website 章节[12:45]HTML extractor 偷设计 hack[13:00]DeepSeek 加 ROI 计算器演示[13:30]关键发现:DeepSeek 居然能复刻 HTML 风格(在已有框架内)[14:30]OpenRouter 免费模型方案备选[15:00]Codex(GPT 5.5)做 code review 流程[15:30]完整 pipeline 总结:Claude 设计 + DeepSeek 实现 + Codex 审查[15:40]Important to Know 章节[16:00]UI 审美能力差的限制[16:30]适用场景白名单:solo dev / 学习 / 开源 / 原型[16:45]不适用场景:企业 / 医疗金融 / 核心 IP[16:50]收尾:成本下来了,下一步是用 super skills 提升性能
评论
还没有评论,来第一个留言吧 ✨