GStack：YC掌门人的AI工程团队实战手册

How to Make Claude Code Your AI Engineering Team

来源Y Combinator × 无（独立演讲+现场演示）视频时长约21分钟报告字数3,227字阅读时间7min原始链接https://www.youtube.com/watch?v=wkv2ifxPpF8

本报告由 AI 深度分析生成，基于视频完整字幕。

📺 原视频约21分钟📖 本报告 3,227字⏱ 预计阅读 7min

导读

Garry Tan 不是一个普通的 AI 爱好者在推销工具——他是 Y Combinator 的掌门人，一个在 Palantir 做过第10号员工、联合创办过被 Twitter 收购的 Posterous、亲手写过 YC 内部社交平台 Bookface 的老兵级工程师。当这样一个人说"我过去两个月写的代码比2013年全年还多"的时候，你应该认真听。

他构建了一个叫 GStack 的开源项目，三周内 GitHub 星标数超过了 Ruby on Rails，现在已超过70,000颗星。GStack 的核心理念非常简单：不要给 AI 搭复杂的脚手架，而是给它装上轻薄的技能包（thin harness, fat skills）。把 Claude Code 从一个聪明但散漫的助手，变成一支有角色、有流程、有评审的 AI 工程团队。

这段视频是一次完整的实战演示：从创业想法的 Office Hours 评估，到设计方案的多版本生成，再到自动化对抗性审查——Garry Tan 用一个"税务1099文件查找器"的案例，展示了他如何用 GStack 日产10-50个 PR。

阅读提示： 原视频约21分钟，本报告约4500字，阅读约12分钟。

一、从个人痛点到产品哲学：为什么需要 GStack？

Garry Tan 开场就抛出了一个震撼的对比：他过去两个月写的代码比2013年全年还多——而2013年是他最后一次全职做工程师。更具体地说，他用 AI 基本重建了整个 Posterous，这个当年需要一个联合创始人、10个工程师、1000万美元和两年时间才能完成的产品。

但这种爆发式的产出不是凭空来的。他发现了 AI 编程的核心矛盾：

"Out of the box, the model wanders. It doesn't know your data well. So, it guesses. And guessing at that scale is how you get plausible looking code that silently breaks."（开箱即用的模型会跑偏。它不了解你的数据，所以就猜。而大规模的猜测，就是你得到那些看起来合理但悄悄出错的代码的原因。）

瓶颈不在模型的智力，而在于如何正确地设置它。 Garry Tan 的解决方案是"thin harness, fat skills"（轻薄框架，厚重技能）——不要搭建复杂的中间层，而是给模型配备一组专业化的技能包，让它像一个有分工的团队一样运作。

二、Office Hours：把YC的创业评估能力装进AI

GStack 最核心的技能之一叫 "Office Hours"（办公时间），直接模拟了 YC 合伙人与创业者进行创业辅导的真实过程。Garry Tan 用一个税务应用的想法做了现场演示。

他输入了一个简单的想法："帮人从 Gmail 和金融机构中找到所有的1099税表"。AI 没有直接开始写代码，而是像一个 YC 合伙人一样开始追问：

"What's the strongest evidence that someone actually wants this?"（你有什么最强有力的证据证明有人真的需要这个？）——这是 YC 评估创业想法的第一个关键问题。
竞品分析：AI 主动指出 TurboTax 和 H&R Block 已经有1099导入功能，Plaid 可以连接银行——为什么这些没有解决你的问题？
商业模式重构：AI 发现了一个更有价值的方向——不只是文档聚合（可能只值2-5美元/年），而是作为一个"楔子策略"（wedge strategy），通过税务文档收集切入 CPA 市场匹配，后者的交易抽成可能是前者的10倍。

最有意思的是人机互动的动态。 Garry Tan 在 AI 提出三个方案（纯 Gmail 搜索/全栈自动化/CPA 优先）后，不仅选择了方案B，还主动提出了一个 AI 没想到的思路：用浏览器自动化完全跳过 Google OAuth，让用户直接在自己的浏览器里操作 Gmail，AI 在旁边导航和下载文档。

"It's not this sort of on rails thing. It's more like a conversation with your model."（这不是那种固定套路的东西。更像是和你的模型进行一次对话。）

这正是 GStack 与普通 AI 工具的根本区别：它不替你做决定，而是帮你想清楚问题。

三、Design Shotgun：60秒生成多版本设计

通过 Office Hours 确定方向后，Garry Tan 演示了另一个技能——"Design Shotgun"（设计霰弹枪）。

这个工具的工作方式很有意思：它会自动识别应用需要的所有页面，让你选一个来设计，然后同时生成三个完全不同方向的设计方案。在演示中，60秒内就产出了三个版本：

Option A "Command Center"：深色主题，仪表盘风格，适合 Linux 黑客
Option B "Friendly Progress"：卡片式布局，进度环，适合普通用户
Option C "Split View"：分屏视图，过于复杂

Garry Tan 的评价很直接：A 是4分，B 是5分，C "makes it way more complicated than it needs to"（比需要的复杂太多了）。选择 B，继续推进。

这个流程的价值在于速度和选择。 传统设计流程中，你可能需要一个设计师花几天出三个方案。这里 AI 用一分钟完成了同样的事，而且设计方案是基于前面 Office Hours 讨论的产品逻辑自动生成的，不是随机的。

四、对抗性审查：AI 自己给自己挑刺

GStack 有一个特别值得注意的环节：多步骤对抗性审查（multi-step adversarial review）。

在设计文档完成后，AI 会自动对自己的产出进行严格审查，找出问题：

没有失败处理逻辑
缺少隐私条款
双因素认证（2FA）交接没有提出解决方案

然后 AI 会尝试自动修复这些问题。在演示中，它经过两轮审查，自动发现并修复了16个问题，设计文档的评分从6/10提升到了8/10，剩余3个问题标记为后续处理。

这个机制的重要性在于：它把"质量保障"从事后检查变成了流程内置环节。 人类工程师最容易犯的错误就是"觉得做完了就不想再看了"，而 GStack 把审查变成了自动化步骤。

五、浏览器自动化：QA 瓶颈的破解

Garry Tan 分享了他在使用 AI 编程过程中遇到的一个关键瓶颈：当 AI 完成了规划、设计和编码后，他发现自己变成了 QA 测试员——"probably the least fun part of software development"（可能是软件开发中最无聊的部分）。

他的解决方案是把 Playwright 和 Chromium 封装成了 CLI 工具，集成进 GStack：

"Chrome MCP is one of the worst pieces of software I've ever used."（Chrome MCP 是我用过的最差的软件之一。）

问题包括：每次操作都要反复思考、上下文膨胀严重、经常什么都不做但花2-3秒。于是他创建了 /qa 和 /browse 工具，让 Claude Code 可以直接操控浏览器——截图、点击、填表、下载媒体、运行回归测试、检查 CSS/JavaScript 问题。

这个决策背后的思考很深： 当 AI 帮你做了 80% 的工作，剩下的 20%（QA 和测试）就成了新的瓶颈。解决方案不是"忍受"，而是继续自动化，直到整个流程闭环。

六、Level 7 软件工厂：日产50个PR的工作方式

Garry Tan 用一个"软件工厂等级"的概念来描述他的目标。他坦率地说 GStack 没有达到 Level 8（完全自主），但达到了 Level 7——这意味着什么？

他同时运行10-15个并行的 Claude Code 会话。 有时在同一个项目上同时开3-4个窗口，每个做不同的功能分支，最终近乎同时合并。他的日常工作流程变成了：

看到一个想法/bug/用户反馈 → 开一个新 worktree
运行 Office Hours → CEO Review → 对抗性审查 → 正常开发流程
准备好了就合并，一天可以处理10-50个 PR

"I don't have a to-do list anymore."（我不再有待办清单了。）

他用一个很形象的比喻来描述 Claude 和 Codex 的分工：

"Opus 4.6 is sort of ADHD CEO. He's the guy you want to get a beer with and he's got a billion ideas, but when the going gets tough, you got to call in your autistic CTO and that's Codex."（Opus 4.6 是那种多动症CEO，你会想跟他喝杯啤酒，他有十亿个想法，但事情变难的时候，你得叫你那个自闭症CTO出来——那就是 Codex。）

这个比喻虽然有些冒犯，但准确地描述了两种模型的特点：一个擅长发散和创意，一个擅长专注和执行。

七、安全焦虑与供应链攻击

在谈到开源项目管理时，Garry Tan 提到了一个重要的安全问题：AI 编程时代的供应链攻击。

他目前有400多个待审查的 PR，作为一个拥有数万星标的开源项目维护者，他对恶意代码注入极度警惕。GStack 自身就内置了安全审查机制，帮助他在合并外部贡献时进行筛查。

这是一个很少有人提到但极其重要的问题：当 AI 让写代码变得极其容易，攻击者提交恶意 PR 的成本也同样降低了。

金句收录

"We are in a completely new era of building software, the agent era." （我们正处于软件构建的全新时代——Agent 时代。）
"The bottleneck here is not the model's intelligence... they are already smart enough to do extraordinary work." （瓶颈不在模型的智力......它们已经足够聪明来做出非凡的工作。）
"Out of the box, the model wanders. It doesn't know your data well. So, it guesses." （开箱即用的模型会跑偏。它不了解你的数据，所以就猜。）
"It's not this sort of on rails thing. It's more like a conversation with your model." （这不是那种固定套路的东西。更像是和你的模型进行一次对话。）
"Opus 4.6 is sort of ADHD CEO... when the going gets tough, you got to call in your autistic CTO and that's Codex." （Opus 4.6 是那种多动症CEO......事情变难的时候，你得叫你的自闭症CTO出来——那就是 Codex。）
"I don't have a to-do list anymore." （我不再有待办清单了。）
"The barrier to building just collapsed. The only question left is what are you going to build?" （构建的门槛刚刚崩塌了。唯一剩下的问题是：你要建什么？）
"Go make something people want." （去做人们想要的东西。）——这也是 YC 的经典口号。

时间线索引

时间	内容
[00:09]	Garry Tan 自我介绍：YC CEO、Palantir 第10号员工、Posterous 联合创始人
[01:03]	介绍 GStack：3周内 GitHub 星标超过 Ruby on Rails
[01:22]	个人经历：过去两个月代码量超过2013年全年
[01:52]	核心问题：模型开箱即用会"猜测"和"跑偏"
[02:17]	GStack 理念："thin harness, fat skills"（轻薄框架，厚重技能）
[02:33]	Office Hours 技能介绍：模拟 YC 合伙人创业辅导
[03:05]	现场演示：用税务1099应用做 Office Hours
[05:29]	AI 提问：什么证据证明有人需要这个？
[06:26]	AI 竞品分析：TurboTax、H&R Block、Plaid 已有相关功能
[07:14]	商业模式洞察：楔子策略，从文档聚合切入 CPA 匹配
[08:44]	GStack 浏览器自动化功能介绍
[09:00]	Garry Tan 对 Opus 4.6 vs Codex 的比喻
[11:21]	Office Hours 总结：从半成品想法到完整方案
[13:04]	多步骤对抗性审查演示
[13:30]	审查结果：自动发现并修复16个问题，评分从6/10升至8/10
[13:55]	Design Shotgun 技能演示
[14:42]	三个设计方案对比与选择
[16:13]	GStack 功能概览：28个命令，70,000+星标
[17:22]	浏览器自动化 CLI 工具：解决 QA 瓶颈
[18:34]	Chrome MCP 批评："worst pieces of software"
[18:58]	并行工作流：10-15个同时运行的 Claude Code 会话
[19:59]	日常管理约400个 PR
[20:16]	供应链攻击安全问题
[21:05]	总结：构建门槛崩塌，"Go make something people want"

Ctrl+Enter 发送

还没有评论，来第一个留言吧 ✨

你可能也喜欢

AI 前沿

Unhobbling 风暴：Claude 碾平 SaaS 行业

Moonshots with Peter Diamandis × Alex Wissner-Gross（物理学家、投资人）、Dave Blundin（MIT、Blitzy 创始人）、Salim Ismail（OpenExo 创始人）

13min · 6,465字

AI 前沿

90 天 1 万美元 AI 生意：硅谷精英 playbook

Silicon Valley Girl（Marina Mogilko）

11min · 5,342字

AI 前沿

Claude 改变内容创作：从动画到视频全自动

Jack Roberts × 无（独立视频）

10min · 4,698字

AI 前沿

用 Claude Code 揭秘 YouTube 算法真相

GStack：YC掌门人的AI工程团队实战手册

How to Make Claude Code Your AI Engineering Team

来源Y Combinator × 无（独立演讲+现场演示）视频时长约21分钟报告字数3,227字阅读时间7min原始链接https://www.youtube.com/watch?v=wkv2ifxPpF8

本报告由 AI 深度分析生成，基于视频完整字幕。

📺 原视频约21分钟📖 本报告 3,227字⏱ 预计阅读 7min

导读

阅读提示： 原视频约21分钟，本报告约4500字，阅读约12分钟。

一、从个人痛点到产品哲学：为什么需要 GStack？

但这种爆发式的产出不是凭空来的。他发现了 AI 编程的核心矛盾：

"Out of the box, the model wanders. It doesn't know your data well. So, it guesses. And guessing at that scale is how you get plausible looking code that silently breaks."（开箱即用的模型会跑偏。它不了解你的数据，所以就猜。而大规模的猜测，就是你得到那些看起来合理但悄悄出错的代码的原因。）

二、Office Hours：把YC的创业评估能力装进AI

他输入了一个简单的想法："帮人从 Gmail 和金融机构中找到所有的1099税表"。AI 没有直接开始写代码，而是像一个 YC 合伙人一样开始追问：

"What's the strongest evidence that someone actually wants this?"（你有什么最强有力的证据证明有人真的需要这个？）——这是 YC 评估创业想法的第一个关键问题。
竞品分析：AI 主动指出 TurboTax 和 H&R Block 已经有1099导入功能，Plaid 可以连接银行——为什么这些没有解决你的问题？
商业模式重构：AI 发现了一个更有价值的方向——不只是文档聚合（可能只值2-5美元/年），而是作为一个"楔子策略"（wedge strategy），通过税务文档收集切入 CPA 市场匹配，后者的交易抽成可能是前者的10倍。

"It's not this sort of on rails thing. It's more like a conversation with your model."（这不是那种固定套路的东西。更像是和你的模型进行一次对话。）

这正是 GStack 与普通 AI 工具的根本区别：它不替你做决定，而是帮你想清楚问题。

三、Design Shotgun：60秒生成多版本设计

通过 Office Hours 确定方向后，Garry Tan 演示了另一个技能——"Design Shotgun"（设计霰弹枪）。

Option A "Command Center"：深色主题，仪表盘风格，适合 Linux 黑客
Option B "Friendly Progress"：卡片式布局，进度环，适合普通用户
Option C "Split View"：分屏视图，过于复杂

Garry Tan 的评价很直接：A 是4分，B 是5分，C "makes it way more complicated than it needs to"（比需要的复杂太多了）。选择 B，继续推进。

四、对抗性审查：AI 自己给自己挑刺

GStack 有一个特别值得注意的环节：多步骤对抗性审查（multi-step adversarial review）。

在设计文档完成后，AI 会自动对自己的产出进行严格审查，找出问题：

没有失败处理逻辑
缺少隐私条款
双因素认证（2FA）交接没有提出解决方案

五、浏览器自动化：QA 瓶颈的破解

他的解决方案是把 Playwright 和 Chromium 封装成了 CLI 工具，集成进 GStack：

"Chrome MCP is one of the worst pieces of software I've ever used."（Chrome MCP 是我用过的最差的软件之一。）

六、Level 7 软件工厂：日产50个PR的工作方式

Garry Tan 用一个"软件工厂等级"的概念来描述他的目标。他坦率地说 GStack 没有达到 Level 8（完全自主），但达到了 Level 7——这意味着什么？

看到一个想法/bug/用户反馈 → 开一个新 worktree
运行 Office Hours → CEO Review → 对抗性审查 → 正常开发流程
准备好了就合并，一天可以处理10-50个 PR

"I don't have a to-do list anymore."（我不再有待办清单了。）

他用一个很形象的比喻来描述 Claude 和 Codex 的分工：

"Opus 4.6 is sort of ADHD CEO. He's the guy you want to get a beer with and he's got a billion ideas, but when the going gets tough, you got to call in your autistic CTO and that's Codex."（Opus 4.6 是那种多动症CEO，你会想跟他喝杯啤酒，他有十亿个想法，但事情变难的时候，你得叫你那个自闭症CTO出来——那就是 Codex。）

这个比喻虽然有些冒犯，但准确地描述了两种模型的特点：一个擅长发散和创意，一个擅长专注和执行。

七、安全焦虑与供应链攻击

在谈到开源项目管理时，Garry Tan 提到了一个重要的安全问题：AI 编程时代的供应链攻击。

这是一个很少有人提到但极其重要的问题：当 AI 让写代码变得极其容易，攻击者提交恶意 PR 的成本也同样降低了。

金句收录

"We are in a completely new era of building software, the agent era." （我们正处于软件构建的全新时代——Agent 时代。）
"The bottleneck here is not the model's intelligence... they are already smart enough to do extraordinary work." （瓶颈不在模型的智力......它们已经足够聪明来做出非凡的工作。）
"Out of the box, the model wanders. It doesn't know your data well. So, it guesses." （开箱即用的模型会跑偏。它不了解你的数据，所以就猜。）
"It's not this sort of on rails thing. It's more like a conversation with your model." （这不是那种固定套路的东西。更像是和你的模型进行一次对话。）
"Opus 4.6 is sort of ADHD CEO... when the going gets tough, you got to call in your autistic CTO and that's Codex." （Opus 4.6 是那种多动症CEO......事情变难的时候，你得叫你的自闭症CTO出来——那就是 Codex。）
"I don't have a to-do list anymore." （我不再有待办清单了。）
"The barrier to building just collapsed. The only question left is what are you going to build?" （构建的门槛刚刚崩塌了。唯一剩下的问题是：你要建什么？）
"Go make something people want." （去做人们想要的东西。）——这也是 YC 的经典口号。

时间线索引

时间	内容
[00:09]	Garry Tan 自我介绍：YC CEO、Palantir 第10号员工、Posterous 联合创始人
[01:03]	介绍 GStack：3周内 GitHub 星标超过 Ruby on Rails
[01:22]	个人经历：过去两个月代码量超过2013年全年
[01:52]	核心问题：模型开箱即用会"猜测"和"跑偏"
[02:17]	GStack 理念："thin harness, fat skills"（轻薄框架，厚重技能）
[02:33]	Office Hours 技能介绍：模拟 YC 合伙人创业辅导
[03:05]	现场演示：用税务1099应用做 Office Hours
[05:29]	AI 提问：什么证据证明有人需要这个？
[06:26]	AI 竞品分析：TurboTax、H&R Block、Plaid 已有相关功能
[07:14]	商业模式洞察：楔子策略，从文档聚合切入 CPA 匹配
[08:44]	GStack 浏览器自动化功能介绍
[09:00]	Garry Tan 对 Opus 4.6 vs Codex 的比喻
[11:21]	Office Hours 总结：从半成品想法到完整方案
[13:04]	多步骤对抗性审查演示
[13:30]	审查结果：自动发现并修复16个问题，评分从6/10升至8/10
[13:55]	Design Shotgun 技能演示
[14:42]	三个设计方案对比与选择
[16:13]	GStack 功能概览：28个命令，70,000+星标
[17:22]	浏览器自动化 CLI 工具：解决 QA 瓶颈
[18:34]	Chrome MCP 批评："worst pieces of software"
[18:58]	并行工作流：10-15个同时运行的 Claude Code 会话
[19:59]	日常管理约400个 PR
[20:16]	供应链攻击安全问题
[21:05]	总结：构建门槛崩塌，"Go make something people want"