Box CEO 揭秘大公司 AI 落后真相：硅谷与现实世界的鸿沟，以及为什么工程师反而会更多

Box CEO: Why Big Companies Are Falling Behind on AI | a16z

来源a16z × Aaron Levie（Box CEO）、Martin Casado（a16z 合伙人）视频时长约55分钟报告字数3,946字阅读时间8min原始链接https://www.youtube.com/watch?v=dvVbA9OcBqs

本报告由 AI 深度分析生成，基于视频完整字幕。

📺 原视频约55分钟📖 本报告 3,946字⏱ 预计阅读 8min

导读

a16z 的直播节目请来了 Box CEO Aaron Levie 和 a16z 合伙人 Martin Casado，三人围绕一个尖锐问题展开了一场信息密度极高的对话：为什么大公司在 AI 落地上如此挣扎？ 这不是一场泛泛的讨论——Aaron Levie 被称为"最深入客户一线的 CEO"，他每天都在跟企业 CIO 和 AI 团队对话，带回的是硅谷光环之外的残酷现实。Martin Casado 则从软件架构的底层逻辑出发，抛出了一个颠覆性的观点：把 AI Agent 当人来管理，而不是当软件来集成。三个人围绕 Headless SaaS、AI 编码的熵增困境、以及"AI 会消灭工作"的荒谬性展开了激烈交锋，几乎每一轮都有值得划线的洞察。

阅读提示： 原视频约55分钟，本报告约6000字，阅读时间约15-20分钟。

一、硅谷与现实世界的鸿沟：为什么 AI Agent 在企业落地如此缓慢

Aaron Levie 开场就直击核心：硅谷工程师的工作方式与"世界其余部分"之间存在一条巨大的鸿沟。

在硅谷，工程师技术能力极强、对互联网动态极度敏锐、能自选工具并快速调试，而且代码的输出是可验证的——这让 AI Agent 在工程领域如鱼得水。但企业的知识工作者完全是另一个世界：用户不够技术化、数据高度碎片化、系统大量遗留、工作流与工程世界截然不同。

"It's literally like there is just a pure workflow and technology set divide"（这纯粹就是工作流和技术体系的分割。）

Martin Casado 补充了一个更深层的观察：大公司的决策方式本身就在拖慢AI的扩散。互联网和社交网络都是"从个人开始扩散"的——大公司里其实很多个人已经在用 ChatGPT，但公司层面的组织决策体完全不知道如何应对。

他讲了一个典型场景：董事会对 CEO 说"我们需要更多 AI"，CEO 就雇了一个咨询公司搞个集中式 AI 项目，没有人知道它怎么运作，也没有与运营对齐——然后这些项目全部失败。MIT 说 95% 的企业 AI 项目失败——Martin 认为这个统计"clearly silly"（显然是愚蠢的），因为每个人都在有效使用 ChatGPT，真正失败的是那些自上而下的集中式 AI 部署。

二、AI 技术变化太快，反而制造了企业决策瘫痪

Aaron 提出了一个被忽视的悖论：AI 技术进化的速度，反而阻碍了它在企业中的扩散。

各个 AI 实验室在不断"互相超越"，但部署 Agent 的范式还没有统一——Agent 编排框架是放在计算机内部还是外部？是运行在你的云上还是托管的？哪些工具可以访问？这些问题都没有定论。

"Because of the pace of change in AI, you actually have this incredible dynamic where the labs are leapfrogging each other so frequently but with not the exact same paradigm"（由于 AI 变化速度太快，实验室不断互相超越，但对于如何部署 Agent 的范式并不统一。）

Aaron 去跟 CIO 聊天，每一个客户都在"两三种范式之间做辩论"，没有人敢全力押注某一条路线——因为他们三四年前就被 AI 坑过一次，当时选的路线现在已经过时了。

"I've been burned by doing the wrong thing in AI maybe 3 or 4 years ago"（我三四年前就因为选错了 AI 方向而吃过亏。）

这导致了一个恶性循环：技术变化越快 → 企业越不敢做决定 → AI 越无法渗透到真正重要的工作流中。

三、"把 Agent 当人来管理" vs "把 Agent 当软件来集成"

这场对话中最精彩的交锋来自 Martin Casado 抛出的颠覆性观点：

不要试图把 AI Agent 当作软件来集成到现有系统中。应该把 Agent 当作"人"来管理——给它分配身份、邮箱、权限，让它使用为人类设计的流程和界面。

Martin 的逻辑链条很清晰：

LLM 是非确定性的、智能的、能处理长尾复杂性——这些恰恰也是人类的特征
我们花了 40 年为"混乱的人类"构建界面、流程和权限控制
Agent 与软件系统的集成很糟糕，但如果你把它当人来管理，它可以"搭便车"利用已有的人类流程

"If you have the mindset that an agent is more like a human and you hire the agent, you give it its own email address, it can access documents like humans can"（如果你把 Agent 视为更像一个人，你雇用它，给它自己的邮箱，它就能像人类一样访问文档。）

Aaron 同意这个框架，但指出了一个关键限制：人类有很多 Agent 不具备的优势。人类有大量隐性知识——谁该找谁、哪些信息没有被文档化、遇到权限不足时知道去"拍谁的肩膀"。Agent 遇到权限墙就卡住了，不会像人类那样绕路。

"They don't know who to tap on the shoulder"（它们不知道该拍谁的肩膀。）

Martin 立刻接上，半开玩笑半认真地说：他完全支持"Agent 入职培训"——Agent 来了要先去参加新人培训，CEO 给它做文化讲解，各部门做业务介绍。这话听起来荒谬，但他认为这恰恰是正确的思路——因为 Agent 的熵很大、行为不可预测，所以需要用人类的流程来约束它。

四、Headless SaaS 之争：浏览器 Agent 还是 API Agent？

Salesforce 宣布"全面 Headless"（无界面模式，通过 API 被 Agent 调用）引发了三人的一场激烈辩论。

Aaron 认为这是一个标志性时刻——软件不再只为人类用户设计，还要为"概率性机器用户"（非确定性的 Agent）服务。Headless 模式让 Agent 能以 100 倍甚至 1000 倍于人类用户的规模来使用软件平台。

Martin 则提出了一个意外的反论：很多情况下，Agent 通过浏览器直接操作应用（像人一样）比通过 API 更有效。他举了 OpenClaw 用 Mac Mini 的例子——人们用 Mac Mini 跑 OpenClaw 的首要原因是 iMessage（因为 iMessage 没有 API），第二个原因是很多网站有反爬措施，Headless 浏览器根本打不开 Zillow 之类的网站。

"To do anything headless kind of assumes the entire internet is going to go headless"（要做任何 Headless 的事情，某种程度上假设了整个互联网都会变成 Headless。）

Aaron 反驳说：任何有好 API 的软件，Agent 肯定会优先用 API——API 比点击像素高效得多。但他也承认，Agent 会在 API 不可用时退回到浏览器模式。

三人最终达成了一个微妙的共识：不是非此即彼，而是 Agent 需要智能选择路径——有 MCP/CLI 就用，没有就弹出浏览器。

五、AI 编码的"熵增"困境：你以为在加速，其实在制造新问题

Martin Casado 提出了整场对话中最发人深省的问题：用 AI 写代码，代码质量会随时间显著下降，你引入的问题可能和解决的问题一样多。

"When you code with AI, your code kind of gets worse over time pretty materially"（用 AI 写代码，代码质量会随时间相当实质性地下降。）

他用"coding entropy"（编码熵增）来描述这个现象——Agent 在不断创造新事物的同时，也在引入混乱和复杂性，而我们还不知道如何管理这种熵。

Aaron 深有体会。他分享了 Box 的实战经验：AI 写了一个新功能的 80-90% 代码，但发布速度被安全审查和代码审查拖慢了——因为 AI 生成的代码必须经过完整的安全审查，确保没有代码注入等问题。

"I don't think it's a 5 to 10x gain. I do think it's a 2 to 3x gain maybe across the board"（我不认为这是5到10倍的提升，我觉得大概是2到3倍的全面提升。）

Martin 进一步总结：这就是为什么 Vibe Coding（一次性搞定式编码）的人觉得完全没问题——因为他们从来不需要在一个系统中长期生活，从来不需要防止整个系统崩溃。大公司的工程体系存在大量约束，恰恰是这些约束在防止灾难发生。

六、"AI 消灭工作"是一个古老的愚蠢预言

三人在就业问题上罕见地达成了完全一致。

Martin 翻出了1990年代的一本书《The End of Work》（《工作的终结》）——作者自称"未来学家"，在互联网爆发前六个月出版，宣称技术革命是彻底的失败，生产力没有任何提升，工作即将消亡。结果互联网创造了人类历史上最大的就业和财富爆发。

Aaron 用会计行业的例子做了精彩的类比：IBM 在 1965 年推销计算机时的口号就是"电脑会取代会计师"。实际上发生了什么？会计工作变得更复杂、更全面、需要更多人——因为电脑让我们能够做以前根本不可能做到的复杂审计和分析。

"The funniest concept is that the more code we write, the less we would need engineers. It'd be the opposite"（最搞笑的概念就是：代码写得越多，工程师就越少。恰恰相反。）

他的论证是：AI 让系统变得更复杂，更复杂的系统需要更多的工程师来做升级、处理宕机、应对安全事故。AI 原生公司正在疯狂招人——从数据上看，我们正处于一个扩张期，而非收缩期。

"We're just getting started with the jobs on this front"（在这条线上，工作岗位才刚刚开始增长。）

七、用 Token 消耗量考核 AI 使用率：一个荒诞的企业管理案例

Aaron 分享了一个令人捧腹又细思极恐的真实案例：很多大公司正在用"Token 消耗量"来激励员工使用 AI。

他昨天刚跟一个大公司的员工聊过，对方说："我和同事们让 Agent 做毫无意义的任务，就是为了凑 Token 使用量。"

"Me and my co-workers have agents do useless tasks just so that we can..."（我和同事们让 Agent 做无用的任务，就是为了……）

Martin 一针见血："You get whatever you measure"（你衡量什么就得到什么）——如果你用 Token 消耗量来考核 AI 使用率，你得到的就是假生产力和有问题的产出物。

这个案例完美地呼应了全场的主题：大公司的 AI 落地困难，不仅是技术问题，更是组织决策和管理范式的问题。

金句收录

"My job these days is just bring reality to the valley and then bring the valley to reality." — Aaron Levie （我现在的工作就是把现实带给硅谷，然后把硅谷带进现实。）
"The board goes to the CEO: 'We need more AI.' The CEO gets a consultant. They have some centralized project nobody knows how it works. Those things will fail." — Martin Casado （董事会对CEO说"我们需要更多AI"。CEO就请了个顾问，搞了个集中式项目，没人知道怎么运作。这些项目注定失败。）
"If you view agents more like humans and you draft on the mechanisms we put in place for humans, they're much easier to integrate." — Martin Casado （如果你把Agent更多地看作人类，借用我们为人类设置的机制，它们就更容易集成。）
"They don't know who to tap on the shoulder." — Aaron Levie （Agent不知道该拍谁的肩膀。）
"The funniest concept is that the more code we write, the less we would need engineers. It'd be the opposite." — Aaron Levie （最搞笑的概念就是代码写得越多工程师越少。恰恰相反。）
"When you code with AI, your code kind of gets worse over time pretty materially." — Martin Casado （用AI写代码，代码质量会随时间相当实质性地下降。）
"You get whatever you measure." — Martin Casado （你衡量什么就得到什么。）
"We're just getting started with the jobs on this front." — Aaron Levie （在这条线上，工作岗位才刚刚开始增长。）
"There's no headless version of the elevator." — Aaron Levie （电梯没有无界面版本。）
"AI caters to our need to be productive. We feel like we're being very productive but we may actually be creating mounds of extra work." — Aaron Levie （AI迎合了我们对生产力的需求。我们觉得自己很高效，但实际上可能在制造大量额外的工作。）

时间线索引

时间	内容
[00:00]	开场：董事会要AI → CEO请顾问 → 集中式项目失败的经典循环
[02:00]	Aaron 的自我定位：在硅谷和现实之间做翻译
[03:00]	硅谷工程师 vs 企业知识工作者：工作流和技术体系的鸿沟
[05:00]	Martin 谈大公司的集中式决策如何阻碍AI扩散
[07:00]	AI变化太快导致企业决策瘫痪：CIO们在"两三种范式间辩论"
[09:30]	Martin 提出"AI不是软件，应该当用户来对待"的架构转变
[12:00]	集成是AI落地的真正壁垒：1000人以上或10年以上的企业都是集成泥潭
[13:00]	律师行业案例：25岁的律师助理已经在成功使用AI
[13:30]	荒诞案例：公司用Token消耗量考核AI使用，员工让Agent做无用任务凑数
[15:00]	Agent的权限困境：拿到跟人一样的权限会到处碰壁
[17:00]	OpenAI与Accenture合作的逻辑：部署Agent需要大量系统集成工作
[19:00]	"信息获取型Agent"vs"行动执行型Agent"的分叉
[21:00]	Martin的颠覆性论点：把Agent当人来管理，用人类的流程来约束
[24:00]	电梯里的按钮机器人：为什么"没有无界面版本"的比喻如此精准
[25:00]	Salesforce全面Headless：企业软件的标志性时刻
[29:00]	Headless vs Browser Agent的激烈辩论
[33:00]	"SaaS末日论比我以为的还蠢"：Agent = 新的License席位
[37:00]	Box Agent实战：搜索能力如何突破人类的单次查询限制
[41:00]	AI编码的熵增困境：引入的问题跟解决的问题一样多
[45:00]	Box的务实态度：AI编码是2-3倍提升，不是10倍
[47:00]	为什么Aaron对就业前景"极度乐观"
[49:00]	1990年代《工作的终结》：一个"先觉得蠢再觉得更蠢"的预言
[51:00]	会计行业的教训：电脑没有消灭会计师，反而创造了更多会计岗位
[52:00]	代码越多 ≠ 工程师越少，恰恰相反

Ctrl+Enter 发送

还没有评论，来第一个留言吧 ✨

你可能也喜欢

AI 前沿

从仓库到工厂：黄仁勋的计算终局判断

：Lex Fridman × ：Jensen Huang（NVIDIA CEO，在任 34 年，全球最长任职科技公司 CEO）

9min · 4,376字

AI 前沿

7M 参数 + 1000 样本击败 o3：YC 拆解为什么 Recursion 是下一代 AI scaling law

Y Combinator · Decoded × Francois（YC visiting partner，资深 ML 研究员）

13min · 6,403字

AI 前沿

当50年风险管理大师听到"等死几千万人再说"——Paul Tudor Jones 的 AI 恐惧

：Paul Tudor Jones（Tudor Investment 创始人，50年市场经验）

8min · 3,831字

AI 前沿

诺奖得主的 AGI 缺口清单：Demis Hassabis 认为我们还差什么

：Demis Hassabis（Google DeepMind CEO，2024 诺贝尔化学奖得主，AlphaFold / AlphaGo 创造者）

8min · 3,547字

← 浏览更多报告

AI 前沿

Box CEO 揭秘大公司 AI 落后真相：硅谷与现实世界的鸿沟，以及为什么工程师反而会更多

Box CEO: Why Big Companies Are Falling Behind on AI | a16z

来源a16z × Aaron Levie（Box CEO）、Martin Casado（a16z 合伙人）视频时长约55分钟报告字数3,946字阅读时间8min原始链接https://www.youtube.com/watch?v=dvVbA9OcBqs

本报告由 AI 深度分析生成，基于视频完整字幕。

📺 原视频约55分钟📖 本报告 3,946字⏱ 预计阅读 8min

导读

阅读提示： 原视频约55分钟，本报告约6000字，阅读时间约15-20分钟。

一、硅谷与现实世界的鸿沟：为什么 AI Agent 在企业落地如此缓慢

Aaron Levie 开场就直击核心：硅谷工程师的工作方式与"世界其余部分"之间存在一条巨大的鸿沟。

"It's literally like there is just a pure workflow and technology set divide"（这纯粹就是工作流和技术体系的分割。）

二、AI 技术变化太快，反而制造了企业决策瘫痪

Aaron 提出了一个被忽视的悖论：AI 技术进化的速度，反而阻碍了它在企业中的扩散。

"Because of the pace of change in AI, you actually have this incredible dynamic where the labs are leapfrogging each other so frequently but with not the exact same paradigm"（由于 AI 变化速度太快，实验室不断互相超越，但对于如何部署 Agent 的范式并不统一。）

"I've been burned by doing the wrong thing in AI maybe 3 or 4 years ago"（我三四年前就因为选错了 AI 方向而吃过亏。）

这导致了一个恶性循环：技术变化越快 → 企业越不敢做决定 → AI 越无法渗透到真正重要的工作流中。

三、"把 Agent 当人来管理" vs "把 Agent 当软件来集成"

这场对话中最精彩的交锋来自 Martin Casado 抛出的颠覆性观点：

Martin 的逻辑链条很清晰：

LLM 是非确定性的、智能的、能处理长尾复杂性——这些恰恰也是人类的特征
我们花了 40 年为"混乱的人类"构建界面、流程和权限控制
Agent 与软件系统的集成很糟糕，但如果你把它当人来管理，它可以"搭便车"利用已有的人类流程

"If you have the mindset that an agent is more like a human and you hire the agent, you give it its own email address, it can access documents like humans can"（如果你把 Agent 视为更像一个人，你雇用它，给它自己的邮箱，它就能像人类一样访问文档。）

"They don't know who to tap on the shoulder"（它们不知道该拍谁的肩膀。）

四、Headless SaaS 之争：浏览器 Agent 还是 API Agent？

Salesforce 宣布"全面 Headless"（无界面模式，通过 API 被 Agent 调用）引发了三人的一场激烈辩论。

"To do anything headless kind of assumes the entire internet is going to go headless"（要做任何 Headless 的事情，某种程度上假设了整个互联网都会变成 Headless。）

Aaron 反驳说：任何有好 API 的软件，Agent 肯定会优先用 API——API 比点击像素高效得多。但他也承认，Agent 会在 API 不可用时退回到浏览器模式。

三人最终达成了一个微妙的共识：不是非此即彼，而是 Agent 需要智能选择路径——有 MCP/CLI 就用，没有就弹出浏览器。

五、AI 编码的"熵增"困境：你以为在加速，其实在制造新问题

Martin Casado 提出了整场对话中最发人深省的问题：用 AI 写代码，代码质量会随时间显著下降，你引入的问题可能和解决的问题一样多。

"When you code with AI, your code kind of gets worse over time pretty materially"（用 AI 写代码，代码质量会随时间相当实质性地下降。）

他用"coding entropy"（编码熵增）来描述这个现象——Agent 在不断创造新事物的同时，也在引入混乱和复杂性，而我们还不知道如何管理这种熵。

"I don't think it's a 5 to 10x gain. I do think it's a 2 to 3x gain maybe across the board"（我不认为这是5到10倍的提升，我觉得大概是2到3倍的全面提升。）

六、"AI 消灭工作"是一个古老的愚蠢预言

三人在就业问题上罕见地达成了完全一致。

"The funniest concept is that the more code we write, the less we would need engineers. It'd be the opposite"（最搞笑的概念就是：代码写得越多，工程师就越少。恰恰相反。）

"We're just getting started with the jobs on this front"（在这条线上，工作岗位才刚刚开始增长。）

七、用 Token 消耗量考核 AI 使用率：一个荒诞的企业管理案例

Aaron 分享了一个令人捧腹又细思极恐的真实案例：很多大公司正在用"Token 消耗量"来激励员工使用 AI。

他昨天刚跟一个大公司的员工聊过，对方说："我和同事们让 Agent 做毫无意义的任务，就是为了凑 Token 使用量。"

"Me and my co-workers have agents do useless tasks just so that we can..."（我和同事们让 Agent 做无用的任务，就是为了……）

这个案例完美地呼应了全场的主题：大公司的 AI 落地困难，不仅是技术问题，更是组织决策和管理范式的问题。

金句收录

"My job these days is just bring reality to the valley and then bring the valley to reality." — Aaron Levie （我现在的工作就是把现实带给硅谷，然后把硅谷带进现实。）
"The board goes to the CEO: 'We need more AI.' The CEO gets a consultant. They have some centralized project nobody knows how it works. Those things will fail." — Martin Casado （董事会对CEO说"我们需要更多AI"。CEO就请了个顾问，搞了个集中式项目，没人知道怎么运作。这些项目注定失败。）
"If you view agents more like humans and you draft on the mechanisms we put in place for humans, they're much easier to integrate." — Martin Casado （如果你把Agent更多地看作人类，借用我们为人类设置的机制，它们就更容易集成。）
"They don't know who to tap on the shoulder." — Aaron Levie （Agent不知道该拍谁的肩膀。）
"The funniest concept is that the more code we write, the less we would need engineers. It'd be the opposite." — Aaron Levie （最搞笑的概念就是代码写得越多工程师越少。恰恰相反。）
"When you code with AI, your code kind of gets worse over time pretty materially." — Martin Casado （用AI写代码，代码质量会随时间相当实质性地下降。）
"You get whatever you measure." — Martin Casado （你衡量什么就得到什么。）
"We're just getting started with the jobs on this front." — Aaron Levie （在这条线上，工作岗位才刚刚开始增长。）
"There's no headless version of the elevator." — Aaron Levie （电梯没有无界面版本。）
"AI caters to our need to be productive. We feel like we're being very productive but we may actually be creating mounds of extra work." — Aaron Levie （AI迎合了我们对生产力的需求。我们觉得自己很高效，但实际上可能在制造大量额外的工作。）

时间线索引

时间	内容
[00:00]	开场：董事会要AI → CEO请顾问 → 集中式项目失败的经典循环
[02:00]	Aaron 的自我定位：在硅谷和现实之间做翻译
[03:00]	硅谷工程师 vs 企业知识工作者：工作流和技术体系的鸿沟
[05:00]	Martin 谈大公司的集中式决策如何阻碍AI扩散
[07:00]	AI变化太快导致企业决策瘫痪：CIO们在"两三种范式间辩论"
[09:30]	Martin 提出"AI不是软件，应该当用户来对待"的架构转变
[12:00]	集成是AI落地的真正壁垒：1000人以上或10年以上的企业都是集成泥潭
[13:00]	律师行业案例：25岁的律师助理已经在成功使用AI
[13:30]	荒诞案例：公司用Token消耗量考核AI使用，员工让Agent做无用任务凑数
[15:00]	Agent的权限困境：拿到跟人一样的权限会到处碰壁
[17:00]	OpenAI与Accenture合作的逻辑：部署Agent需要大量系统集成工作
[19:00]	"信息获取型Agent"vs"行动执行型Agent"的分叉
[21:00]	Martin的颠覆性论点：把Agent当人来管理，用人类的流程来约束
[24:00]	电梯里的按钮机器人：为什么"没有无界面版本"的比喻如此精准
[25:00]	Salesforce全面Headless：企业软件的标志性时刻
[29:00]	Headless vs Browser Agent的激烈辩论
[33:00]	"SaaS末日论比我以为的还蠢"：Agent = 新的License席位
[37:00]	Box Agent实战：搜索能力如何突破人类的单次查询限制
[41:00]	AI编码的熵增困境：引入的问题跟解决的问题一样多
[45:00]	Box的务实态度：AI编码是2-3倍提升，不是10倍
[47:00]	为什么Aaron对就业前景"极度乐观"
[49:00]	1990年代《工作的终结》：一个"先觉得蠢再觉得更蠢"的预言
[51:00]	会计行业的教训：电脑没有消灭会计师，反而创造了更多会计岗位
[52:00]	代码越多 ≠ 工程师越少，恰恰相反