诺奖得主 Hassabis 的 AGI 路线图:2030 时间线、Agent 刚起步、爱因斯坦测试与科学大发现
Demis Hassabis: Agents, AGI & the Next Big Scientific Breakthrough
本报告由 AI 深度分析生成,基于视频完整字幕。
导读
这是 AI 领域最有分量的对话之一。Demis Hassabis——国际象棋神童、17 岁设计出第一款爆款游戏 Theme Park、认知神经科学博士、DeepMind 联合创始人、AlphaGo 和 AlphaFold 的缔造者、2024 年诺贝尔化学奖得主——在 Y Combinator 总部,面对一屋子创业者,坦率地谈论了他对 AGI 的路线图、Agent 的现状与潜力、AI 做科学发现的极限,以及给创始人的忠告。
Hassabis 的独特之处在于他同时具备三重视角:神经科学家(理解大脑如何工作)、游戏设计师(理解系统设计和搜索空间)、AI 研究领袖(30 年一线经验)。这让他的判断既不是纯工程式的乐观,也不是学术式的谨慎,而是一种有根据的直觉。
阅读提示:原视频约 50 分钟,本报告提取了全部核心观点并重组为 8 个主题。
一、AGI 架构:当前范式会是最终答案吗?
Hassabis 对当前技术栈的判断异常清晰:
"I can't see a world in which we will sort of realize in a couple of years this was a dead end. That doesn't make sense to me."(我无法想象有一个世界,几年后我们会发现这是一条死路。那说不通。)
他确认大规模预训练、RLHF、思维链这些组件将会成为最终 AGI 架构的一部分。但关键是——还缺 1-2 个大想法:
- 持续学习(Continual Learning) :当前模型是无状态的,不能从使用中学习。这是 Agent 无法真正"放手去做"的核心瓶颈
- 长程推理(Long-term Reasoning) :模型能解 IMO 金牌题,却会犯基础数学错误——这种"参差不齐的智能"(jagged intelligence)说明推理机制有根本性缺陷
- 记忆(Memory) :把所有东西塞进上下文窗口是"用胶带糊起来"的做法(duct tape)。100 万 token 看似很大,但处理实时视频时只相当于 20 分钟
他给出了一个概率估计:50/50——可能只需要渐进式创新,也可能还需要 1-2 个根本性突破。
AGI 时间线:约 2030 年。 他两次提到这个数字。
二、大脑给 AI 的灵感:从海马体到经验回放
Hassabis 是认知神经科学博士,研究方向正是海马体如何将新知识优雅地整合进已有知识库。这段讨论揭示了 DeepMind 的思想根源:
- 经验回放(Experience Replay) :DeepMind 最早的 Atari 程序 DQN 之所以能掌握游戏,就是借鉴了大脑在 REM 睡眠期间重放重要情节的机制——这是 2013 年的工作
- 上下文窗口 ≈ 工作记忆:人类工作记忆只有约 7 个数字的容量,AI 有百万甚至千万 token。但问题不在于存储量,而在于检索成本——在庞大的记忆中找到对当前决策真正有用的那一条信息,这是非平凡的
- 现在我们做的还很粗暴:把所有东西(包括不重要的、错误的)都塞进上下文窗口。这就像你把整个图书馆搬进工作台,而不是只拿出需要的那本书
核心洞察:AI 的记忆创新空间巨大。当前的暴力方法会被更优雅的架构取代,而灵感很可能来自神经科学。
三、强化学习回归:AlphaGo 的遗产正在复活
当被问到 RL 是否被低估时,Hassabis 回答"potentially yes"(可能是的),并展开了一段精彩的技术叙事:
- DeepMind 从第一天就在做 Agent 系统——Atari、AlphaGo、AlphaStar(星际争霸)
- 今天所有模型的思维模式和思维链,本质上都是 AlphaGo 时代探索的东西的回归
- 他们正在重新审视 蒙特卡洛搜索和其他 RL 增强方法,将其规模化应用到通用基础模型上
- 链式思考是搜索和规划的一种形式——这正是 AlphaGo/AlphaZero 的核心思想
他用下棋来诊断推理缺陷:Gemini 下棋时会在思维链中认出某步是"昏招"(blunder),但因为找不到更好的走法,又走了那步昏招。这暴露了当前推理系统缺少某种元认知/自我反省能力。
四、蒸馏的力量:Flash 模型 95% 能力、十分之一价格
Hassabis 对蒸馏(Distillation)技术的信心极高:
- Flash 模型达到前沿模型 95% 的能力,成本只有 1/10
- 没有看到任何理论极限——信息密度的瓶颈远未到来
- 规律是:前沿模型发布后半年到一年,同等能力就会出现在极小的边缘模型中
- Gemma 4 模型在两周半内达到 4000 万次下载
- 小模型的价值不仅是成本——速度带来的迭代能力本身就超过了 5-10% 的精度损失
他还提出了一个有趣的架构愿景:未来的系统可能是本地小模型处理隐私敏感数据(音视频流)+ 只在需要时委托给云端大模型。这对机器人和智能眼镜尤其重要。
五、Agent 现状:刚刚起步,还没看到"爆款"
这是对 Agent 炒作最清醒的评估之一:
"We haven't seen a AAA game that tops the app store charts that was sort of vibe coded yet."(我们还没看到一款用 vibe coding 做出来的、登顶 App Store 的 3A 游戏。)
Hassabis 的判断框架:
- Agent 是通往 AGI 的路径——这一点在 DeepMind 看来从一开始就清楚
- 当前 Agent 对任务的部分很有用,但不能真正"放手让它去做"(fire and forget)
- 核心瓶颈是缺少持续学习——Agent 不能适应你的具体环境
- 他亲自尝试过用 AI 在 30 分钟内做出 Theme Park 的原型(这款游戏他 17 岁时花了 6 个月开发),但认为要做出真正出色的东西,仍然需要工匠精神、品味和人的灵魂
- 我们还在实验阶段——只是在最近几个月才开始找到真正有价值的应用场景
他也对"开几十个 Agent 跑 40 小时"的做法持怀疑态度——产出还没看到配得上那个投入的。
六、开源与 Gemma:西方 AI 需要自己的开源筹码
Hassabis 对开源的立场值得注意:
- DeepMind 是开源和开放科学的坚定支持者——AlphaFold 完全免费开放
- Gemma 的战略意义:确保西方有竞争力的开源模型栈,而不是让中国模型(如 Qwen)独占开源领域
- 边缘模型(用于 Android、智能眼镜、机器人)部署后本就暴露在外,不如索性完全开源
- 前沿模型太大、太贵,做两个不同版本(开源+闭源)资源不够,所以在"纳米级"统一开源
七、AI 做科学发现:还差一步到"爱因斯坦时刻"
这是整场对话最令人振奋的部分。Hassabis 将 DeepMind 的使命分为两步:
"Step one: solve intelligence. Step two: use it to solve everything else."(第一步:解决智能问题。第二步:用它解决其他一切问题。)
AlphaFold 的影响力已经是教科书级别的:
- 全球超过 300 万研究者在使用 AlphaFold
- 制药高管告诉他:"从现在起发现的几乎每一种药物,都会在某个环节用到 AlphaFold"
- AlphaFold 是"根节点问题"(root node problem)的原型——解决一个问题,解锁整个发现分支
但真正的科学发现——提出原创假设——还没到:
- Co-scientist、AlphaEvolve 等系统在尝试超越基础 Gemini 的能力
- 还没有看到 AI 做出"真正重大的发现"
- 关键缺失能力是类比推理(analogical reasoning) ——超越模式匹配和外推
- 他提出了"爱因斯坦测试":用 1901 年的物理知识训练系统,看它能否独立提出 1905 年爱因斯坦的发现(包括狭义相对论)
- 更高的标准:能否提出一组新的千禧年难题,被顶级数学家认为同样深刻和值得研究
什么样的问题适合 AI 解决?三个条件:
- 巨大的搜索空间(围棋走法数 > 蛋白质构型数 > 宇宙原子数)
- 清晰的目标函数(最小化自由能、赢棋)
- 足够的数据或模拟器
八、给创始人的忠告:AGI 会在你的创业中途到来
Hassabis 的最后一段发言堪称全场最精华:
"Going after hard problems is no more difficult in some ways than going after a shallower, simpler, more superficial problem. They're just differently difficult."(追求困难问题在某种意义上并不比追求浅层、简单、表面的问题更难。它们只是难在不同的地方。)
给创业者的三条建议:
-
人生很短,把生命力投入到真正有影响的事情上——难题和简单题的难度类型不同,但既然都难,为什么不选更有意义的那个?
-
跨学科将变得比以往更普遍——AI 让连接不同领域变得更容易,学科交叉处往往有最大的发现
-
如果你的 AGI 时间线是 2030 年,而深科技创业通常需要 10 年,那 AGI 会在你的旅程中途到来——你必须考虑这个变量。他的建议不是放弃深科技,而是想清楚 AGI 如何被利用。未来很可能是 Gemini/Claude 这样的通用系统调用 AlphaFold 这样的专用工具,而不是一个"巨型大脑"包揽一切
金句收录
-
"I can't see a world in which we will realize in a couple of years this was a dead end." 我无法想象几年后我们会发现这是一条死路。
-
"We're kind of using duct tape right now — shove it all in the context window." 我们现在基本是用胶带糊起来的——把所有东西都塞进上下文窗口。
-
"A million tokens isn't that much. It's only like 20 minutes." 100 万 token 其实没那多多。处理实时视频的话只相当于 20 分钟。
-
"Agents are that path and I think we're just getting going." Agent 就是通往 AGI 的路径,而我认为我们才刚刚起步。
-
"We haven't seen a AAA game that tops the app store charts that was sort of vibe coded yet." 我们还没看到一款用 vibe coding 做出来的登顶 App Store 的 3A 游戏。
-
"It still needs craft and human sort of soul into it and taste." 它仍然需要工匠精神、人的灵魂和品味。
-
"Almost every drug discovered from now on will have used AlphaFold at some point." 从现在起发现的几乎每一种药物,都会在某个环节用到 AlphaFold。
-
"Step one: solve intelligence. Step two: use it to solve everything else." 第一步:解决智能。第二步:用它解决其他一切。
-
"Can you train a system with knowledge of 1901 and will it come up with what Einstein did in 1905?" 能否用 1901 年的知识训练系统,让它独立发现爱因斯坦 1905 年的成果?
-
"Life's very short. You might as well put your life force into something that will really make a difference." 人生很短。你不如把生命力投入到真正能产生影响的事情上。
-
"Going after hard problems is no more difficult than going after shallow ones. They're just differently difficult." 追求困难问题并不比追求浅层问题更难。它们只是难在不同的地方。
-
"If your AGI timeline is 2030, then AGI will appear in the middle of your deep tech journey." 如果你的 AGI 时间线是 2030 年,那 AGI 会在你深科技创业的中途到来。
时间线索引
| 时间 | 内容 |
|---|---|
| [00:00] | 开场:Hassabis 传奇经历介绍(棋童→游戏设计师→PhD→DeepMind→诺贝尔奖) |
| [01:55] | AGI 架构:当前范式会留下,但还缺 1-2 个大想法 |
| [03:30] | 持续学习、长程推理、记忆——AGI 的三大未解问题 |
| [04:00] | 海马体与经验回放:从神经科学到 DQN |
| [05:00] | 上下文窗口 = 工作记忆;100 万 token = 20 分钟视频 |
| [06:10] | 强化学习回归:AlphaGo 思想在基础模型中复活 |
| [08:00] | 蒸馏:Flash 模型 95% 能力、1/10 成本 |
| [10:00] | 小模型极限未到;Gemma 4 两周半 4000 万下载 |
| [12:00] | 边缘设备:本地模型 + 云端大模型的混合架构 |
| [13:00] | 持续学习是 Agent "火力全开"的关键缺失 |
| [14:00] | 推理的"参差不齐":IMO 金牌 vs 基础数学错误 |
| [15:30] | Agent 现状:实验阶段,还没看到爆款 |
| [17:00] | Theme Park 30 分钟原型 vs 17 岁时 6 个月开发 |
| [20:00] | 开源战略:Gemma、西方 AI 开源栈 |
| [22:30] | Gemini 从一开始就是多模态;世界模型、机器人 |
| [27:00] | 下一个 AlphaFold:活细胞成像 → 视觉问题 |
| [28:30] | AI 做科学:材料科学、药物发现、数学、气候 |
| [29:00] | DeepMind 使命:解决智能 → 用它解决一切 |
| [30:00] | AlphaFold 影响力:300 万研究者,未来所有药物 |
| [33:00] | AI 可解问题的三条件:搜索空间 + 目标函数 + 数据 |
| [35:00] | AI 科学推理:Co-scientist、AlphaEvolve |
| [36:00] | "爱因斯坦测试":用 1901 年知识发现狭义相对论 |
| [38:00] | 给创始人的忠告:困难问题与简单问题只是"不同方式的难" |
| [39:00] | AGI 2030 时间线:深科技创业必须考虑这个变量 |
| [40:00] | 未来架构:通用 AI 调用专用工具,而非一个巨型大脑 |
评论
还没有评论,来第一个留言吧 ✨