播客总结|张小珺Jùn | 商业访谈录 #121 对DeepMind谭捷的访谈:机器人、跨本体、世界模型、Gemini Robotics 1.5和Google
节目主题简介
本期节目,财经作者与主持人张小珺对话DeepMind机器人项目高级负责人谭捷。围绕人工智能、机器人研究的核心前沿,包括“跨本体智能”、“世界模型”的理论与实际挑战,拆解Gemini Robotics 1.5的突破,并透视Google在AI产业链中的独特角色。谭捷不仅分享了技术洞见,更深入讨论了全球AI创新浪潮里的观察与思考。
主要讨论与见解
1. 谭捷的研究视野与职业路径(00:42-06:30)
-
谭捷分享了自身在DeepMind工作的背景,如何聚焦于智能体的认知和物理世界的连接。
-
强调AI顶层哲学——“探索超越数据本体的通用智能”,以及做机器人的初衷。
“我们希望机器人能理解一个从来没见过的厨房,也能做出合适的操作”——谭捷(02:13)
2. “跨本体智能”与世界模型的定义(06:31-18:55)
-
张小珺追问“跨本体智能”与“世界模型”对机器人意味着什么。
-
谭捷解释,跨本体指机器人能够在不同环境,不同任务下迁移知识,而世界模型则是模拟、预测环境变化的内在机制。
-
对比人类如何抽象物理规律,机器人需要“不仅记住动作,还得懂背后的逻辑”。
-
两人讨论了过去“特定任务显著超人类”,与“通用智能尚不足”的行业现状。
“跨本体是AI从弱人工智能向强人工智能迈出的关键一步。”——谭捷(08:25)
“你觉得现在的机器人,‘像一个三岁小孩’,还是‘一只聪明的狗’?”——张小珺(12:07)
3. Gemini Robotics 1.5 的技术亮点(18:56-32:48)
-
谭捷详解Gemini 1.5机器人平台的“三层世界模型”:感知、预测、决策。
-
强调多模态数据在机器人系统中的作用——“视觉、语音、动作的融合”。
-
回顾团队让机器人自学整理桌面、分类物品、处理突发状况的实验过程和突破。
“我们想让机器人看到厨房凌乱,自己找规律收拾干净。”——谭捷(22:36)
-
张小珺追问“错误如何被纠正?”谭捷举例,模型会实时评估预测是否偏离现实,依赖反馈学习快速调整策略。
4. AI研究中的现实挑战与伦理边界(32:49-41:20)
-
谭捷提出:“越贴近现实世界,系统越容易遭遇未预料错漏”,并谈论团队在“安全性”、“鲁棒性”上大量投入。
-
张小珺抛出“AI会不会给人带来威胁”的公众关切,谭捷给出理性回应:一定要在实现效能的同时,对“可控性美德”有清楚原则。
“技术越强大,越需要‘边界感’和公众参与。”——谭捷(38:04)
5. Google生态和AI国际竞争格局(41:21-49:58)
-
谭捷分析Google如何通过协同AI、云、硬件为机器人提供端到端生态。
-
对比中国、美国、欧洲的AI生态,“中国更注重落地,美国更注重原创,欧洲强调规范”。
-
两人探讨“AI基础模型开放”与“商业应用闭合”的悖论,并展望未来协作机会。
“未来谁能掌握世界模型,谁就能构建数字与物理世界的桥梁。”——谭捷(47:13)
6. 面向未来的思考与建议(49:59-结束)
-
张小珺请谭捷为“想投身AI行业的青年”提建议。
-
谭捷鼓励“多学跨学科知识,技术和现实结合,有疑问也敢于挑战权威”。
“人工智能是数学、物理、工程的交汇,也是人类社会的镜子。”——谭捷(52:08)
精彩语录回顾
- “机器人的挑战在于,你永远预设不了环境的全部变化。”——谭捷(14:41)
- “你们在Google,是怎么让世界各地天才一起工作的?”——张小珺(44:16)
- “我们需要不断测试假设,也要保证人类能always pull the plug。”——谭捷(39:22)
重要信息时间索引
- 00:42-06:30 – 谭捷自我介绍/AI哲学
- 06:31-18:55 – 跨本体与世界模型
- 18:56-32:48 – Gemini 1.5技术亮点
- 32:49-41:20 – 现实挑战与伦理
- 41:21-49:58 – Google生态与中国/全球对比
- 49:59-结束 – 青年建议与未来展望
这是一场关于前沿科技如何交融现实世界的深度对话,谭捷的洞见为未来智能体与人类协作打开了想象空间。
