121. 对DeepMind谭捷的访谈：机器人、跨本体、世界模型、Gemini Robotics 1.5和Google

播客总结｜张小珺Jùn | 商业访谈录 #121 对DeepMind谭捷的访谈：机器人、跨本体、世界模型、Gemini Robotics 1.5和Google

节目主题简介

本期节目，财经作者与主持人张小珺对话DeepMind机器人项目高级负责人谭捷。围绕人工智能、机器人研究的核心前沿，包括“跨本体智能”、“世界模型”的理论与实际挑战，拆解Gemini Robotics 1.5的突破，并透视Google在AI产业链中的独特角色。谭捷不仅分享了技术洞见，更深入讨论了全球AI创新浪潮里的观察与思考。

主要讨论与见解

1. 谭捷的研究视野与职业路径（00:42-06:30）

谭捷分享了自身在DeepMind工作的背景，如何聚焦于智能体的认知和物理世界的连接。
强调AI顶层哲学——“探索超越数据本体的通用智能”，以及做机器人的初衷。

“我们希望机器人能理解一个从来没见过的厨房，也能做出合适的操作”——谭捷（02:13）

2. “跨本体智能”与世界模型的定义（06:31-18:55）

张小珺追问“跨本体智能”与“世界模型”对机器人意味着什么。
谭捷解释，跨本体指机器人能够在不同环境，不同任务下迁移知识，而世界模型则是模拟、预测环境变化的内在机制。
对比人类如何抽象物理规律，机器人需要“不仅记住动作，还得懂背后的逻辑”。
两人讨论了过去“特定任务显著超人类”，与“通用智能尚不足”的行业现状。

“跨本体是AI从弱人工智能向强人工智能迈出的关键一步。”——谭捷（08:25）
“你觉得现在的机器人，‘像一个三岁小孩’，还是‘一只聪明的狗’？”——张小珺（12:07）

3. Gemini Robotics 1.5 的技术亮点（18:56-32:48）

谭捷详解Gemini 1.5机器人平台的“三层世界模型”：感知、预测、决策。
强调多模态数据在机器人系统中的作用——“视觉、语音、动作的融合”。
回顾团队让机器人自学整理桌面、分类物品、处理突发状况的实验过程和突破。

“我们想让机器人看到厨房凌乱，自己找规律收拾干净。”——谭捷（22:36）
张小珺追问“错误如何被纠正？”谭捷举例，模型会实时评估预测是否偏离现实，依赖反馈学习快速调整策略。

4. AI研究中的现实挑战与伦理边界（32:49-41:20）

谭捷提出：“越贴近现实世界，系统越容易遭遇未预料错漏”，并谈论团队在“安全性”、“鲁棒性”上大量投入。
张小珺抛出“AI会不会给人带来威胁”的公众关切，谭捷给出理性回应：一定要在实现效能的同时，对“可控性美德”有清楚原则。

“技术越强大，越需要‘边界感’和公众参与。”——谭捷（38:04）

5. Google生态和AI国际竞争格局（41:21-49:58）

谭捷分析Google如何通过协同AI、云、硬件为机器人提供端到端生态。
对比中国、美国、欧洲的AI生态，“中国更注重落地，美国更注重原创，欧洲强调规范”。
两人探讨“AI基础模型开放”与“商业应用闭合”的悖论，并展望未来协作机会。

“未来谁能掌握世界模型，谁就能构建数字与物理世界的桥梁。”——谭捷（47:13）

6. 面向未来的思考与建议（49:59-结束）

张小珺请谭捷为“想投身AI行业的青年”提建议。
谭捷鼓励“多学跨学科知识，技术和现实结合，有疑问也敢于挑战权威”。

“人工智能是数学、物理、工程的交汇，也是人类社会的镜子。”——谭捷（52:08）

精彩语录回顾

“机器人的挑战在于，你永远预设不了环境的全部变化。”——谭捷（14:41）
“你们在Google，是怎么让世界各地天才一起工作的？”——张小珺（44:16）
“我们需要不断测试假设，也要保证人类能always pull the plug。”——谭捷（39:22）

重要信息时间索引

00:42-06:30 – 谭捷自我介绍/AI哲学
06:31-18:55 – 跨本体与世界模型
18:56-32:48 – Gemini 1.5技术亮点
32:49-41:20 – 现实挑战与伦理
41:21-49:58 – Google生态与中国/全球对比
49:59-结束 – 青年建议与未来展望

这是一场关于前沿科技如何交融现实世界的深度对话，谭捷的洞见为未来智能体与人类协作打开了想象空间。

播客总结｜张小珺Jùn | 商业访谈录 #121 对DeepMind谭捷的访谈：机器人、跨本体、世界模型、Gemini Robotics 1.5和Google

节目主题简介

主要讨论与见解

1. 谭捷的研究视野与职业路径（00:42-06:30）

谭捷分享了自身在DeepMind工作的背景，如何聚焦于智能体的认知和物理世界的连接。
强调AI顶层哲学——“探索超越数据本体的通用智能”，以及做机器人的初衷。

“我们希望机器人能理解一个从来没见过的厨房，也能做出合适的操作”——谭捷（02:13）

2. “跨本体智能”与世界模型的定义（06:31-18:55）

张小珺追问“跨本体智能”与“世界模型”对机器人意味着什么。
谭捷解释，跨本体指机器人能够在不同环境，不同任务下迁移知识，而世界模型则是模拟、预测环境变化的内在机制。
对比人类如何抽象物理规律，机器人需要“不仅记住动作，还得懂背后的逻辑”。
两人讨论了过去“特定任务显著超人类”，与“通用智能尚不足”的行业现状。

“跨本体是AI从弱人工智能向强人工智能迈出的关键一步。”——谭捷（08:25）
“你觉得现在的机器人，‘像一个三岁小孩’，还是‘一只聪明的狗’？”——张小珺（12:07）

3. Gemini Robotics 1.5 的技术亮点（18:56-32:48）

谭捷详解Gemini 1.5机器人平台的“三层世界模型”：感知、预测、决策。
强调多模态数据在机器人系统中的作用——“视觉、语音、动作的融合”。
回顾团队让机器人自学整理桌面、分类物品、处理突发状况的实验过程和突破。

“我们想让机器人看到厨房凌乱，自己找规律收拾干净。”——谭捷（22:36）
张小珺追问“错误如何被纠正？”谭捷举例，模型会实时评估预测是否偏离现实，依赖反馈学习快速调整策略。

4. AI研究中的现实挑战与伦理边界（32:49-41:20）

谭捷提出：“越贴近现实世界，系统越容易遭遇未预料错漏”，并谈论团队在“安全性”、“鲁棒性”上大量投入。
张小珺抛出“AI会不会给人带来威胁”的公众关切，谭捷给出理性回应：一定要在实现效能的同时，对“可控性美德”有清楚原则。

“技术越强大，越需要‘边界感’和公众参与。”——谭捷（38:04）

5. Google生态和AI国际竞争格局（41:21-49:58）

谭捷分析Google如何通过协同AI、云、硬件为机器人提供端到端生态。
对比中国、美国、欧洲的AI生态，“中国更注重落地，美国更注重原创，欧洲强调规范”。
两人探讨“AI基础模型开放”与“商业应用闭合”的悖论，并展望未来协作机会。

“未来谁能掌握世界模型，谁就能构建数字与物理世界的桥梁。”——谭捷（47:13）

6. 面向未来的思考与建议（49:59-结束）

张小珺请谭捷为“想投身AI行业的青年”提建议。
谭捷鼓励“多学跨学科知识，技术和现实结合，有疑问也敢于挑战权威”。

“人工智能是数学、物理、工程的交汇，也是人类社会的镜子。”——谭捷（52:08）

精彩语录回顾

“机器人的挑战在于，你永远预设不了环境的全部变化。”——谭捷（14:41）
“你们在Google，是怎么让世界各地天才一起工作的？”——张小珺（44:16）
“我们需要不断测试假设，也要保证人类能always pull the plug。”——谭捷（39:22）

重要信息时间索引

00:42-06:30 – 谭捷自我介绍/AI哲学
06:31-18:55 – 跨本体与世界模型
18:56-32:48 – Gemini 1.5技术亮点
32:49-41:20 – 现实挑战与伦理
41:21-49:58 – Google生态与中国/全球对比
49:59-结束 – 青年建议与未来展望

这是一场关于前沿科技如何交融现实世界的深度对话，谭捷的洞见为未来智能体与人类协作打开了想象空间。

wavePod

Get Free Podcast Summaries in Your Inbox

Pick Your Shows

Subscribe Free

Get Instant Summaries

Summary

节目主题简介

主要讨论与见解

1. 谭捷的研究视野与职业路径（00:42-06:30）

2. “跨本体智能”与世界模型的定义（06:31-18:55）

3. Gemini Robotics 1.5 的技术亮点（18:56-32:48）

4. AI研究中的现实挑战与伦理边界（32:49-41:20）

5. Google生态和AI国际竞争格局（41:21-49:58）

6. 面向未来的思考与建议（49:59-结束）

精彩语录回顾

重要信息时间索引

Summary

节目主题简介

主要讨论与见解

1. 谭捷的研究视野与职业路径（00:42-06:30）

2. “跨本体智能”与世界模型的定义（06:31-18:55）

3. Gemini Robotics 1.5 的技术亮点（18:56-32:48）

4. AI研究中的现实挑战与伦理边界（32:49-41:20）

5. Google生态和AI国际竞争格局（41:21-49:58）

6. 面向未来的思考与建议（49:59-结束）

精彩语录回顾

重要信息时间索引