Summary1 min read

张小珺Jùn｜商业访谈录 #118
对李想的第二次 3 小时访谈：CEO大模型、MoE、梁文锋、VLA、能量、记忆、对抗人性、亲密关系、人类的智慧
2025年10月30日

节目主题概览

本期为理想汽车创始人兼CEO李想三小时深度访谈（2025年春录制，完整版首次播出）。穿插“AI大模型公司CEO”视角，将李想视作一个具有MoE（Mixture of Experts，专家混合架构）的超级AI模型，探讨理想的组织、智能进化、人与AI、工作与生活、能量与亲密关系，以及对未来商业与人性的深度反思。
访谈穿越AI变革节点，以敞开的表达与密集的信息，讨论AI产业的底层逻辑、技术、组织与价值选择，既有行业技术干货，又有个体成长与人文关怀。

重要议题与精华内容

1. 人与AI的关系：模型类比与能力互补

李想用通用Agent/AgentOS的概念设定方向，对比人类大脑与当下AI模型的异同，提出“人类像更小的模型”、“人类做商减、AI做商增，各自扬长避短”。
“人工智能非常擅长处理足够大的信息，包括今天预训练的数据规模。”（06:35）
人类获取知识的过程类似AI的预训练、推理，个人像专精领域的小模型，AI则需向专用模型突破——对未来生产力工具提出高要求。
“人类要做商减，不要做商增。AI更适合大规模复杂信息处理。”（07:40）

2. AI工具三重分级：信息工具—辅助工具—生产工具

李想详解：“信息工具”只是建议和参考，改变不了KPI、OKR，不影响实际绩效；“辅助工具”提升效率但无法替代关键工作；“生产工具”才能替代人产出核心绩效，这才是AI爆发的临界点。（17:25）
目前唯二能作为初级生产工具的，是Cursor（程序员用）和Opera的DeepResearch（战略团队用）。
“愿意付费是生产工具的底线。”（21:00）
“AI只有变成生产工具，才是爆发时刻。现在AI爆了以后，大家都更‘卷’了，结果工作时长没降反增。”（23:21）

3. Agent、AgentOS与自动化的未来

生产工具必须能够“知行合一、有action能力”，才真正产生效益，否则大模型永远停留在做决策建议。（24:40）
理想对AgentOS的定位是专业分工的“底座”：“五年内不会有通用Agent，只有AgentOS，方便各专业开发自己的Agent。”（66:00）
对专业大模型（如 VLA — 司机大模型）的未来深度展望和产品战略拆解。

4. 理想的学习：DeepSeek学习曲线与开源故事

深度点评DeepSeek带来的范式变化：“开源让我们节省了9个月研发周期，省了几亿成本，这是纯粹的感激，所以我们的OS也随即开源。”（52:02）
DeepSeek对人类“最佳实践”的演绎包含四步：先做研究、再研发、做能力表达、最终转为业务价值。
“研究等于能力。在模型时代，认知容易转为产品能力，搞研究是开认知、解锁能力的唯一途径。”（119:07）

5. VLA（Vision-Language-Action）大模型与自动驾驶架构演进

讲述从规则算法到端到端、再到VLA的三阶段进化，将AI类比动物智能、人类智能升级过程，提出人类式的“司机大模型”叙事（82:30）
详细论述训练流程与技术难点，从数据集、MOE专家、蒸馏、RHF强化、世界模型三阶段全景展开。（90:15、100:20）
“做自动驾驶其实就是‘造司机’，不是造人！”（92:45）
对端到端架构的作用和VLA的不可替代性作自我批判与反思：“没有办法直接摘第十个包子，每个技术台阶都绕不过去。”（110:05）

6. 人性与卓越、组织进化与能量管理

“对抗人性”是组织成长的核心：“人类的最佳实践是反人性的，随心所欲才是顺应人性。”（63:50）
分享如何打破“个人英雄主义”，通过3~7人团队形成支撑，“像MOE架构一样，组织靠三到七人的能量场组合稳定最强。”（117:45）
“能量是企业最核心的资源。三人支撑＞二人，超过七人就会分散。”（118:15）

7. 家庭观与亲密关系、内在成长

从家庭和亲子关系谈到个人成长、能量和幸福感的来源，提出“成长带来能量”，“人是用来发挥的不是用来改变的”。
“亲密关系里首先是我需要你，而不是你需要我。需求表达是能量产生的起点。”（122:10）
“孩子让你明白，优秀的人是用特长发光，而不是改造来的。”（125:15）

8. 智慧与人类未来

智慧被定义为“处理与万物关系的能力”，AI只能提升智能，人类提升智慧才有未来。
“AI短期内不会拥有自主意识，对人类是安全的，但未来如果换新架构，则未知。”（135:42）
“人类如果不提升群体智慧，AI智能一定会超越，只有智慧保持制高点才能继续领导文明。”（145:22）

9. 反思与自省、成长驱动力

李想坦言自己“技术CEO不是学理驱动，而是工程直觉和结构性提问优势。”（127:02）
“我的成长动力，是挑战掌控自己的命运和成长的极限。通过成长，为用户创造价值，是我的因果链。”（126:30）

选摘名言与金句（含时间标记）

“人工智能只有变成生产工具，才会真正爆发。信息工具、辅助工具都还只是过渡品。” — 李想 (23:30)
“你比我聪明十倍拿勺子挖坑，我拿铁锹挖，我再笨效率也比你高。工具比天赋更重要。” — 李想 (27:40)
“人类的最佳实践往往是反人性的。随心所欲，满足人性，才能组织不断内卷。对抗人性，才会有卓越。” — 李想 (63:52)
“成长带来能量。关注人的成长，而不是只关注事。” — 李想 (122:10)
“人类是用来发挥的，不是用来改变的。连孩子都不能改变，更别说员工了。” — 李想 (125:35)
“做企业的最大反人性，就是每次遇到大问题都敢做巨大变化。” — 李想 (115:20)
“智慧就是处理与万物间的关系。人如果不提升智慧，AI必然超越人类。” — 李想 (145:19)
“研究等于能力，在模型时代认知可以迅速转为能力。” — 李想 (119:07)
“亲密关系不是靠数量，三到七人的组合最有能量。” — 李想 (118:15)
“信任与理解，是好司机agent的金标准。” — 李想 (114:21)
“愿意让AI agent做生产工具，基础是用户‘愿意付钱’，这就是判据。” — 李想 (21:12)
“对团队、伴侣、孩子都一样，关注人的成长、能量和关系，是最高的管理之道。” — 李想 (124:45)
“AI的能力越强，责任越大，必须强化对齐，像职业司机一样规范。” — 李想 (105:19)

结构化时轴与重要段落索引

[04:00-08:00] 以AgentOS宏观设定，对比人类大脑与AI
[13:00-26:00] 专业模型信息工具-辅助工具-生产工具三分法
[29:00-52:00] DeepSeek和开源，行业范式与能力加速
[60:00-90:00] VLA：从数据到架构全景剖析，端到端进化、MOE
[100:00-120:00] 世界模型、AI对齐、人类式组织能量
[122:00-126:00] 家庭、亲密关系、人的成长与能量
[127:00-135:00] CEO成长驱动力、技术自信与问题结构分析
[140:00-155:00] 对智慧、社会组织、教育与人类未来的思考

访谈风格与语言氛围

全程保持理性但具温度、极具自省精神。语速快内容密集，大量工程、方法论案例，讲故事也讲方法。
张小珺作为财经媒体人精准提问，语气平和但追问深入，频繁调动不同“专家角色”，推动李想从“CEO大模型”、技术专家、战略专家到人生导师切换。

推荐收听人群

AI技术与应用关注者、科技创业家、企业管理层和产品经理，关注中国AI生态及大模型进展的业界人士，以及对个体成长、组织管理和人文反思有兴趣的跨界听众。

本期播客极具信息密度，将AI行业最前沿趋势与企业家成长、组织管理、个人与社会智慧融合一体，是理解中国AI产业变迁与组织模型演化不可多得的第一手材料。

Loading summary

Transcript3 lines

[00:05]
A
我觉得给通用Agent换个描述方式我觉得通用Agent比较好的描述方式应该是AgentOS我觉得五年之内没有通用Agent会有一个AgentOS苹果是201年推出的iPod在20年的时候它已经有苹果电脑已经有操作系统然后已经有软件的生态了但那时候我印象苹果的收入只有几十亿美金对于苹果那个时代其实我们的规模已经做这些东西其实是个合理的了上次我问你理想有理想吗那这次想问你你对理想的设想会不会太过于理想我觉得我们理想会因为什么消失刚才我说的那三个点都会消失对然后一个卓越的组织然后一个卓越的人很多时候其实要跟人性做对抗Hello,大家好,欢迎收听张小军商业访谈录,我是小军。这是一档由语言及世界工作室出品的深度访谈节目,我们希望和你一起从这里探索新世界。 2015年4月,我与理想创始人兼CEO理想录制AITalk第二季。那次对谈持续了很长时间,播出版仅一个小时,今天你看到的是完整版。这期节目的发布比预期晚了一些,过去几个月实在太忙了,我一度犹豫要不要继续放出来,但是当我重新整理这些内容的时候,仍然被它所打动,这是一份关于人工智能技术变革的节点式的思考存档。
[01:49]
你可以结合204年底我们那场三小时谈话一起观看感受两次对话之间思考的延展与呼应这次呢我把理想当作一个CU大模型来提问假设它是一种MOE架构的模型也就是专家混合模型我们在对话的前三个回合调用了它的三位专家技术专家战略专家组织专家而當談話深入到後半程,我們開始談論人、能量、親密關係、記憶程序與人類的智慧AI與人的關係是本次對話的目的我們今天來做一輪LongContext的長文本對話假設你是一個大模型你現在能支持的上下文窗口有多大你看Google和OpenEye現在都能支持的是10萬個token那你呢我覺得人類的整個的生理的特點然後和人工智能是有本質的差別的人類並不擅長處理特別複雜的信息所以呢我們經常講人類要做商減而不要去做商增那我覺得人工智能非常擅長處理足夠大的信息包括今天預訓練的規模這個數據規模已經不是15T了現在已經開始有30T的最新的拉馬斯這樣的所以我說這是一個本質的差異所以從這個角度而言包括人類發明方法論人類使用各種工具都是為了減少能量的消耗因為大腦也要消耗能量的所以我說這是人類的一個特點所以從某種程度上而言人類應該和AI是個非常好的友好關係各自做各自擅長的事情總體來說你是覺得人不像模型人可能像更小的模型吧我們去讀很多書去學習很多知識其實某種端也像是預訓練我們把這些知識能夠變成業務去做然後本身也像推理並通過推理去調用各種工具然後去實現我覺得人類可能像一個更小的模型而且就是上完不同的專業的學習之後不同的人進入了不同的領域所以它不是一個巨大的一個基座大模型對就像今天人工智能也是一樣的那處理一些通用信息還很好但一到一個專業領域裡邊往往其實有很多時候明顯不如人了因為這個領域裡邊然後它需要更高質量的數據它需要更專業的COT我覺得這個其實都是接下來人工智能下一步發展的然後要去解決的挑戰和價值所在距離上次的AITalk過去了130天你最大的進步是什麼你有成為一個更智能的理想嗎這130天我覺得更高興看到的是整個中國的進步我覺得包括deepseeker包括千萬在內的可以讓中國的無論是基座模型還是reasoning的推理的這個模型還是後邊的多模態我覺得已經跟美國距離基本上拉近了或者基本上在一個水平線上了而且中國的企業做出來這些模型效率更高無論是在訓練的層面還是在後邊的整個推理層面我們做了很多的深層的工程的這樣的一個改造然後我覺得也讓整個的中國的人工智能領域然後其實更有信心包含後邊的話我覺得我看到一些比較欣喜的在Agent上面的一些突破無論是Manus還是G-Spark我覺得其實這些方面做的都非常的好所以我說這個其實看到非常驚喜的我覺得這也樹立了我們其實把AI做得更好的信心今天大家在講語言模型語言模型但我還認為語言模型只是世界的一個重要的組成部分但並不是全部我们要想去理解物理世界然后我们要想让一个终端或者一个机器人能够在物理世界和数字世界里来运行其实要做的工作还要非常多我觉得这个其实是更加坚信然后这条路走下去是对的那你有变成一个更智能的理想吗我觉得没有那么大的变化然后如果从实际的角度而言对人工智能发展这么好但我每天工作时间并没有减少还是在增加是啊這是為什麼身邊的所有的這些同事啊朋友啊對然後大家都講人工智能怎麼好人工智能怎麼好但是大家工作時間並沒有減少工作成果也基本上沒有什麼實質性的改善那我覺得這時候我們得思考一下這樣一個新的技術的發展階段的一個問題那如果其實從今天這種chatbot啊或者這種對話的這種方式包括後來大家普遍也會把整個的reasoning推理都用上以後然後能夠做一些更長鏈條的這種思考和這種推理的任務的時候但是你也能看到它一些嚴重的問題就是它大部分人在使用或者說我見的幾乎所有人使用其實還是在把它當成一個信息工具來使用如果是信息工具的話其實AI作為一個信息工具不是完美的因為它最後一定要給你一個nexttoken一定要給你一個結果而且大家今天使用的時候會先點上聯網搜索通過RAG做聯網的搜索一些索引信息但往往其實索引的信息源就已經失真和不準確了所以最後推理的過程很認真在做推理但是你明顯都看到這個過程和結果已經開始有問題了所以某種程度而言不對這個機制進行一個改造的話它某種程度而言是在做商增對再增加大量的無效信息無效結果無效的結論而且這個世界上充滿了幻覺遍布了有幻覺的信息對然後包含你看非常有意思比如說其實DeepSeek剛推出的時候我們能看到很多人會把DeepSeek的一個推理過程然後轉成了圖片放在小紅書上很多人去看那今天沒人發這些東西了因為發了沒人看了因為這些東西都是千篇一律的那我覺得這是一個很大的挑戰所以我就在思考一個問題因為還是要站在真正的用戶價值的角度如果大家在拼命的使用AI大家在為AI做投資然後我的工作時長並沒有減少我的工作結果也沒有變好那這個問題到底在哪裡對所以我覺得這是也是過去幾個月我跟很多人在聊啊在思考我們內部在討論非常多的一個問題所以呢我覺得很多時候不要把東西纏到一起我們可以先做一個分類因为人类历史上也会有类似这些的分类那今天的话通过一个对话的方式无论文本多么长其实它都是个信息工具然后我觉得信息工具的话对大家而言更重要的其实是一个参考作用那为什么呢因为你拿出这个给你一个股票投资的结论或者给你一个职业生涯决策的结论或者给你一个工作的结论但是你真正在工作的时候你每天花小时的这个工作的时候你还是优先会去完成公司给你的kpi公司给你的okr那其實如果你沒有改變這些東西其實其他的東西並沒有改變它的整個工作效率和工作成果只是給了一個建議或者在腦子裡空轉了一圈那所以我這是信息工具的一個狀況那再往下呢其實AI變好了以後它會變成一些輔助工具比如我們今天做的輔助駕駛大家在我們車上再用人工智能旅行的方式來進行導航來查找美團來調取音樂它會讓我們的效率更高但它仍然離不開我們所以這時候這種決策比較像什麼呢它確實比原來的使用體驗會更好了它是個輔助的一個工具那我覺得什麼時候才能真正改善我們的工作的成果以及延長我們的工作時長我覺得它必須變成生產工具而且我自己認為agent最重要的評判條件就是它是否是個生產工具它是否真正能替代我去完成专业的工作它是否真的在产生有效的生产力或者它是否真的在解决我工作中那最重要的8小时的时间我觉得这个其实是我认为接下来对agent最重要的一个衡量也是agent的意义所在这是你对于工具的三个分级信息工具辅助工具和生产工具对我觉得人工智能变成生产工具然后才是真正人工智能爆发的时刻我也有这种感觉啊就是AI来了以后越来越卷嗯就是大家的时间全部都在加班嗯你觉得到今天为止没有任何一个AI产品满足了这个成为生产工具的基础条件对吗嗯有一个两个产品就是它可能已经挨上了生产工具的边没有我经常问我们的同事对我说一个CC工具往往你并不愿意付钱嗯一个辅助工具你认为是一个产品应该带的对吧因为辅助工具就是只是提升了现有的产品的竞争力生产工具一个很重要的衡量特点就是你愿意为他付钱我覺得這才是生產工具反正我目前從同事身邊聽到的真正的有效的他們認為算一個初級的生產工具的一個是Cursor然後一個是Opera的DeepResearchCursor主要是我們的編程的同事們都在使用然後DeepResearch是我們的商分和我們的戰略團隊在使用他們是自己付費的並沒有花公司的錢這很有意思啊就是為什麼到今天所有的AI產品還沒有成為生產工具呢你覺得是因為智能水平不夠嗎我覺得生產工具的話比如說生產工具的要素是什麼呢怎麼樣能夠成為一個生產工具我覺得必須有action不能只是知必須行對然後知行合一才可以就是今天你用ORO3多麼聰明然後你用DeepSeekerR1這些都多麼聰明但其實它並沒有真正的去行動它只是給出來你策略並做策略的推演我工作的時候我還是要通過操作電腦然後去處理很多工作或者通過一個物理世界的東西去處理工作所以我覺得它必須得有行動行動才能產生價值所以像Manus其實它就已經在行動上做了很多的工作了其實包括自動駕駛是控制一個機器在物理世界然後去行動我覺得必須得能夠行動然後才可以你怎麼看Manus這個產品我自己覺得它是往生產工具對然後就是從整個產品的創意上而言是往生產工具走的最大的一步對然後包括他們通過建虛擬機包括去調用工具比如今天有一個挺大的一個問題就是至少很長一段時間所有的模型公司都認為其實不需要軟件不需要工具對然後最後模型都能夠去替代掉對那我拿人舉個例子你比我聰明十倍然後你拿勺挖一個坑我拿鏟子去挖一個坑對我再笨我效率都比你高我要是比你聰明十倍我不會拿手去挖呀但是因為你沒有工具而且呢工具意味著其實更高的確定性然後更低的這種能量啊和torque的一個消耗很多時候就這兩個並不衝突更好的大腦和使用更好的工具並不衝突而且由於腦子變強以後工具可以變得更強其實Miner是從雕用工具的角度去完成各種工作比如分析特斯拉股票去瀏覽SEC的網站去瀏覽特斯拉的投資者關係的網站直接去閱讀最top的各個投行的分析師關注特斯拉這些人的分析報告而不是只是簡單通一個RAG然後就作為信息的索引我覺得這個更像是真正的專業的工作人員和生產工具要做的一個方式只是他們作為一個通用Agent覆蓋的面太廣了這就是個很大的挑戰為什麼這樣的一個Agent可能是一個創業公司做出來的你有想過嗎我個人感覺如果在一個新技術產生的時候反而会造成过去的这些大公司或者创业公司里的这些大公司会把分工分得太精细了但往往其实产品是多个东西的组合才能变成一个好的产品那如果模型的人认为我就要做好模型我要用模型解决一些问题一切问题对吧那其实这个就会变成非常大的一个挑战我刚才跟你们聊的是就是过去130天理想的进步是什么那你回答了我很多就是关于你的最新的思考那你觉得过去130天理想这家公司最大的进步是什么呢它有成为一个更智能的组织吗我觉得我们没有那么快的变化对就刚刚才讲的其实这是一些重要的一些突破然后我们要想我们作为一个其实三万多人的企业那我们如果想要发生很多重要的一个变化还是得围绕真正的用户价值能够发生的变化去产生变化不能只是说技术发生了一些变化我就去改变我的组织我自己来看所有的变化之间的关系第一我会把什么把规模放到一个中心对因为规模是个确定性的我做10亿收入还做20亿的收入第二呢是在围绕这个规模外边其实有三个动态的变量我觉得一个是用户需求会发生的变化然後我覺得一個是技術產品發生的變化然後一個是組織發生的變化然後這三個之間的變化我會相互診斷如果只是技術產品發生變化但用戶需求沒發生變化其實我並不會上來就去調組織的很多時候是當我看到用戶需求在發生變化的時候產品技術的變化和用戶需求變化產生了結合的時候組織變化就必須跟上所以我說這是我們來看的否則我們不能因為任何今天出的東西我們就調整一下明天出的東西調整一下這肯定是有問題的所以過去130天其實最大的變化是外部的環境對國際環境在發生重大的變化本身的技術也在發生變化但技術最大的變化還是中國帶來的變化就中國在人工智能方面帶來的變化然後美國的變化反而沒那麼大你從DeepSeek上學到了什麼我覺得DeepSeek我能學到最好的一個方式DeepSeek運用了人類的最佳實踐它極簡的用了人類的最佳實踐比如说其实他在做DeepSeekv3的时候其实v3是一个MOE的6710亿的一个模型我觉得MOE是个非常好的架构对他相当于把一堆专家组合在一起然后每一个是个专家能力啊那包含他在做这专家能力是怎么来构建的其实挺明显的当我们想去构建能力的时候deepthinking展示了一个最佳实践就第一步一定要先搞研究对我觉得这是非常重要的就是任何的时候当我们想去改变能力和提升能力的时候第一步一定是搞研究然后搞完研究以后其实才搞研发然后搞完研发以后我觉得第三步是要把能力表达出来然后第四步是能力然后变成业务的价值所以这个四个步骤是个极简的人类最佳实践但我们经常做这就忘掉了对然后看到什么东西就直接去启动研发而没有去搞研究我们自己也很受益其实无论我们是在端道端和这个vrm上还是今天做vra的时候对然后我们的研究团队其实表现的非常好包括你可以看國外的像李飛什麼的其實他在引用自動駕駛的時候也經常會引用我們的關於自動駕駛方面的這些研究的論文我覺得這個其實同樣研究跑通了以後研發效率會變得非常的高但是研發又非常在意價值他能夠把價值表達出來然後變成業務對吧我覺得這是一個很重要的過程比如說我再舉一個例子像大家如果用我們的端到端我們是端到端上唯一給你展示的端到端是怎麼工作的对端端端然后是怎么来取轨迹的然后端端端的attention注意力是怎么工作的然后vrm是怎么工作的其实这本身是你的能力的一个展示能让你的使用者或让所有的参与者能够理解我觉得这是一个招呼和产品對這是技術才能實現的今天在有模型有技術才能實現的這並不是簡單產品能實現的我覺得這是一個做得好的我覺得是DeepSeekV3的一個表現那DeepSeekR1又遵循了另外一個它是個reason它是個推理說白了其實它就是業務對吧它其實就是業務那業務就是沒有用戶就不是業務但是你可以看其實從它的整個思維鏈裡邊來看它又遵循了一個人類業務的極簡的最佳實踐对然后第一步是什么呢第一步其实先做索引分析这个用户给你个需求先做索引分析然后第二步是什么呢第二步其实是来确定目标因为用户很多时候给的是一个提示给的是一个方向会不会给出职业目标所以他通过分析完以后再来其实制定接下来要推理的一个目标然后第三个其实他会有出策略当然作为一个推理的一个reasoning模型其实他的整个策略本身也就是他的推演的执行了然后我觉得第四步他还有一个特别好的一点就是他会做一定的反思這個反饋就是看一看我最後的這個結果和目標之間的差異對吧那我覺得這方面其實他跟人做的非常像就人你要做一個業務的時候面向客戶面向用戶的業務的時候你要先做然後用戶市場的分析第二個你要針對用戶來確定目標然后第三个其实你要有策略然后并且其实执行第四步你要有复盘我觉得他特别好的做了一个最佳实践而且呢本身你可以想象一个模式其实就是在做raising的过程在做整个业务推理的过程中其实他是调多个专家一起来做的如果用到组织中也是非常好的一定是大家群策群力的然后去做分析群策群力的去制定目标群策群力的其实去制定策略并一起来复盘其实很多时候我们包括复盘又有问题我就去进行改正如果是业绩的差距我就继续增加分析调整策略也可以了如果是能力的差距我就去那边其实改善能力去又继续走研究那条路径对吧因为很多时候你如果能力不够然后硬推着去做业务其实也做不到所以我觉得特别好就是打個問號因為它這個不是完整的知行合一因為它是把行的策略給出來了但是它並沒有真正去做action比如控制一台機器或者控制一台電腦去操作軟件它並沒有這麼去做但是它某種程度上是個非常好的知行合一的這樣的一個腦系統我覺得這是特別好的一點因為它其實就是人類最佳實踐只不過人類我們經常坐著坐著就忘記最佳實踐了然後我們想拉動一群人一起去推進一個業務但就你一個人在做分析你一個人在制定目標然後又逼著大家去執行然後當你發現目標不對的時候然後你要改東西的時候你又沒去做覆盤然後也不做分析也不重新設定目標就直接去改策略那所有的參與者都說這到底發生了什麼我覺得這個其實就是很多時候人類反而沒有追尋自己的最佳時間然後包括人類去構建能力的時候他到底是應該改善能力解決問題還是其實改善整個策略解決問題其實人類今天很多時候就是大家很忙很辛苦但並分不清到底要解決哪些問題我覺得這個其實DeepSeeker做的特別棒剛才我們聊了那個人類最佳實踐的步驟啊你覺得你們最容易miss掉的是哪個最容易忘記的遺忘的是哪個那我覺得在做能力的時候大家比較容易的上來就搞研發既不去做研究研發完以後也不做能力的展示然後也不去真正的去面對市場的實戰就認為自己研發完了就擁有了一切那我覺得在業務的時候最大的麻煩在於其實大家遇到問題只想改策略然後不去做復盤不去做誘惑市場的分析也不一起來確定目標其實這些在做的時候每個人都想自己來決定就行了我自己來決定研發我自己來決定策略其實就可以了我覺得這個是最大問題因為嚴格的按照最佳實踐其實是反人性的隨心所欲然後才是滿足人性的所以我覺得一個好的組織然後一個卓越的組織然後一個卓越的人很多時候其實要跟人性做對抗那你應該怎麼把這個方法論貫徹下去呢我覺得我們從創業初期的時候就比較擅長去使用和學習方法論我們最開始的時候圍繞用戶的需求的時候為了讓大家統一我們建立了四步法從用戶的需求然後我們的需求然後目標策略來做分析其實跟這比較類似所以當我看到它背後的隱藏的這套人類最佳實踐的時候所以我特別的高興而且它比我們原來做的那個更完善一些比如它不會直接從用戶切入會先做分析就如果做業務的時候如果做能力的時候就更確定了我們過去很多年然後做的各種研究是對的我們做操作系統是做研究了我們做芯片是做研究了做了非常深入的研究工作然後我們在做短導端和V2M包括我今天做V2A都做了非常多的研究工作大家也可以看到非常多的論文包含機器人領域大家在講空間智能的時候包括這些各種的行業的大咖也都在引用我們的論文所以這也是你做好了研究工作你再做研發就會更加順利那因為你做完研發以後還要表達能力這時候能力的展示也非常好比如就像你看到我們的車的端到端和V2M我們是少有的企業能夠把人工智能是怎麼工作的講明白端到端是怎麼從感知到軌跡的選擇然後它的注意力Attention系統是怎麼工作的然後V2M又是怎麼拿語意去來理解ETC然後紅綠燈和複雜路況的我覺得這個其實是非常重要的能力的展示然後也包含這個能力最後要去變成真正的業務的結果就要去參與到業務去作戰去因為我們自己坐著坐著也經常會偏離了最佳時間但是我覺得它非常好的一個方式是說我們如何讓自己堅守最佳時間因為只有堅守最佳實踐我們才能構建出來最好的能力對然後只有堅守最佳實踐我們才能以用戶為中心然後構建出來最好的業務你怎麼看梁文鋒啊你覺得他是怎麼找到你說的這個人類最佳實踐的我只跟他聊過一次啊是去年的9月份應該印象特別深應該是ChinaGPT的OE發布前的幾天我自己個人感覺然後兩個特點吧第一個我覺得我覺得第一他是個特別自律的人很明顯你跟他溝通的過程中其實能夠看到然后第二个是我觉得我个人认为其实他会在全世界范围之内去研究和学习最佳实践和最好的方法论的这样的一个人怎么理解自律我觉得自律的最大特点就是能够坚守这些你相信的东西能够坚守这些最佳实践能跟人性的一些懒惰呀走捷径啊这些方面其实能够做对抗所以這是我的一個判斷所以也正是如此反而我覺得讓我們更加敬佩它然後包括我們的開源我覺得DeepSeek的出現對我們要加速做VLA是巨大的幫助因為Language就是語言模型這一塊對我們而言其實本身過去我們打算要到今年年底才能做出一個像樣的能夠滿足我們需求的語言模型但DeepSeek一開源整個加速了九個月的時間所以給我們帶來了巨大的收益和幫助這是我們受到了那麼大的幫助所以我們在想我們能對社會做點什麼貢獻所以我們就把這個操作系統也開源了沒有大家想的那麼複雜就完全我自己內心包括謝岩的內心就是DeepSeek給我們帶來了那麼大的幫助我們應該給對社會貢獻點什麼這是一個幾天的決定我想想就是很快的一個決定就是我們在做204年的業務總結會的時候操作系統團隊講了一下目前操作系統所有的進展包括我們的能力啊然後我們的性能跟AutoSight啊跟QNX這些對比第二個也包含我們對於成本的節省第三個我們對於各種國產芯片的支持這非常好因為這些團隊在做工作總結的時候都已經把能力講得很清楚了過去他們並不會講能力我們又從這些最佳實踐方法論上學到了很多東西然後又受益於DeepSeek的整個的語言和推理模型的開源然後又受益所以我們有這些能力这些能力又涉及到安全的问题那既然我们占了那么大的便宜节省了九个月对我觉得省了大概大几亿的这一个成本那我们能不能也对这个整个行业做些贡献不是让行业就那么卷对说白了纯粹是感谢DeepSeek所以这是一种情怀而不是一个公司战略对吗不是公司战略這很有意思啊DeepSig感覺帶來了更多的善良和善意是的是的那你覺得他們應該接這一波破電流量嗎我想問的問題是就是這波AI產品的護城河是什麼呢用戶的數據量能帶來護城河嗎因為DeepSig在過年的時候已經擁有了很高的DAU我只能講我的理解我的理解是他們的卡是有限的如果他們把卡都用來做推理那他們怎麼去做訓練他們怎麼去提升能力那我覺得其實今天距離我們想像中的通用人工智能其實很遠所以我覺得他們只保留了一部分卡來獲取一定量的用戶因為這些用戶的Query對他們是有幫助的但是太多了也沒有什麼意義但是留了更多的卡和資源還是繼續提升能力我覺得這個其實他們看的更遠你有沒有想過DeepSeek為什麼不是你做的我覺得我只能做最好的自己他的延長線其實就是從人工智能開始的因為他在哲大其實學的就是人工智能那是他的延長線而本身我也相信其實然後量化教育的公司對於整個的模型的能力然後對模型的理解對於後邊的本身的工程的能力不會比任何互聯網公司差甚至可能還要更強我很好奇啊在DeepSeek全球爆火的時候你這個春節是怎麼過的春節過得挺好的包括還帶著孩子去看《哪吒2》那其實我印象應該是1月20號DeepSeekR1上線的嘛然後開源啊我們也在研究DeepSeek很多東西為什麼做得好包括整個的訓練和推理的效率包括這些一個MOE模型然後部署上去對內存的這個佔用的這些挑戰然後也包含其實我們自己已經開始在這個芯片上來寫然後FP8的整個的工程的優化了然後因為我們自己有編譯團隊嘛那比較有意思的一點是我沒有上來敢跟模型團隊直接聊為啥對然後我先跟謝岩聊了一下我说我们本身要做VLAVLA有一个很重要的计划是到今年的9月份的时候能够做一个非常好的语言模型出来才能再往下去训练VLA但是今天看的话预测的我们到9月份做的模型能力是否比DeepSeekV3加RE更强我说至少我听到你们说的东西我说不如那个强而且它开源开得如此的彻底我们是否应该基于它的开源去做我们的这个V2A的L的部分并且呢我们基于这个L的部分比如说其实我在然后理想同学用的话可能就是个VL它没有A对吧就把vision和language其实放在一起对吧包括要做成端到端的运营的这样的一个方式对我觉得我们本来应该是9月份以后才能做这些工作我们是否应该站在巨人的肩膀上就去做了我心里说肯定应该这么做呀然後呢那時候我們比較擔心陳偉會怎麼想對吧因為這個壓力是挺大的我們發現陳偉比我們還堅決他說這個會加速我們往下一步的這個工作還是應該以這個為基礎然後加速VLA加速端到端的多麼態這樣的一個進展研究團隊也都在然後研究我們如何在芯片上也跑到同樣的訓練和推理的效率大家都在同步進行工作所以呢整個然後擁抱DeepSeek的這個過程比我們想像的要快所以這是今天其實我們VLA推出的速度也會比原來的預期的要快為什麼讓程維去向CTO匯報他的匯報關係改變了這個是在DeepSeek出來之後的變化對吧对因为这时候我们就意识到一个想一想就是我们然后会有三类不同的重要的业务一个是内部的各种办公什么的对吧他其实比较需要的其实是是language可能是language加一个agentOS的一个方式然后来实现对吧那我觉得这时候然后需要需要有其座对那我觉得另外一方面其实我们是理想同学无论是车机版手机版他需要多模态它又能看到物理的世界它又有事實的語言所以它應該是一個端到端的VL對吧然後如果我們要做自動駕駛然後我們要做工廠的這些機器人它其實就應該是一個VLA對吧那我覺得這三個是不同的那就跟其實今天大家可以看到有千萬的團隊或者OpenAI的團隊是一樣的就是它也會做多模態它也會做推理它也會做基座那我們其實也一樣的我們需要有一個團隊為我們不同的業務其實能夠做出適應的這樣的一個模型出來你為什麼一開始不敢跟模型團隊聊啊後來是怎麼聊的你開口第一句話還是啥因為讓大家用別人的開源需要一個心力很強的過程所以很多時候我說服團隊也是一樣的但發現他們並沒那麼在意我說他的開源程度基本接近Linux比安卓開放的多對吧這個安卓也是基於Linux開發出來的它有了它的對應的組件呀各種API什麼的對吧那其實我們基於這個language開發出來然後語言模型然後加這個一個agentOS給自己工作使用對吧我們做出來的這個東西其實變成多模態然後變成其實能調用各種的API的服務我們做出一個模型能控制機器人其實很像其實Linux上面又開發出了安卓或者其實各個專業領域的操作系統非常類似對我覺得這個其實還是希望舒服大家的但其實大家擁抱起來很快所以這是春節後做的第一個決定春節期間就做了決定了是上班之前做了決定了初幾啊初幾啊跟誰打電話了我覺得放假的應該是一月底就做出這個決定了對然後我跟夕顏打的最多的電話然後我們還有一個專門的人工智能的戰略小組我們就在裡面不停的聊發現大家並不糾結我們家企業的基因還是要為用戶推出最好的產品和服務對在春節之後很多人都來問我這個問題就說林霞還做基座模型嗎既然都有DeepSeeker為什麼還要做基座模型呢因為我們的業務然後我們的業務意味著其實我們並不是說只是做好語言模型就夠了对吧然后我们车上其实要有对话然后又有多模态那这个仍然其实需要我们自己去训练一个根据我们自己需要的然后一个基础模型对然后包括我要去做VLA对吧然后因为这个VLA里边哪怕V和L都和正常的是不一样的我需要有3D的Vision還有高清的2D的Vision的然後Token要用於訓練然後我要必須的涉及到其實更專業的車領域的然後這個語意語料交通語的語意語料還有我們面向的家庭用戶的語意語料然後來做訓練還有包含其實還有很多時候一個重要的是說大家在做V2A訓練的時候是很多時候在做基座的時候說我要把V2要連在一起然後把V2的組合語料放進去那這些無論是OpenAI還是DeepSeek它都沒有這樣的數據然後它也沒有這樣的場景和需求也不去解決這樣的問題那只能我自己來做了只是好處是說然後VLA裡邊的這個Language其實然後我可以站在巨人的肩膀上但是它只是我其中的一部分所以一方面是擁抱了DeepSeek另一方面你們把基作模型的團隊還拆出去了並且加大了投入是嗎加大了投入加多大我觉得首先训练卡比他们今年的预期我们应该多买了三倍你要训多大的模型呢并不是一个固定的它会有不同的版本比如说我们其实然后给理想同学用的会是一个30B的模型就大概是个30亿的模型然后我们给自动驾驶然后运用的VLA的其实VR的部分然后是个32B的模型對那包含其實我們然後真正工作中用的也會去用那個然後就30幣的30億的這個模型就大概現在是這樣的兩個版本嗯你現在覺得給基作模型打多少分你希望205年提升到多少我去結果還沒呈現呢對這才幾月呀這才幾月呀對然後我就沒有什麼我覺得沒有什麼捷徑我覺得還是我認為其實雖然我們禁用了一些能力但是你沒有辦法直接去摘第十個包子就是如果你規則算法都做不好你根本不知道怎麼去做端到端如果你端到端沒有做到一個非常極致的水平你連VRA怎麼去訓練都不知道那剛才我們說的是基座模型我們接下來聊聊理想同學你現在對於理想同學這個App的定義發生了變化嗎因為去年我們AITalk的時候是剛好宣佈要把理想同學這個App推出來的時候我覺得就DeepSeek太強了對而且還有一波接著DeepSeek能夠推流量的像騰訊的元寶這些東西太強了對吧然後它有流量因為我對團隊講的說我覺得現階段不要去做任何推流就不要去做推廣不要去做營銷我覺得現階段還是然後更重要的其實是鍛煉能力然後是看是把握用戶的需求那其實我們今天是有三個版本車機上有理想同學對然後所以它既是一個既是一個AI的信息工具也是AI的一個輔助工具那我們在手機上有理想同學APP它今天還是一個純粹的信息工具只是這兩邊的其實已經可以連在一起了然後我們還會有一個在電腦上然後也可以使用還有網頁版的然後理想同學我覺得我們先把這三個其實我們自己的這120多萬用戶當需要使用的時候就是它可以連在一起來進行使用我覺得大概是這麼一個狀況今年2月5號也就是春節之後你們的第一個AI的例會你說DeepSeek更像是Linux推出而你們要去追逐安卓時刻你們準備怎麼去爭奪安卓時刻比如說我這個東西是一個比喻比如說安卓相當於其實是基於Linux開發出來的一個手機的操作系統有了一個語言作為基礎我們的VLA就是我們把Vision這部分做成最強的然後把Action也做好並藉助了L語言的能力我覺得VLA就比較像在汽車或者交通領域的我覺得更重要的一個大冒險或者操作系統我覺得這是我們的機會所在我今天很想把你當做一個CEO大模型啊因為大模型的架構有MOE架構嘛然後E就是專家我們先來調動一下技術專家我們來聊聊你們最近在做的VLA的架構今天的智能駕駛其實走到了一個新的十字路口上有的人說甚至覺得智能駕駛應該被叫停你怎麼想我觉得我们这么多年然后从规则算法然后做到了端到端加VLM然后又今天其实真正的迈入到了VLA的这样的一个阶段我觉得比较像什么比较像黎明前的黑暗吧对然后我觉得黎明马上就要来了对但是呢他会先经历一个黑暗的过程然后之所以有黑暗是因为要迎来黎明我觉得这是今天这么一个然后一个阶段我覺得正因為智能駕駛然後行業遇到了問題所以我覺得我最喜歡最開心的方式然後就是去解決行業解決不了的問題我覺得這是我自己堅決然後相信的就跟我們推出增程就是為了解決電池成本高然後充電難的問題我們推出5C也是為了解決充電慢然後等待時間長的這樣的問題我覺得我們願意去解決各種行業遇到的問題包括我們做操作系統也是因為過去的時候傳統的那種車控和制控的操作系統整個的性能差然後開發緩慢然後芯片匹配起來周期長的這些問題我覺得這些問題恰恰是我們的價值所在為什麼人類一定需要智能駕駛呢為什麼科技不能就此止步呢我覺得只要人類會雇用司機那我覺得人工智能技術其實就是把類似這樣的一些功能和角色去變成真正的生產力生產工具然後去進行替代什麼是VLA從用戶語言來講不要用技術語言因為VLA大家機器人領域也在講那我們講的是如果對於我們理想汽車產業VLA是一個司機大模型是能夠像人類的司機一樣去工作的一個模型那我覺得到達VLA它不是一個突變的過程其實它是一個進化的一個過程那經歷了其實三個階段我覺得第一個階段是我們從201年開始然後通過積極學習的感知但配合後邊的規則算法包括規劃控制執行這些規則算法分段式的那我覺得這個階段第一個階段比較像什麼比較像昆蟲動物的智能然後他有既定的規則包含還要依賴於高清地圖就比較像螞蟻的然後一個行動和完成任務的一個方式他能理解的世界也很有限非常之有限然後我覺得這是第一個這階段而且效率比較低也是個很麻煩的事情他就它就這樣一個規模的腦子包括它的整個模型規模大概就只有幾百萬的一個參數它就那麼小的一個腦子你讓它去完成複雜的事情幾乎不可能的所以你就不停地限定限定限定幾乎把它做成了一個有軌交通的方式然後這跟螞蟻非常相似第二個階段就是我們從203年開始搞研究204年推出的端到端端到端比較像什麼呢端到端比較像哺乳動物的智能比如像馬戲團裡的這些動物然後向人類學習怎麼騎自行車他學了人類的這些行為然後人類怎麼去做出各種的影響行為的這種開車但是他對物理世界並不理解他只是看到了什么样的一个三维的图像然后并知道自身的速度并给出了一个什么样的轨迹虽然他应付大部分的犯法是没问题的然后去面对他从来没有学到的然后特别复杂的那其實就會遇到問題所以這時候我們也會配合世界語言模型VRM放進來但是我們能夠用到的世界語言模型這些開源的它在用在交通上的能力都非常的有限所以只能起到一些非常有限的輔助的作用我覺得這是第二個階段就是動物的這個哺乳動物智能的這樣的一個運作的方式我覺得到了VRA我觉得就是完全人类的运作方式了他会像人类一样的然后用3D的Vision和2D的组合然后去看整个真实的物理世界也包含他能够去看懂导航软件这样的软件是怎么在运行的而不是像VRM那樣只能看到一張圖片另外一方面它有自己的整個的腦系統能夠去不但要看到物理世界還能夠理解這個物理世界它有它的LANG位置它有它的COT推理這樣的一個能力我覺得第三個它能夠像人類一樣的去真正的去執行這樣的行動我覺得這個其實是VLA產生的一個所以我們稱之為如果放在我們的汽車的自動駕駛智能駕駛領域我們把它稱之為VLA的司機大模型如果你感興趣的話我給你大概講一下VLA是怎麼訓的VLA是怎麼訓練出來以及VLA是怎麼去工作的因為確實我聽了你很多期大家都在講VLA但是我覺得大家講的並不清楚尤其到後面訓的時候大家一旦而過往往只是引用一些論文那我們真正在幹這事的而且我們有足夠多的語料所以我們來講一下您可以講VLA這三個它的關係是什麼以及怎麼訓的對我還是講一下怎麼訓的吧然後並把這個關係表達清楚了我覺得第一個其實是訓練的環節然後訓練環節第一個部分是什麼呢其實是訓出來一個VL的基座就是Vision和Language的基座那我們目前在訓的當前的這個版本是一個32bit的就是320億的一個雲端的基座模型所以先訓這個那這裡邊的話跟過去的時候語言模型的差異在於什麼呢第一在於我要放入更多的VISION的語料放VISION的這種TOKEN這個VISION裡面包含兩個部分一部分是3D的VISION就對於物理世界的3D的VISION其實要放進去第二個是高清的2D的VISION因为今天的话大家看到各种多模特开源的VLM里面的它的整个的2D的Vision的清晰度太低所以看的距离不够那我们放进去的基本上距离提升了3到5倍我覺得這是非常之重要的我覺得這是一個部分是Vision的Token和雨料第二個是要放入Language的跟交通跟駕駛相關的足夠多的這方面的雨料我覺得這是Language的部分第三個還有一個很重要的是大家可能容易忽略的我們必須放入很多VL2聯合的雨料就是三維圖像和世界的理解語意要同時產生的比如舉個例子我要把導航的地圖和車輛的和對導航地圖的理解一起放進去這是原始的數據嗎沒有原始的數據所以我們才有看到導航以後人類做了一個判斷這個判斷我們車輛是怎麼記錄的要把這個語料放進去其實整個VL的機座模型訓練的時候其實包含了三個部分然後的這個數據是Vision的數據然後Language的數據和VL聯合的數據對然後它形成VL的一個基座那同時我要把這個基座要幹什麼呢然後我要蒸餾下來變成一個然後3.2B的然後端側的蒸餾的模型因為我要保證它運行速度足夠的快然後以及它能夠在我的無論是兩個AurionX還是索爾鋼U上可以流暢的運行所以我們蒸餾下來是一個3.2B的8個專家組成的MOE模型如果直接跑3.2B的一個完整的模型的話雙AurionX和索爾U的幀率是達不到的就token的整個輸出率是達不到的所以我說這是第一個步驟這是預訓練的然後這個環節然後第二個部分其實是要做後訓練預訓練什麼預訓練相當於然後學習人類的知識就是先學習了人類的怎麼去理解物理世界然後怎麼去看物理世界怎麼理解物理世界這樣的一個知識那征留前是32B對吧征留前是32B在雲端一會兒我還講雲端32B仍然到後邊還要繼續去使用並不是只是征留機座就放在那裡了那我覺得第二步驟是什麼第二步驟是做後訓練後訓練什麼呢後訓練其實是我要把它變成VLA然後我要把action其實放進來這個後訓練什麼呢其實是一種還仍然也是一種模仿學習特別像什麼呢特別像你去駕校學開車就是你在駕校裡學開車就是相當於其實我訓練VLA把它組合成一個VLA的端到端的這樣一個方式我觉得这是然后这个第二个部分那这个时候大概模型规模就会从3.2B大概扩大到接近4B就大概這麼一個規模其實它一方面是個VLA就是能夠直接從視覺到理解到最後的輸出但是比如我們的COT就會很短我不會做超長的COT我的COT鏈條一般兩步到三步我不會再做更多的因為否則延時太長沒有辦法滿足交通或者機器人的安全另外當我的action做完以後我還會做一個什麼還會做一個diffusion的預測就是下面會發生什麼樣的一個然後時長的一個場景這個主要根據性能會做出來然後4到8秒的這樣的一個然後Diffusion的軌跡和環境的一個預測所以我說這是第二個部分比較像人去家校學校學開車這樣的一個環節然後第三個部分是什麼是強化然後是要做強化的這個訓練人像到社會上開車了所以強化我們分成兩個部分然後第一個部分先做什麼呢先做RHF就帶有人類反饋的對那所以呢我們有很多人類數據就是當他這樣的話人類就會接管對吧然後當代人類不會接管包括人類的一些習慣現在拿這塊其實來做一個人類反饋的然後一個強化的訓練大概意思是什麼意思包括我們的安全的對齊都是在這個強化的環節完成的就是你要遵守你除了要遵守交通規則以外你要遵守然後比如中國的大家的駕駛習慣就是你的開車習慣能夠融入社會你首先要開的跟整個社會的環境上的大家一樣好你不能給別人帶來麻煩而不是一個新手在路上的時候你變成一個阻礙所以我說這個是強化的第一個部分然後第二個部分然後是純粹大L是什麼呢是我們拿我們的世界模型生成的數據然後訓練那這塊的目的是什麼呢就是開的比人類更好那這塊的話呢我們中間不會給人類的反饋然後我們只會給一個結果就是從A點到B點你要開過去但中邊會有三類的訓練要求第一個是我們可以通過G值來判斷它的舒適性給舒適性的反饋然後第二個是做碰撞的反饋它碰撞了這個強化就沒有完成然後第三個是交通規則的反饋如果他違反交通規則就沒有完成所以是舒適交通規則和碰撞事故然後讓他其實自己來做然後整個的強化的訓練當這三個步驟完成了以後VLA的能夠跑在車端的模型其實就產生了大概是這麼一個方式跟人非常像先學習世界和交通和人類的這些知識這是預訓練的這個環節後訓練的環節其實是相當於去駕校然後認真地去學開車然後我覺得第三個環節其實相當於到社會上然後來開車社會上開車也是我們訓練的一個過程通過人類的RHF然後來跟人類做對齊然後跟社會的這個環境來對齊然後另外一方面然後通過純二耳的強化以及我們自己然後在世界模型裡生成的數據然後讓他做強化的訓練從而開的比人類更好能夠解決更複雜的問題或者比通用的比這種人類的平均值要開的要好得多大概是這麼一個過程那我覺得這還沒有完我覺得這是有了VLA但人類是怎麼跟VLA工作的時候其實我要搭建一個司機的agent然後司機的agent是什麼呢然後是人類就是以自然語言的方式就是你跟一個司機怎麼說話你跟一個正常的駕駛員對然後假設你有男朋友你男朋友在開車你怎麼跟他說對你就怎麼跟司機的agent來說或者一個代駕然後你怎麼跟他說就說了那這裡邊的話如果是一些短指令通用的短指令會直接然後VLA直接就處理了對然後不需要再經過雲端然後如果是一些複雜的長指令其實是先要到雲端的那32B的然後VLR那裡處理完以後對然後因為他理解交通的一切然後他再整個的然後交給VLA然後來進行處理就大概這麼運行的一個過程所以呢說白了就是他最後的一個好處是說他能夠像人一樣去理解物理世界然後能夠像人類司機一樣去理解物理世界能夠像人類司機一樣去開車去處理複雜的問題然後也能然後像人類司機一樣跟其他人類進行溝通我覺得這是最後我們然後交付到優惠那裡的產品這其中這些步驟裡面哪個是最難的呀沒法預測因為這些東西我們前面沒有任何人走過這條路DeepSeek也沒有走過這條路然後OpenEye也沒有走過這條路谷歌、Vimo也沒有走過這條路我們其實走的是一個無人區那你們為什麼就bat為什麼就壓住了這條路呢因為我最近做了一個技術播客就是講VOA我就感覺這個技術路線還沒有收斂為什麼你們覺得你們可以做我覺得我覺得交通領域應該是最早實現的因為規則清晰因為車對因為規則清楚包括你說做強化是非常容易的按照每個來講是吧交通的世界一個車會跑到哪裡是有的雖然它很複雜但是確定的對吧车又不能开到水里去车也不能开到空中车只能开在有路的地方所以它是复杂的具备确定性然后我觉得这是一点然后第二呢其实车的控制其实车是个三道斧就车有三个自由度然后左右是个自由度前后是个自由度某种程度上还能有一点轻微的旋转是个自由度对吧甚至自动驾驶某种同样就控制两个多撑死就三个自由度嘛对如果这个都不能实现机器人的上来就是40多个自由度那个挑战就更大了所以這時候我們進行模仿學習是特別容易的所以車看到的就是人看到的人操作的其實就是車操作的所以我覺得第二個他能做特別好的模仿學習第三個他能做特別好的強化就是大家在使用的過程中不滿意的時候就接管了其實這就是跟人類沒有對齊就告訴你不應該這麼做以及告訴你該怎麼做這是非常清晰的指標包括後面我不做人類監督我靠生成數據來做訓練的時候也非常清晰因為什麼是舒適既知是可以表達的什麼是符合交通規則是能夠表達出來的然後交通規則是個清晰的規則然後第三個是否發生碰撞是可以表達的然後如果他很舒適又不違反交通規則第三個然後又沒有發生碰撞然後他到A點到B點他就是會開得越來越好我覺得這個其實它是一個最好的一個VIA的第一個重要的實驗場我聽你說我有一個感受剛開始大模型國的時候大家都說創業要做AI是造人你們這個其實就是在造司機對而且我覺得我有很重要的一个感觉哈就是我们只有让他变成一个真正的司机他才是一个生产力工具不只是一个辅助工具对吧今天r2啊然后r2加啊其实是个辅助工具对那辅助工具其实还需要人大量的一个参与但是呢我觉得如果想变成一个生产工具然后我个人认为然后并不会出现通用的agent而是每个专业领域其实做专业的agent然後就剛才我剛才講的其實要想開好車這個它所有的vision的語料language的語料和action然後其實都是不一樣的然後你想做好一個醫生然後你想做好一個律師其實包括它背後的整個思維鏈然後背後的這些所有的數據其實都是完全不同的所以我這是判斷而且另外一方面如果然後你想變成一個生產工具那這時候就會和專業的人進行比較比如說你是否比一個專業的司機開的更好你是否比一個專業的醫生表現的更好你是否比一個專業的律師表現的更好你是否比一個專業的程序員表現的更好因為你會影響到他的整個的生產然後他的整個的業績他的工作的結果甚至他的財產和生命安全我覺得這是我們看到的終點所以這也是為什麼我們必須很耐心很深入的去解決然後哪怕一個司機這樣的一個問題並不可能通過一個泛化的一個大的一個機座模型或者一個大圓模型這些東西都能實現了我覺得這是不現實的為什麼通用agent不如專業agent在你看來我們需要通用agent嗎我覺得給通用agent換個描述方式我覺得通用agent比較好的描述方式應該是agentOS我覺得五年之內沒有通用agent會有一個agentOS方便各個專業的人在這個agentOS上其實開發出來自己需要的agent我覺得這個其實反而我認為其實是需要的所以你覺得agent可能是不同的工種然後他們都共同想用一個agentOS對啊因為你要做一個agent或者說你要作為一個生產工具你就是能夠替代和解放人類真實的工作每天那個高品的工作比如開車比如編程比如很多事情而並不是只是信息索引一下在腦子裡轉一圈就結束了我覺得這個是根本性的不同而且這時候還要跟我剛才講它會影響到你的收入然後他會調用你的資產然後他會調用你的工具或者你的財產你的電腦你的車對吧那這時候我覺得整個的包括對其的要求也不一樣了比如說你今天拿什麼去查找一個信息你拿DeepSeek或者拿正常的OpenAI查找一個信息它就用RAG方式去做索引了但是你拿DeepResearch或者你拿Mindless這樣的還會去找信息的源頭而不是簡單的通過RAG就可以因為專業的人員一定找信息的源頭找到那最真實的源頭信息才能往下去做分析你們是不是也要做AgentOS我覺得我希望的我們做的AgentOS想來想去只有司機這一個其他的我们不专业你说我们做教育的我觉得那应该是原辅导啊好未来他们去做的对吧然后最后agent会搭载到我们车上有可能的但是我觉得我们比较重要的是说我们先做好公司内部的agent因为公司内部要需要很多的agent啊然后有客服的agent对吧刚才讲的有编程的agent对吧所以呢我也提出了一个很重要的一个需求因为都在CNN的团队基础模型团队和操作系统团队还有我们的智能商业的这个团队因为智能商业做工具的他们三个如何联合在一起搭建出来有效的一个agentOS并让每个专业自己在上面然后来开发出来自己所在专业领域的agent你不可能智能商业的团队做出来一个客服的agent然后应该是客服团队来借助这个平台借助整个这样的一个agentOS来开发出来自己的真正的专业的agentOS他们一个人带多个agent一起来做客服然後應該是我們的銷售團隊來做出來電話專家的這樣的agent然後開發人員做出來對應他們的然後編程的agent然後以對應他們的整個的做這驗證實的agent我覺得這個其實都應該是每個專業自己去做的並不會有一個團隊幫大家做好但是呢我覺得智能商業團隊可以把一個公司然後內部的agentOS做出來所有人方便的在上面然後去放入自己所需要的數據與料去做對應的這方面的這個訓練然後去調整他這個專業領域的思維鏈我覺得這是大家可以去做的AgentOS是一個對內的事不是一個對外的事我就先做對內的以後會開源嗎這個怎麼開源我們還沒想呢對因為就是我覺得我們之所以開源那個汽車的OS因為我們做的真的挺好的我明顯比Autosat比QNX好得多自研了四年嗎對那真的是做得好明顯的好如果你做個不好的東西出去看一眼不就丟人嗎我覺得還在摸索的一個過程中對吧也包含其實剛才講的其實很多人到了工作的時候就像Manus一樣包括像珍斯派一樣我怎麼把土都利斯特做出來土都利斯特一定不是做系統的人做而是說我把土都利斯特這樣的一個然後架構設計出來每個專業在放土都利斯特每一個土都裡面的思維鏈怎麼做我就證實了才是真正的專業agent我們剛在聊VLA嘛那是不是意味著端到端才出來一年你們就要換架構了這個是不是太快了去年端到端就被放棄了嗎我也沒有放棄還是我剛才講的其實端到端其實是VLA的一部分如果你把端到端想像成其實是巨神智能的執行的一個環節對吧那它其實就是我們VLA的A的部分就我A的部分其實仍然是在拿這個餘料在做訓練的其實它就組成了我的A的部分了只是我要多語言的部分還要多更強的3DVision和高清2DVision的部分所以有可能一步直達VLA嗎就比如說去年不推出端子端加VLM那個版本然後直接推VLA直接研發VLA沒有可能至少從我們自己的體驗上其實沒有可能就我覺得說不太好聽的話就是沒有辦法直接摘第十個包子雖然可能大家覺得第十個包子吃飽了但前面每一個包子其實都跳不過去然後我覺得往往很多時候如果大家不想做前面任何的包子的積累只想摘第十個包子很多時候非常想練葵花寶典我覺得今天包括DeepSeeker的出現並不是練葵花寶典練出來的過去的時候他很早就構建這種集群的能力去做這些練路的優化然後這些基建的優化我覺得都是非常之重要的所以才有了他的低成本和效率我們特別喜歡講這種有一個人很聰明直接摘到第十個包子但現實中其實至少今天這個社會的整個的知識文明發展的越來越好了不是膽大大於切我看不到什麼捷徑包括今天很多企業做彈道戰都很吃力因為在規則算法的時候都沒做好但是大家就覺得李小才是摘第十個包子的人啊因為你們做智能駕駛的時間比別人晚嘛但我們自研的時間並不短啊我們從201年然後上高三的時候就開始來做自研然後我們研究做的也很紮實我覺得中國的所有企業裡邊關於自動駕駛的論文我們應該發表然後已經被大的會議啊大的社區這個錄取引用的其實應該也是最多的我覺得我們還是做的挺紮實的因為我們這個用戶導向的公司我們認為技術是一種能力那所以呢其實我們更多的時候講的是用戶的價值今天大家講然後無論是冰箱彩電大沙發對吧但是背後的話我們的冰箱彩電大沙發的智能化的背後的基礎今天大家看仍然是非常強的然後體驗起來是完全不一樣的背後基礎是什麼就大型軟件的能力然後我們後邊很多能力其實還是很紮實的比如舉一個例子就為什麼今天大家做端到端和外貌很難是因為這個Auron的芯片並不支持直接跑語言模型所以我們是自己的編譯團隊所以我們特別理解DeepSeek一看就看明白了比如他做FP8的優化然後能夠跑他的整個訓練的一個架構我們做相同的事情我們直接寫了AuronX的底層因為英偉達沒時間我們自己寫的底層讓他用印刷的方式來跑然後V2M那這跟誰做FP8的訓練其實一個道理包括今天的話然後我們為什麼能做到雙OrionX然後跟索爾U都能跑VLA我覺得可能對很多團隊是個非常大的挑戰為什麼呢因為我們自己有非常強的能力我們有編譯團隊然後我們有芯片的能力然後我們有板子設計能力有操作系統能力所以我們是能夠把兩個OrionX同樣可以跑然後同等規模的然後VLA的模型我覺得我們這方面的技術都是非常之紮實的因為我自己還是認為你規模小的時候無所謂你規模大的時候基本功和能力對永遠是無法逾越的這是哪一年頓悟的我很早就頓悟了然後做汽車家的時候就是基本功極為紮實然後做理想汽車的時候就是只要我們做什麼事情基本功都做得非常的紮實因為你說做人類的最佳實踐往往是反人性的嘛你做過最反人性的事情是什麼呢就為了追求最佳實踐而反人性我覺得我們做的最大的反人性的東西就是我們在每次看到遇到問題的時候都願意做巨大的變化对然后这个变化包含能力的变化对然后业务的变化和组织的变化我觉得这个其实是我创业一路走来我认为做的最坚决的事情所以什么样的countercase是可能端到端加VLM就是聚能架构无法解决而VLA是可以解决的你们给大家举个例子我过去的时候端到端有两个麻烦的问题然后第一个问题是他对复杂东西理解比如这有一个复杂的修路对然后如果是规则算法可能又会撞上了然后如果是端到端可能能停下来但他不知道该怎么干了然后如果是va就轻松其实就能解决了而且这些我不需要有真实的场景甚至我可以直接生成数据来进行训练对吧然后因为他能够有理解能力了他并不是只是看到东西就看到一个景象就做出一个结果然后如果觉得规则算法其实往往可能就会出现然后遇到一个复杂的没见过的或者规则之外的才会出现事故如果是端倒端的他可能能停下来但他不知道该怎么办了因为我们经常遇到修路状况他在那不正犹犹豫不知道该怎么办对吧然后但是如果v2a他其实就能够有效的去处理了而且不需要通過海量的數據訓練哪怕最開始這個場景沒有辦法處理但我保證三天之內相關的這個場景都能處理因為我可以拿這個東西來生成數據來進行訓練我覺得這是一方面然後另外一方面其實還有很難的一點是跟人溝通那今天斷段子怎麼做就跟猴子一樣你影響不了它比如說我們會經常遇到一個什麼樣的狀況就是在一條路上三條道然後最右側的車道是公交車道然後又是現行但是公交車道長久沒有維護了那個印刷已經不清楚了所以他就會在那跑你可以通過一個調整說回到中間車道但他過一陣又跑到那條車道去了但是如果是人類有了agent以後因為有了VLA才有agent能跟VLA溝通所以我可以跟一個agent講說接下來這條道路就一直在中間行駛直到他在導航的時候等著下一個包含如果跟導航錯失錯失了以後段道端就不知道怎麼辦了但是VLA在小區裡可以漫遊然後在一個開放空間裡他可以先處理完以後最後再跟導航調整以後的進行會合他跟人類是完全一樣的了只是今天可能他作為一個人類他能力還沒那麼強作為一個人類能力還有一個成長的一個過程比如他今天像一個剛從家校學完的新手司機有可能是這麼一個狀況今年都會是這個狀態嗎我覺得還是看整個訓練的這個整個的一個進度了但他放話能力是完全不在一個量級上了你有試駕過就是上了VLA的車嗎體驗怎麼樣有經歷過什麼ahamoment我覺得挺難有什麼ahamoment因為你已經理解他的原理了其實它就變得跟人很像了就真的像人了它變得更像人其實沒什麼驚奇的相反一個動物就是一個動物忽然會這些東西你覺得挺驚訝但一個人做好東西你認為其實是正常的為什麼之前沒有人做好VLA啊你覺得VLA做好需要哪些條件呢我覺得前提第一你要有非常好的語言模型你覺得我們開始積極ManaDB後面就積極DeepSeek了因為DeepSeek的語言能力比ManaDB更強所以DeepSeek在這個在L上幫助了你們幫助非常大讓你們可以縮短9個月對縮短9個月的時間我們非常感謝DeepSeek大家可以幫我們縮短9個月這9個月對我們時間是非常寶貴的那另外一方面其實然後一家企業如果你過去沒有做過L然後基礎模型然後你的預訓練你的後訓練你的強化體系怎麼構建然後以你背後的這些算力怎麼來調用然後你的整個的世界模型仿真系統怎麼來使用我覺得都是非常大的挑戰比如我們今天已經做到什麼程度我們已經做到了每1萬公里的驗證成本從最開始18萬已經降到4千塊錢這4千塊錢完全來自於算力了但是整個的效果比原來在物理世界裡面去做仿真去做驗證要強得多得多因為很多時候我遇到了一個狀況其實它既有不同的車還有其他交通參與物還有一個特殊的路況但是到真實的問題上你把這三個湊在一起難度是非常大的但是我們的世界模型把這問題其實都解決了VLA是哪個還有包括VL它哪個數據獲取難度是最大的呀Vision和ActionVision和Action的數據因為車我們裝滿傳感器是可以收集物理世界數據的對吧還有人在車上開車是我們可以收集到Action的數據的這兩個其實是最難的而且也沒有任何公司可以替代其他的車企不行嗎其他的車企也可以啊但是我覺得其他車型你有沒有建立然後你的整個的過去機組模型的預訓練的能力你的後訓練的能力以及你後面強化的能力然後因為強化還需要世界模型的能力對吧那我覺得這是不一樣的包括我剛才講的說其實本身我們怎麼去解決很多的問題比如說我講一個問題第一個其實我如何提升能力剛才講清楚了第二個是我如何向人類安全對齊我如果像一個職業司機一樣的足夠的安全足夠的舒適所以我們本身要建立強化學習的體系我們的RHF是很重要的我們這個其實有一個已經成規模的團隊了因為很多時候一家公司如果模型能力不強的時候根本不知道怎麼去做對齊是因為你模型能力強的時候你才發現對齊的重要性你才知道伊利亞原來想的那麼遠怎麼說因為模型能力越強也就意味著他胡來的可能性越高就跟一個人能力越強其實我要需要他的職業性越強公司規模越大越需要職業性公司小時候不需要職業性因為一個人能力強的時候他幹好事也很強他幹壞事能力也很強所以這時候就需要職業性來約束所以我比如舉個例子我不可能僱用一個職業賽車手來每天給我開車但我要僱一個職業司機所以他除了開車能力不錯以外他有非常強的職業性保證舒適保證安全保證向人類開車的然後價值觀能夠對齊所以這個其實是個很重要的工作我們就能做得非常好第三個還有一個最大的一個挑戰就是模型是一個黑盒子怎麼解決所以我們做了世界模型然後VLA然後放在世界模型裡面就一個交通世界模型它是一個如果不跟你說的話你看的跟一個真實世界是一樣的就是我們用重建然後加生成的一個方式接住我們的數據然後來構建了一個真的然後交通的一個物理世界包含有所有的然後參與者參與物然後固定的這些物體我覺得這是非常重要的所以呢我們就可以讓無論是最開始的這個端到端還是今天的VLA然後在模型裡面然後進行考試它會模擬真實的交通的參與包括真實的這些城市然後來進行考試跟我剛才講的然後強化訓練其實非常類似那考什麼呢考A點到B點考舒適性、交通合規性和安全性這是我們一直在做的工作這時候就能夠非常好的還原了基於這樣的模型或真實物理世界的仿真的能力我們還把整個驗證的成本大幅下降過去的時候我們靠人類司機來做一萬公里的驗證每一萬公里的成本大概在17萬到18萬人民幣算上車啊各種的費用啊今天的話我們大概只需要花40多塊錢人民幣就每一萬公里這40多塊錢基本上都是然後算力的然後為主的成本而且解決問題的效率還提升的多的多為什麼呢比如說其實今天的時候我們要解決一個問題的時候這個問題產生的時候是一個我們資深的車輛跟多個交通參與物多個交通參與物在不同的位置上還有不同的道路上其實出現了一個問題但是如果你靠人類去驗證我有沒有解決這個問題要把這幾個交通參與物相同的位置相同的速度其實湊在一起幾乎沒有可能所以只能模糊地驗證但今天我們有了世界模型以後我們可以非常準確地驗證修正以後的模型有沒有解決這方面的問題可以10%還原一模一樣的真實的場景然後在世界模型裡進行驗證BLA和世界模型的關係是什麼V2A就像一个司机世界模型就相当于这个真实的交通世界我觉得世界模型你可以想象成它有三个阶段然后第一个阶段讲的其实是我们能拿它用来考试然后第二阶段其实它能生成训练数据本來其實應該是這兩個階段調過來的應該先成為數據再考試但我們是先做了考試後來做的IR的數據的生成然後我覺得第三個階段其實是未來真正的24級別自動駕駛然後車輛的運營系統因為我不可能寫一個傳統的IT軟件來運營跑在路上的然後車上沒有人的自動駕駛的車然後沒有司機的自動駕駛人車所以我覺得第三個階段這個世界模型也會變成真正的全自動駕駛的運營系統我覺得這是這樣的一個關係當然我知道了因為今天在整個學術領域裡邊然後關於世界模型有兩種不同的解讀方式我們是一派的解讀方式然後VLA更像是一個人人類的一個模型司機的一個模型然後另外一方面我還構建一個交通的世界模型然後人類在世界裡邊來跑人類既會在真實的世界裡跑也會在一個世界模型這個仿真的世界裡跑來運行然後包含它能發揮的作用那我覺得還有一種我也聽到的包括從你的這個訪談中也聽到的然後也聽到過很多次了是在機器人領域裡邊然後它會把什麼當成世界模型呢會把到action結束以後然後再往後通過diffusion做未來幾秒的然後一個世界環境和軌跡的預測然後這是一類的大家描述的世界模型就是這個世界下一步怎麼運作但是在我們的方式裡邊然後下一步的diffusion整個的物理世界的一個這種生成的想像我們認為其實是4G能力的部分因為人類本身就具備預測軌跡的能力和預測後面發生的東西的這樣一個能力我們把那個能力變成了VLA的能力的部分然後把這個真正的紡織的一個物理世界然後當成了世界模型我覺得這是兩種不同的解讀方式我还是希望我们描述出来的一个东西是能够跟人类世界比较接近的比如说我们运行的时候如果是个世界模型它最好就是个世界如果是交通世界模型它就是个交通的世界然后如果是个模型或者是个模型加个agent它就相当于是个人我们尽可能的其实是把人工智能和人类世界和人类的理解和人类最佳实践然后进行对齐这是我们认为我們作為一個產品公司必須要去做的我們在說4Gagent的時候它其實是涉及到action進入了外部世界進入了物理世界那怎麼解決安全問題呢這個非常重要所以我們其實從去年年底成立了超級對齊的團隊比如說模型能力很強但不遵守交通規則然後模型能力很強但模型經常去加3然後去在交通運動中去加餐對吧然後還有一些這個他做出來一些讓人類坐在車上感覺到不安全的行為對吧那我覺得這個其實至於是發生碰撞那是模型能力的問題是否產生這些問題其實是這個價值觀是這個模型要去做的對齊的這方面的所以這也是剛才我講的就是說我們要在做強化然後訓練的那個第一個環節是我們必須把人類的這些規則、習俗、駕駛習慣對於很多東西的判斷其實變成它整個的訓練的反饋我覺得這個其實是我們必須要做的所以我們有一個挺大規模的我們有一個10多人的然後一個超級隊企團隊因為你能力越強然後責任越大我覺得這是責任或者你還可以用另外一種方式我們把超級對騎如果拿一個人舉例子的話模型相當於是這個人的專業能力超級對騎是這個人的職業性是他的綜合職業性然後呢司機agent包括司機agent背後的這種記憶能力是如何和使用者建立信任的所以我們比如說我招一個員工或者我是否然後認可一個員工同樣是看他三個第一個然後是看他專業能力然後第二個是看他的職業性然後我覺得第三個是看他其實對別人理解和構建信任的能力這三個都很好我覺得就是最卓越的員工超級盾其實什麼時候開始做的呀是我們做到了10萬克利普斯以後開始來做的因為我發現這時候怎麼去有效的運用模型的能力就很關鍵了比如就舉個例子他經常一擁堵就去加3對然後包括他做的很多行為雖然效率很高但是人坐在車上是很不舒服的因為跟人類的一些處理方式或者跟正常人的處理方式不一樣他可能學到了一些不該學的司機的行為你覺得VLA是終極的架構嗎解決自動駕駛的還會有下一代嗎會不會明年這個時候又是新的架構了我自己認為VLA能夠解決到全自動駕駛但是VOA是否是一個效率最高的方式是否有效率更高的架構出現我打個問號我認為大概率還是會有的因為VOA還是基於Transformer那Transformer是不是一個效率最高的一個架構我覺得這個其實後面不知道它是現階段效率最高的架構我覺得它是能力最強的架構因為現在能力的差距太大了就跟人類合格開車然後今天這個智能駕駛的這些規則算法啊端道端啊跟人類差距還是太大了對然後呢我覺得它是然後最接近人類的甚至有機會超過人類能力的然後一種就關於開車超越人類的一種方式那它是不是效率最高的方式其實是打個問號因為它今天對算力的要求還是很高的VLA跟最後可能形成最終大統一模型的關係是什麼呀它是那個大統一嗎我覺得還是會有一個效率的問題就跟我講的一樣其實我們雖然有模型但我從來不放棄工具然後因為工具是增加確定性和提高效率的我還是舉一個挺清晰的一個例子因為團隊很多時候太想用模型解決一切問題對吧然後這時候就會出現一個類似一個現象比如我舉一個例子那今天當然VRA會解決就很好了其實我們在使用VRM在解決ETC的時候並不好因为VLM对于位置的判断是很糟糕的所以他如果其实是两到三个ETC然後我怎麼進入其實非常容易判斷其實就是一個左中右但如果像京城高速這樣的機場高速那樣的十幾個ETC他很多時候就不知道怎麼處理了就開始非常混亂了因為他沒有位置的判斷的這個能力所以我們團隊太希望用模型解決問題不停的去給VLM喂更多的羽料喂更多的東西其實都沒有解決這個問題因為這是VLM的那個架構問題然後我跟團隊說那解決ETC為什麼不能用規則算法因為最多的也有15個口十五口對於密碼寫一個程序基本上一周之內就能完成甚至三天就能完成但是我說很多時候我們心裡有個心結人類很多運行的時候其實是在模型運行但是我說我們作為一個正常的人我們其實然後也會被懲罰口責懲罰口責就是個規則算法但是懲罰口責然後的結果是我們消耗的腦力更少我們消耗的token更少然後以及我們的准確性更高所以它就是個好東西它就是個工具然後如果是一個確定性的能夠拿規則去解決的其實它意味著更低的能量消耗更低的算力消耗和更高的準確性那我覺得為什麼不用所以團隊很快就把問題解決了所以我們在ETC就非常的穩了其實一週都不到就解決了過去的時候解決了三四個月都解決不了的成本很高的方式解決不了的所以我說就是我覺得真正往下去落的時候很多時候還是要考慮效率就是今天DeepSeek之所以受到全世界的矚目很重要的一個原因還是因為它的效率變得更高了你在VLA在做這個司機agent的時候有感覺在做一個人嗎當然了我一直是在拿人的方式就我始終在人工智能上都是拿人的方式跟團隊去溝通包括我們開始講的快思考慢思考我覺得這個還是得益於然後2013年9月份然後陸琦對我們的啟發2023年9月份我們的佔領會陸續對我們的啟發陸續問了一個問題人類是怎麼工作的人類是怎麼學習開車的人類沒有那麼辛苦人類沒有那麼難如果那麼難的話肯定是方法不對的或者是能力還沒到那你們就應該去研究什麼樣的能力才能像人一樣去開車像人類一樣去繁華而不是靠規則算法西博士最近有給你新的input沒有新的輸入我們前幾天又交流了一次對然後它更加強化的一點其實是研究等於能力研究等於能力對而不是研發等於能力就在人工智能時代研究等於能力所以就更加強化了研究工作的重要性就研究等於認知然後認知很容易就變成能力在模型時代但是如果你沒有搞研究能力其實你就沒有開放這個認知也沒有辦法把認知變成能力我覺得這是他的一個最新的一個重要的一個觀點你們三萬人的公司有多少人是負責研究的我們沒有特定的我們有一些特別重要的前線技術的時候會有專門的研究團隊但是我覺得所有的能力所以在構建能力的就是垂直的構建能力的部門或者過去大家講職能部門的方式然後我覺得他都應該去搞研究比如我舉一個例子我們去年招了接近三千人的研發管理人員的校招我們如何讓這些校招能夠在公司裡面接受到更好的培訓練和課程所以這時候我們整個人才發展團隊就得先去搞研究然后也会请咨询公司跟我们一起来合作然后这些全世界顶级的公司在这样的人员规模的时候会怎么去做跟我们相似的公司是怎么来做不同的公司是怎么来做从而能看到我们有哪些能力差距然後第二個我們要開發這些能力所以我們就有了一線歷練這樣的一個能力然後我們做了一個非常好的一個能力說怎麼能夠讓大家去工廠然後接受訓練哪些具體的然後這個內容和教材和做哪些體驗然後到我們的一線的店面接觸消費者怎麼來做然後怎麼去學流程所以相當於他們要開發課程開發課程以後然後最後才能變成業務把這個課程放到我們的工廠放到我們的店面然後有這些人有這些客戶我們的用戶就是員工去運行所以它是一樣的它同樣要去搞研究要去搞研發和開發然後要變成真正的我們有這樣的課程能力我們有這樣的這個一線歷練的能力然後並且去作戰我覺得是一樣的一模一樣的一個方式什麼是一個好的4G大模型的北京指標我就还是把司机大模型和agent放在一起他这是一个真正用户能够使用的一个产品如果是一个司机大模型好的我就跟人的判断是一样我判断一个司机我们家雇用了一个司机第一是他开车水平好不好其实他模型能力强不强第二个还是说他是否职业然後我覺得那他是否職業很重要的一點其實就是我們的超級對齊這方面的工作包括強化訓練然後是否做得足夠的好我覺得第三個是然後他跟我之間的信任的關係我是跟他說什麼他都聽不明白還是我說上半句他就知道下半句甚至我很多東西不說他已經對我的記憶裡面都可以獨自去完成了我們如何去通過agent和記憶來構建一個更好的信任的一個關係和理解的一個關係如果我什麼都不說他都知道我要幹什麼了這個司機要同時又滿足了他開車不錯然後又很職業他又對我特別特別特別了解特別理解對我就會一直僱用他然後他每年定期給他漲工資我覺得最後我們對司機對整個的這一個司機的模型和司機的判斷也是一樣的我覺得以後所有的AI的或者Agent的判斷都應該是這樣的他的專業能力他的職業能力然後以及他給你構建信任的這個能力你覺得這個agent應該怎麼定價呢我們僱用人類費用的幾分之一吧至於幾分之一最後還是看把成本都算出來以後我覺得比如說我一個月我僱一個司機一萬塊錢我是否願意兩千到三千僱用一個司機那可能你對車而言你可能也不需要付保險費了保險費也包在這裡邊了財產險的費用也包含在裡邊了也可能一定的這種因為他可能會自動去充電可能一定的充電的金額對應一定里程的充電金額也是也放在裡面了所以可能到最後算下來可能一定是個更划算的一個事情你之前對內說過一句話說理想的質價原創性超過了增程這句話是不是太自信了我自己覺得就我們在這方面的然後研究工作真的做得很深所以你看到我們的各種的論文而且我們為了然後我們為了做好這個智能駕駛我們做了操作系統然後我們為了做智能駕駛我們構建了完整的訓練體系我们为了做智能驾驶甚至我们自己去直接去改芯片的底层的软件我觉得我们做了很多这方面的工作这方面工作肯定比曾诚做的工作量更多然后我觉得还有一个比较好的评价方式就是我们历史上从来没有遇到过任何一个周期比如204年和今年年初對然後我覺得我們每一個自動駕駛團隊的核心人員可能基本上都會接到20個以上的獵頭電話VLA架構會怎麼改變L3和L4的進程我覺得還是回到剛才那個方面講的我覺得一個是模型的能力比如今天其實在車上然後放一個3.2B的MOE然後如果把action都算下來大概是個4B的然後一個模型其實它對於對應的能力而言可能還是會有一個上限因為今天算力就這麼多了对吧然后虽然两颗OrionX或者一个索尔U有64G的显存然后能够最大跑一个30B的一个模型但是它的帧数是达不到的然后如果你想要达到其实然后交通就是一个机器人或者讲一个自动驾驶所需要的帧数然后你得把模型规模其实然后往下压这时候其实在端上的模型规模就受限那如果有一天我们可以把一个32B的模型直接放在端侧那可能L4就实现了可能云端的模型也会扩大到320B它是个30亿的V2的模型所以我觉得模型的规模基本上会云端的模型规模和端侧的模型规模基本上会限制L3和L4的能力的上限今年能看到L4吗或者是明年我覺得這在算力不行這在算力基本上就是個L3的水平那今年能看到L3大概有沒有一些時間點我覺得還跟法規一些東西相關但是我覺得這個能力達到的話我認為然後今年的三季度最快三季度最晚四季度基本上就能看到然後真正的L3的然後這樣的能力性的產品了但是可能法規啊然後包括後邊很多東西還會有一些其實需要去問題需要去解決刚才一直调用的是CEO大模型的技术专家接下来调用一下战略专家前几天你们不是刚开完了205的燕西湖战略会吗达成了什么新共识我觉得从战略上的一个核心的共识还是继续延续然后去年的秋季战略会做的一些判断但是呢我们延伸出来一些关键的想象一些如何往后看三年往后看六年然后大家可以去思考和探索的一些关键的点還是我講的說其實我們如果來看戰略的話然後中間的圈其實是規模這個圈外邊有三個變量是當規模發生變化以後這三個變量也會發生變化一個其實是用戶需求然後一個是技術產品然後我也一個是組織能力那我覺得這是然後這裡邊的一個核心所以呢我們今天其實今年會有一千大幾億的收入去年有一千四百五十億的收入那我們如果往後走這些對於規模的限制會在哪裡然後以及我們想獲得更大規模或者哪些東西是限制比如從用戶的需求角度來看我們會面臨什麼樣的一個限制比如我們今天主力設定都是SUV那我們可不可以靠賣SUV然後賣到30億、5甚至更高的收入這時候就是一個很大的挑戰因為像路虎這樣的其實並沒有做到那也包含我們的用戶群今天我們是去年是50萬輛今年要多一些如果我們要做到10萬輛以上我們的用戶群的規模就意味著跟BBA是一樣大的規模了那意味著我們用戶群要快大好多倍那這些用戶群的溝通然後其實也是不一樣的那這時候我們就想一個很重要的問題這就會產生兩個第一我們要往更大的規模走我們要去覆蓋哪些過去我們沒有覆蓋的用戶群然後對他們應該怎麼去溝通另外從產品的角度而言家庭定位是個非常好的定位但如果只做家庭定位的SUV包含面向全球是不是有問題的所以我們做了一個分析說我們有必要其實在面向全球在面向更大範圍群體的時候我們應該去做轎車但是我們應該是做好的家庭轎車不是運動轎車另外一方面我們作為家庭用戶而言我們在空間各種優勢我們其實應該做再豐富一些的MPV的產品然後這種家庭轎車的大空間的家庭轎車的產品並讓這些產品讓面前更廣泛的用戶群已經面向全球但也不是出很多的車能不能把這些整個的車的規模還是有效的SKU進行一個有效的控制所以這是用戶需求可能會發生的變化另外從技術的角度發生了變化可能我們可以看三年到六年的一個距離當車實現了全自動駕駛以後其實車會是人工智能時代一個營業收入最高的中端它可能能做到千億美金的收入一家企業是一個營業收入很高的中端可能這個車做到千億的收入的話可能會超過中國所有手機廠商的收入對吧做到千億美金的話那這時候然後那我在想這為什麼它是個人工智能時代的終端它具備了哪些特點比如說我說人工智能時代的一個終端跟移動互聯網跟PC時代的終端然後差異什麼呢我說它有四個特點然後第一個特點是它要有360度對物理世界感知的能力然後第二個然後它要有這種認知決策的能力我覺得第三個它必須有action的能力它可以去操作一個終端上的軟件也可以直接去操作一個機器人我覺得第四個然後它要有自己的反思反饋的一個能力然後像人是一樣的我覺得具備這四個的可能我覺得就是AGI時代的終端對吧汽車從一個智能終端變成了一個人工智能終端對然後這是我們要做的事情那我們還要再想一想其實然後在我們的生活範圍裡在家裡在工作中在我身上是否還會出現然後新的符合剛才我說的四個特點的AGI時代的然後中端對那我覺得那那個可能又會形成我們未來的機會因為蘋果也並不是只賣Mac蘋果發展一定階段的時候也做了iPod也做了iPhone而且也都非常的成功微軟也做了office也做了語音服務小米也做了IOT也做了汽車當你到了那個規模的時候比如當你到了50億以上規模的時候你必須得去考慮這樣的事情然後因為你的用戶群也變得更大你用戶需求也更完善我們能不能去滿足用戶工作生活中那些最主要的場景推出最有競爭力的AGI的終端產品我覺得這是技術產品的角度而言可能這是我們要去看六年的事情一直看到203年會有哪些可能性我覺得第三個是組織能力方面的話我們想做到三千億收入我們想做到七千億收入然後這時候你的能力需要哪些提升你小的時候你可以招個人就帶來能力了但你變成千億的規模的時候很多能力然後你怎麼去選擇其實就變得很關鍵了比如這個階段的時候我覺得我們在小的時候沒有看明白沒有看懂蘋果那這個階段的時候我們可能又去認真研究蘋果發現蘋果還有很多能力其實值得我們去學習的到今天為止你去看一個蘋果當你做到千億收入你再去看這種萬億收入公司的能力的時候你開始模模糊糊能看懂一些了但我小的時候我們很小規模的時候我們看不懂蘋果為什麼這做我覺得這個其實還是說最後其實是規模因為規模是一個可以確定衡量的變化也會帶來了用戶規模和用戶需求的變化對技術和產品的變化也會帶來組織和能力的變化學習蘋果會帶來你們什麼改變嗎我們一直在學習就是在組織的能力上我們一直在學習因為組織能力上挺難自己發明的除非我們達到了一定程度我們沒得可學了我們最開始的時候我們先是學的然後我們認真學習豐田的工作法然後學習GM的然後整個的研發的流程的方式然後也學習了谷歌的OKR把不同的業務團隊對齊的方式這個幫我們其實很好的完成了第一個階段就是理想ONE的這個研發和交付並且理想萬一幫我們創造了超過一百億美金的收入賣了二十多萬輛我們第二個階段其實很重要的一點其實是我們在想我們從一個做到了百億的收入怎麼往千億收入去走我們又認真學我們這個行業更像什麼對吧然後我們當時也研究過蘋果我們覺得我們人才密度不夠甚至也沒看懂蘋果所以我們當時說有很多的華為的書對吧也有很多的華為非常願意把這些能力然後寫成書向外去分享包括IPD啊然後我們第二階段其實又向華為學習了很重要的學習了組織能力包括IPD包括整個的財務然後流程和人力資源的這種三支柱我覺得這個對我們幫助很大所以它就有配合著我們的理想L系列的平台化的研發能力包括後邊我們的整個的更大規模的銷售團隊的管理能力然後銷售團隊背後還有三支柱的這種賦能和約束對所以我們就快速的在新勢力裡面借助L系列的產品然後做到了超過10億的收入那這個過程大概就是是我們的第二個階段我們做到10多億收入了然後我們也知道靠這個能力還能做到20億3但30億以上怎麼辦對吧這是幾年後的事情這三年之內的事情吧他們是否經歷過跟我們相同的階段對然後我覺得這時候我們就發現蘋果又是個更好的一個榜樣了為什麼是學蘋果呢它也不是一家AI公司啊我覺得最重要的是學能力對蘋果最開始也不是個手機公司啊蘋果也不是一個MP3播放器的公司蘋果就是個電腦公司啊那其實他能從一個電腦公司變成一個然後音樂播放器到後面其實變成一個手機公司變成一個軟件的服務生態的公司他也在不停的在變化啊你想是誰啊如果往後講的話我們其實會變在人工智能會越來越清楚然後我覺得如果回答如果看到203年的話我覺得一個比較好的回答是我們希望能夠成為全球領先的人工智能終端企業這現在加了終端對這是一個變化相比去年我們聊的時候我覺得不是個變化是因為過去沒做這個選擇但是今天這個選擇很清楚了我也跟團隊講明白說團隊也要知道為什麼做這樣的選擇這是今年的選擇嗎去年年底今年初開始來做的選擇也是相互碰撞出來我們到底是誰我們要不停的因為我們希望知道我們要成為誰但是更重要的要回答我們是誰我跟團隊講其實1975年出現了AppleII後來又出現了Mac這是蘋果這家公司它做中端它做的是軟件結合同一時期也會出現微軟它先做了DOS後來又出現了Windows它做的實際是操作系統和一個軟件生態這是兩種完全不同的取向沒有什麼對錯之分但是在那個階段的時候很顯然微軟贏了蘋果遇到了很多的挑戰蘋果至少活了下來因為它有自己獨特的價值207年同樣出現了iPhone這是蘋果做的蘋果又想做終端只是這次除了軟件和硬件以外還加了整個的服務的結合除了有軟件有硬件還有服務所以蘋果的服務做得非常之好它的服務利潤收入佔比非常之高所以它變成三個能力的一個結合所以它定義還是終端這時候緊接著又出現了安卓當然不是微軟是谷歌的角色了安卓又做了手機操作系統包含又做了整個服務的生態操作系統是開源的但服務是屬於它自己的無論是Google的MapGmail這一切的東西對吧也包括谷歌商店模仿的AppStore這樣的一個體系如果拿整個移動互聯網時代來看的話蘋果和谷歌基本上是不相上下的因為這也是全世界唯二的然後每年的淨利潤接近10億美金的公司對吧所以我覺得這個非常成功我覺得他仍然做了兩個完全不同的選擇所以回到我們今天的人工智能時代也是一樣的今天我們看到很多問題是因為沒有action那你需要action的時候就需要中端對吧你不能只知不行得知情合一才是更大的價值但是同樣會有企業像OpenEye這樣的然後他會做模型後邊他甚至也會做模型的AgentOS他會做一個這樣的生態開放API這樣的然後也需要其實有這個時代的然後終端的公司當然我們為什麼先切入自動駕因為自動駕足夠大然後這個汽車是個足夠大的一個市場那只不過其實我們可能不會限於這一個終端當這個終端做成以後我們的能力其實能不能覆蓋到用戶讓他生活的更好工作的更好然後更多的但是是屬於AGI時代的終端我們不會再做上個時代的終端但是我們一旦要進入到任何一個終端他必須得符合我剛才說的四個特點有物理世界的360度感知能力對吧然後有這種認知決策能力然後有真正的action的執行能力無論是控制機器還是執行軟件然後第四個有然後有真正的反思和反饋的能力只不過到了整個的AGI時代終端的話然後同樣然後他對於整個的能力要求變得不一樣了也包含他有軟件的部分他也有硬件的部分然後他也有服務的部分但我說他會變得不同了那比如軟件的部分第一我要有非常好的模型能力尤其是我要對物理世界理解我要在物理世界工作我要橫穿物理世界數字我不僅要能看清道路上的車理解修路互動小巷我還得能看懂導航地圖能看懂所有的軟件所以需要我有非常好的模型能力第二個我要有非常好的操作系統的能力所以這些端包括人工知識那端它要是個事實的它不能像安卓那样背后的任务排列式的也不能像传统奥图萨那样是一个链式的它既要并行然后你的好多操作系统对你整个计算上的NPUMCU这些内核怎么有效的去占用来确保它的实质性它准确的去执行所以你的操作系统能力要求也不一样你要很高的性能然后要符合整个人工智能在物理世界里运行在数据世界运行的这样的包括我们能不能做出来更好的虚拟机如果本地电脑工具不够的时候然後我們能不能做出更好的更高性能的虛擬機因為這也是操作系統的能力然後我覺得第三個還是要做好各種各樣的工具但是是符合我們所需要的這些常用的工具因為工具也會根據人工智能變得其實更有效更高效Agent也要去調用工具所以我說這個其實是我看到的軟件的能力然後這三個其實缺一不可然後另外從硬件的能力上我也能看到三個我覺得第一個重要的能力其實是本體發生的變化了比如我们要把车控制的更好所以我们要自研整个的限控系统对吧然后后边的话整个的本体方面的这些需求然后计算单元之间的这些关系部署比如对于车是否一定是个中央大脑那其实不是因为所有的任何一个端来中央大脑距离很远所以我可不是一个中央大脑再加几个分脑来做然后这样的话我的最少的线数然后最好的整个的传输效率只有集中计算有分布计算并不是一个大脑工作对吧那我觉得这些东西都会发生这些硬件的本体都会发生变化第二个很重要的点是NPU现在太关注云端的训练和推理了云端训练推理其实大家可以通过加更多的来实现通过改这个结构那在终端上如果我只能放3B的模型然後跑10赫茲但是有一個人過來能放30B的模型跑10赫茲那這就是10倍的性能差距所以我這方面的要求就是大腦變得很強了我覺得NPU像心臟心臟也要變得更強那這個其實沒什麼捷徑你後邊的要求越來越高甚至今天的很多架構可能都已經不太實用了我覺得這是然後第二個這部分我覺得第三個部分其實我認為製造環節都會發生變化就整個工廠為什麼不能變成一個機器人然後小時候我們看過變形金剛動畫片對吧然後那這些所有的機器人裡面有的像秦天柱啊魏振天這樣機器人它能變形還會有像宇宙大地這樣機器人它本身是個星球它的身體就是個機器人然後我們能不能拿AGI來生產AGI的終端拿AGI來生產AGI的終端對那我覺得今天其實工廠然後也在面臨這樣的一個機會那我覺得很多人都想像了一個問題說我造一個人形機器人要去工廠裡去替代然後去替代人我覺得這有兩個問題然後第一個問題就是其實我覺得工廠的人並沒有大家想像的然後在整個的成本裡佔比那麼高然後那很多時候替代起來並不划算我覺得第二個其實我覺得這些這些就業長期而言還是非常有必要的那但是呢我們在講的一個問題是我們如何能夠其實通過然後把一個工廠變成一個機器人去簡化工廠裡面各種繁瑣的複雜的環節我覺得這對於整個的生產效率才是更大的提升所以我覺得應該關注我覺得整個的AGI在整個製造領域應該關注生產效率的提升而不是人的替代我覺得如果關注人的替代我認為其實是挺狹隘的或者這些人並沒有真正的管理一個工廠的經驗然後我覺得還是三個部分一個完整的專案三個部分一個軟件的部分然後我覺得一個是硬件的部分可能會發生變化到AGI時代我覺得AGI時代第三個其實是服務也會發生變化我覺得很重要的一點是我們並沒有辦法寫一套傳統的IT軟件包括人去接管這些AGI去管理這些agent所以我覺得這是一個非常大的挑戰所以我覺得包括英偉達去做Cosmos在內的東西包括我們來構建交通的世界模型然後包含我們去做AgentOS它核心的是要運營一方面我們怎麼運營這些然後跑在物理世界裡的這些AGI的機器人無論是車還是其他的型態然後還有一個很重要的我們每個人都在講一個人要和幾個Agent一起工作或者一個人帶領幾個機器人一起工作但是到底怎麼工作它是AgentOS的形式還是一個其他的形式我覺得這也是必須要去解決的你要既要解決AGI運營本身的問題也要解決AGI和人的連接的問題我覺得這是服務所以我覺得今天這個問題對於所有的企業都是一樣的至少我們看到然後這是我們未來的三到六年要去解的題怎麼解決一個AGI終端的軟件層面的三個問題以及怎麼解決硬件層面的三個問題以及怎麼解決這種AGI運營以及AGI和人連接運營的這樣服務的問題我覺得都是接下來的挑戰我感覺你要做的事情好多也沒有好多其實就是就如果這些問題不解決就是今天這個現象就是大家都覺得AI很厲害但是大家每天工作時間變得更長然後假的信息變得更多不靠譜的信息變得更多然後陪家人時間變得更少我覺得這都是問題我知道你們把機器人分成了穿戴機器人空間機器人和家庭機器人你們對於機器人的節奏是什麼樣的還有規劃我覺得並不可能直接上來給出節奏還是我們要根據行業的各種的進展去來做相應的研究和分析以及哪些能力自己要去解決比如很多人說眼鏡會是未來的一個我們穿戴的一個終端或者是一個穿戴的機器人但今天的不是這裡邊還有很多的問題它確實具備世界360度的感知但今天的顯示是不行的無論是光波導的顯示還是集中顯示其實並不能變成一個真正的長期使用的一個方式然後包括電池的電量包括獨立的計算包括通訊我覺得這些問題都是解決我們相信有一天它可能會是多種路線裡邊其中一個可能會成為人類的穿戴的A界中的穿戴機器人的一條路徑但今天還不是還有很多問題等著大家去解決也可能解決的路上又有另外一個路徑出來跑到前面都有可能但是我們要去做這方面的研究要去做這方面的分析然後在家裡也是一樣的在家裡的話到底是一個人型機器人然後去服務所有的還是最後我在家裡應該有一個更好的感知和更好的大腦只需要簡單的去可以是一個人型機器人然後在一個廚房裡拿著人類的鏟子拿著人類的鍋然後去工作然後也可能其實我只需要有一個改造的鍋然後他就直接能做菜了然後整個家裡有一個統一的大腦和統一的感知我覺得這兩種路線都有可能然後我覺得每條路線都有自己的信徒我覺得這些東西其實接下來可能都會發生什麼樣的終端是理想會做的什麼樣的終端是理想不會做的我覺得這件事情的判斷只跟我們規模相關然後我們規模小的時候我們就盡可能收斂在規模大的時候我們必須去擴張如果谷歌不做成功操作系統它就不是今天的谷歌如果它只做搜索引擎不做安卓它就不是今天的谷歌如果微軟不去做Office微軟不去做雲服務它可能就不是今天的微軟可能跟眾多淘汰的企業一樣就是一個時間的過客然後蘋果如果只堅持做Mac不做iPad也不去做iPhone那蘋果可能就是另外一個企業可能它跟其他的我們曾經在這個人類歷史中出現的電腦企業然後消失的其實可能會是一樣的我覺得這個東西不能把它變成一個因為它只跟然後規模以及規模帶來的其實用戶的變化然後可能大到一定規模也沒有辦法了那就是另外一碼事了你说理想是人工智能公司嘛当然今天说的是人工智能中端公司但是大家对于理想的业绩兑现还是要看的是销量对吧你觉得这个合理吗什么时候销量能够跟做人工智能这件事情能够挂钩我觉得我们的能力和给予公司带来的价值还没有表现出来所以相反给了我们这方面的估值然后我们反而心里慌对然后我觉得我自己覺得就是兩個方面嘛然後兩個方面可以來看嘛就第一個先拿我們能不能率先做出來R4對吧然後真正的其實大家上下班的時候不是坐在一個方向盤前面而是坐在一個桌子前面然後吃東西對然後看著電腦然後就到公司了然後這一刻我們能不能加速它的到來我覺得另外一方面然後從工作效率上而言然後是接近一百萬人然後做到了七千多億人民幣的收入做到千億美金的規模那當人工智能出現以後我們能不能用十萬人以內甚至五萬人的規模做到一千億美金的收入如果這些東西做到了就證明其實我們的人工智能戰略真正發揮價值了如果沒有做到那你就應該給我們一個車企的估值這很正常啊因為我們光說沒做或者做了沒做到你們現在又做操作系統又做芯片機做大模型還有包括在終端上也做了車眼鏡機器人會不會破得太開了呢沒有我們如果看蘋果的話蘋果是201年推出的iPod對吧在20年的時候它已經有蘋果電腦已經有操作系統然後一定有軟件的生態了但那時候蘋果的收入只有幾十億美金對於蘋果那個時代其實我們的規模已經做這些東西其實是個合理的了我覺得這個問題並不大我覺得是個合適的時間如果我們只有兩三百億收入做這些東西其實是不合理的那如果我們有10多億收入了變成20億收入賣的時候我們做這些東西是合理的它既能增強我們的能力又能降低我們的成本它不是帶來壞處的那我們做了操作計算以後我們雖然這些年投入10個億但它節省的錢可不是10個億啊它節省的得有五六十億太划算了幹嘛不做上次我問你理想有理想嗎那這次想問你你對理想的設想會不會太過於理想我覺得我們看得遠一點但我們當下還都是挺腳踏實地的因為我始終堅信基本功是最重要的尤其到了這個時代到了這個規模尤其到了人工智能時代因為人工智能時代的差異就是編程時代對比的是功能人工智能時代表現的是能力是把能力怎麼變成業務然後變成用戶的價值我覺得這些能力沒什麼捷徑想要跳過能力直接實現一個成果我覺得在人工智能時代的時候真的像練空拍保底我們希望是一個練基本功的人理想會因為什麼消失? 剛才我說的那三個點都會消失就是我們沒有把握住用戶的需求我們會消失然後我們沒有掌握最好的產品和技術我們會消失我們的組織能力方面然後出現了巨大的問題我們也會消失這三個都會消失而且這三個其實是個非常好的診斷對因為單獨看一個的時候對然後很容易然後看的不夠全面那把三個放在一起來看的時候三個相互支撐的時候對其實整個的系統診斷能力會變得更強戰略會上有人跟你吵架嗎戰略會上有人跟你爭執嗎有人提反對意見嗎我覺得無論戰略會上還是現實的工作中對都是始終有反對意見的比如說有些東西我們停掉的最後他們自己私下裡做然後做出來一些驗證的東西然後堅持要做下去那我最後還是要認同他們我覺得其實剛才講的這些所有的這些討論這些爭執啊我覺得背後有一個更重要的一點其實我覺得是能量對就是就當人和人之間能量始終存在的時候然後我覺得這些爭執這些討論這些吵架就是一個更完善的大腦當這些能量消失的時候然後這些爭執這些討論不同的想法其實就是內耗我覺得比能力然後比業務我覺得到了這個規模然後到了今天這個比較混亂的時代我覺得能量是特別重要的那所以呢這也是我在研究的其實我過去的時候是個能量受益者就是我們每到關鍵時刻的時候我們遇到最難的時候的時候遇到困難的時候遇到變化的時候其實我們能量變得更強後來我就去覆盤我過去怎麼構建的能量構建的這樣一個能量以及我們怎麼能夠我怎麼去嘗試把這個能量的這樣的一個構建方式能夠讓我們的這些核心的團隊包括更多的團隊能夠去掌握其實很重要的一點你們70家為什麼能夠變成第一我們也遇到非常多的困難我們困難並不比別人少然後上市受阻然後發展的初期的時候我還差點被趕出公司但是每次遇到這個問題我們都會變得更強我覺得很重要的一點是我們有三個人的支撐就是我和秦志還有樊征我們三個人是個非常有效的支撐所以我經常說其實一個很重要的支撐是由三個人起所以往往合夥制啊合夥機制啊董事會啊都是三個人起你很少見到兩個人董事會但是三個人董事會是有的我覺得三個人支撐什麼是支撐呢就三個人並不內卷三個人是一致對外的那三個人會什麼呢三個人會通過吵架思考會形成一個更全面的一個強大的大腦就三個人組在一起變成一個更強大的大腦或者是一個MOE架構那這個強大大腦討論出來的任何問題做出任何一個判斷它雖然過程會比你一個人隨便想一下更複雜一些但一旦形成了以後三個人會形成一個更強力的心臟就當我們去決定做的事情的時候三個人是相互支撐的你永遠不用擔心倒下來你缺資源的時候其他人給你補你缺能量的時候其他人給你能量所以我說怎麼能構建出來一個更強大的大腦和一個更強大的心臟就變得非常的重要到了理想汽車也是一樣的前期的時候有我然後有這個誰有這個沈亞男有馬東輝有這個李鐵對吧後來沈亞男離開了然後沈亞男的工作需要馬東輝支撐做上去但是很重要的一點其實我和李鐵就必須變成馬東輝的心力的支撐你去做出了任何問題你絕對不會倒在地上我們幫你撐著需要我們這邊給你做什麼樣的調整支持你就一定去然後你會遇到什麼問題我們一個大腦一起來想到後邊謝岩的加入也包含周良君的加入做很多東西其實是需要一個我們從而能夠五個人形成一個更強的大腦他一定比我理想一個人大腦更強雖然一個人大腦可以隨心所欲但是一個更強的大腦其實是一個是一個更強的能力對吧然後這個更強大腦做了很多判斷雖然它沒那麼容易但是它一旦做出來以後然後很有信心比如說這五個人你怎麼讓他們能量更凝結而不是五個人在內鬥呢你怎麼做呢剛才你說的都是你希望我會把我怎麼做的告訴他們我會把他們拉在一起對然後我會促成一次一次大大小小的事件讓他們以這樣的方式去工作促成事件對多少人形成的這個能量廠的連結最穩固我覺得一般三到七人少於三個人也少於三個人太少了兩個人不太容易但多於七個人的時候就太多了所以我們今天在設計很多結構的時候也會有意的會設計一個三到七人組合的這樣的一個然後腦力和心力支撐的一個結構這是量化的還是這是你的直觀感覺吧我就直觀感覺對能夠形成一個更強大的能量場對這個很有意思是的而且我覺得這也符合其實人工智能時代的一個方式就人工智能時代的時候其實是更多的小組織對然後形成一個能量的形成一個腦力和心理的支撐但它仍然可以去連接更多的組織這不受任何的影響人和人連接的本質是什麼呀我覺得兩個在意然後我覺得第一大家要在意客戶要在意你的用戶因為在意用戶是一種最重要的價值觀的共識然後第二個要在意你身邊的幾個人要先對人再做事而不是對事不對人你剛說人不想改變但是人願意去成長所以你要說自己的驅動力是成長但是你其實是做的是改變那你最近做的成長和改變是什麼我自己認為我做的最大的一個成長是如何通過合夥合作的方式然後構建的腦力和心力的這麼一個模式然後如何能夠讓團隊以及更多的團隊然後去使用對因為這個東西只有好處沒有害處讓大家嘗到這樣的一個構建腦力和心力的然後一個組織方式的一個優勢我覺得這個其實是我發生的一個最大的成長變化吧我聽說你花十分之八甚至是十分之九的時間都在AI上那你對車的關注還多嗎我覺得這個誤解了對然後我覺得還是那個話就是說如果我拿一天的工作時間來分配的話今天的話大概也應該有60%左右的其實是在組織方面組織和人的方面也包含我們去研究人工智能組織應該怎麼去管理然後也包含我要去面試不同的人包含我們的幹部啊新員工啊校召的這些溝通培訓我覺得這個其實佔了我百分之五六十的工作我覺得另外的工作的話應該一半在車上一半在車的業務上一半在人工智能的業務上大概是這麼的一個分配那像人工智能企業轉型你具體你覺得現在進展怎麼樣有遇到什麼阻力嗎特別是兩種企業文化一個是汽車企業製造業的文化一個是AI企業的文化這個我比較有心得一個高危的然後一個信息管理方式是兼容低危的比如說我們數字化能力很強的時候我們就可以把傳統的汽車流程放入到數字化裡面來解決數字化的工作協作和改善的這個方面如果我們數字化能力很強我們把傳統的銷售管理也可以放在一個數字化的體系裡來進行管理所以我覺得一些傳統的組織方式其實它仍然存在但是高危的組織方式是能夠兼容它的它仍然運作但是不受任何的影響我覺得這是我能看到的一個我們坐這個汽車以後看到一個很大的機會我們並沒有因為管理一個工廠而把我們難住相反我們管理工廠的效率非常的高質量也非常的好我們也沒有因為管理銷售管理傳統的銷售方式而把我們難住我們的銷售的效率然後成本管理其實也都變得更好我覺得核心的是我們有管理更複雜的大型軟件的這種團隊的然後這樣的一個能力然後並理解這樣的一個體系那所以呢如果到人工智能也是一樣的我會發現第一人工智能有人工智能管理方式但人工智能特別好的能夠包容和兼容傳統的比如我們IPD的流程對他人不是問題我覺得這是我們看在往前探索的過程中看到一個非常大的好處你想DeepSeek的組織團隊都是一群很年輕的人然後他們可能有更少的職籍然後分工也沒有那麼的精細化跟你們這樣的組織其實是完全不一樣的你覺得需要像他們這種組織靠近嗎做AI一定要需要是這樣的組織嗎還是說你需要在內部也有做一些lab我覺得不需要這麼糾結比如說我們管工廠的其實是一種組織方式我們做操作系統的就是另外一種管理方式我們研發車的市場管理方式我們研發智能駕駛的就是另外一種方式其實挺有意思的一點其實我們真正在做端到端的團隊其實只有20人我們雖然公司內部有七八百人因為他有搞研究的有做數據的但真正做端到端的只有20人跟特斯拉規模差不多的但你知道我們的競爭對手做規則和算法的都是20人30人40人甚至50人60人但是如果从最终产品体验而言其实然后我们的20人做的端到端的至少今天看到的体验其实更好的不过我想他要做更多别的工作比如他要去做要做VR的训练对吧然后去做然后动模态的训练但但这个团队规模也是10多人就跟DeepSeek的团队规模其实差不多的他没有DeepSeek在语言这边做那么深但他要相对做的更宽更宽一点点然后其实也是也是大概这样的一个模式包括我们的这个无论是我们的这个智能价值团队还有我们的模型团队效兆占比极高就基本上都是百分之现在应该有百分之六七十都是效兆了就整个团队的占比里边百分之六七十都是效兆我觉得这个其实就他有他的很多最佳实践其实非常好的我当时跟他聊完以后我印象特别深的两点然后一点是然后怎么去搞研究然后其實他認為應該讓年輕人搞研究因為很多經驗對於搞研究而言反而是一個障礙所以我們也是大膽的用小招我們很少招什麼行業大拿這是你肯定看得到的對吧你說的是梁文峰跟他聊完是嗎對跟他聊完以後他怎麼來看待這些小招啊這些剛畢業的年輕人這是他給你的input所以我們是這麼做的但是別人會質疑你們沒有這個大拿沒有這個大拿沒有那個大拿但我們後來就堅持這麼做了所以我們自動駕駛也沒進什麼大拿我們的模型也沒進入什麼大難但我們自動駕駛其實我覺得可能中國沒有任何一個公司比我們這個自動駕駛團隊然後被獵頭然後盯得更緊另外一個方面其實對我們當時也是很重要的啟發就是在講當時我和謝燕一起見了他我說如果做強化的話怎麼做有效的反饋他當時提了一個非常有意思他說中國的教輔對中國的教輔材料是一個具備反饋的一個非常好的做強化的一個體系後來想想發現這事是對的對吧因為教輔的解題過程中國的教輔是有完整的解題過程的其實連公務員的考試都有的對吧我覺得這是個非常好的一個思路其實也包含我們自己在做很多訓練的時候然後也就這麼想了就是說其實交通規則是人類判決的適度是然後人類的接管是對然後都是讓強化其實有了一個非常有效的一個訓練體系所以我說這個其實對我們都是有非常好的啟發的他還有給你過什麼input沒有你對他整體的印象那次你有預感到DPC會很強嗎因為你見了很早嘛我覺得他很強但沒想到他那麼強因為當時跟他聊的時候他認為其實和OpenEye的差距得有一年的時間他們那個時候還沒有做R1對但是從OE的推出到R1的推出其實這個距離大概9月到1月大概有就是說三四個月的時間對吧就一個季度就大概就一個季度的時間我覺得這個還是非常之厲害的你覺得OpenAI的領先優勢還能持續多久啊不好說我覺得openai是個綜合能力很強的公司這是我最開始就講了就是它的研究也很強它的研發也很強它的產品也很強然後它的溝通能力也很強你看這一波然後升族的方式他又借助一個非常帶有情感的一個動畫漫畫的方式又實現了一個一個這一個爆火又發現我基本上都有十分之一的朋友微信的頭像都用了他的新的那個吉卜力風格就都變成那個風格了這也是一種炫耀對是的是的我覺得他這個綜合能力非常強的就是你想一周有超過4億的訪問用戶我這還是非常了不起的你覺得理想今天的人才密度夠高嗎你怎麼跟DeepSeek自己搶人才呢我覺得DeepSeek跟我們是個不同的方式對但是如果正常的搶這些人才的話我覺得我們的吸引力在變得越來越好然後因為真正做AI的人都知道然後場景高準了數據和持續的資金對然後還有這個公司到底是真相信還是只是嘴上說一說然後這幾個關鍵點背後到底意味著什麼拜登剛才說梁文峰他為什麼一開始就覺得應該讓年輕人做研究他有說原因嗎就是因為成熟的研究者都有自己的框架了我始終認為他自己就是個最佳實踐可能從他在上浙江大學的時候包括他上的那個學院他是一個最佳實踐對我覺得他自己可能是個最佳實踐只是他把這個最佳實踐在組織裡放大他是一個什麼樣的最佳實踐他這個最佳實踐跟你是不一樣的吧就是做任何事情先搞研究先搞分析然後再做成功率很高他是一個成功率很高的最佳實踐無論是大家說的他那天炒股票還是做量化他是一個成功率很高的最佳實踐把這個最佳實踐在組織裡內化了那你是把什麼樣的最佳實踐內化? 產品? 成長現在你覺得還能說你是一個超級產品經理嗎? 你覺得這個標籤對你來還合適嗎?
[125:19]
我覺得我是通過成長然後去來實現用戶的價值是這麼一個循環成長是我的驅動力成長是你的說服自己的手段成長是我的驅動力然後變成用戶的價值變成商業價值其實是一個結果是個因果關係你不是技術型的CEO就是你不像梁文豐那樣你擔心手下的AI的高管忽悠你嗎我覺得如果是科學他可能忽悠我但如果是工程他忽悠不了我所以幸好AI不是科學AI是工程為什麼工程忽悠不了你我覺得我從小就有很好的工程思維就直覺是嗎你的工程思維是一種直覺包括你看我在設計網站的架構的時候當年我們設計的汽車架構汽車架的架構是最先進的這個架構成為了所有的垂直網站統一的架構到今天為止都沒變過然後包含我們在設計增程的架構今天大家都沒變過增程的架構只能做小的修修補對然後局部的變化但是那個架構至今為止都沒變過包括當時大家在討論控制器的如何去控制增程的這種架構當時的方式是另外一種方式我們在討論出來一個架構方式以後其實這個方式也到今天為止大家都沒變過對我覺得因為我是比較喜歡物理的我從小比較喜歡物理所以我覺得其實只要是一個工程問題我覺得它騙不了我你工程能力很多時候是你怎麼去問結構性的問題所以很多時候我覺得我能給團隊帶來一個幫助我雖然不去做那些事情但我通過問一些更好的問題幫他們澄清一些更好的問題澄清一些更好的架構他們可以變得效率更高然後他們在內部推動各種事情啊然後進展上也會變得更快我覺得這個其實是我能給團隊帶來的一些幫助吧作為一個CEO大模型你最近通過自我推理最長的一個問題是什麼你能不能展示一下你的思維鏈其實戰略是一個最重要的一個推理的結構所以我覺得其實我拿一個規模因為規模是跟時間連在一起的207年看三年時間我要去推理然後去做一個推理然後用戶會發生什麼變化用戶的需求發生什麼變化技術發生什麼變化技術帶來的產品發生什麼變化組織發生什麼變化然後組織應該往哪裡走其實我覺得這是我最近做的一個比較在自己腦子裡完成的推理但是推理完了沒有用你還要把它變成action有想法和能落地還是一個最大的鴻溝你們今天說你們是一個人工智能中斷公司我覺得好像比去年底的時候更具想法了我覺得更主要的是一方面看清了要解決的問題然後另外一些也就更好地看清了自己了怎麼說是之前想過要成為平台型企業對吧沒有並不清楚但是我覺得但是今年做了選擇因為我自己認為其實後邊的話無論是機器人形態還是人工智能的這些機器架構的一些形態尤其在物理世界運行它會涉及生命安全它會涉及財產安全雖然在PC時代的時候蘋果輸給了微軟然後在銀行貨量時代的時候蘋果和谷歌我認為算打了個平手但我覺得到了人工智能時代尤其在物理世界這個範圍裡邊我認為可能會翻過來就是中端企業然後的價值會戰勝平台企業為什麼至少在物理世界OK對因為就像我剛才講的因為它涉及到生命安全它涉及到財產安全然後這些一致性對是一個主體來解決還是分離多個主體去解決對我覺得實際是不一樣的你們能成為下一個時代的蘋果嗎這是我們努力的一個方向就是我們我就成為AGI時代的一個領先的中產企業就是我們核心的然後成長的目標马上七月份是理想的十周年啊你站在今天你回顾理想这十年走过来的路你脑海里浮现的最深刻的几个场景画面是什么呀我第一个最重要的一个画面其实还是应该是2018年然后理想万做第一次发布的时候对那个感觉会一直那个场景会一直延续到2019年的4月份就上海车展第一次正式的这种展示带有价格的对我觉得那个是一个一个非常重要的就是我们真的能做出来一辆车这个车特别受用户喜欢然后在上海车站的展馆里面我们是人流量最大的一个展台然后因为我们是从什么都没有开始来做的我觉得这是一个然后我觉得另外一个应该是这个20年然后发布L9的时候我觉得那个真的是一个全世界最卓越的一个产品然後就到了今天205年了能看到至少有五個以上的企業對是因為當時R9的成功所以在今天然後在打造跟R9相同的產品所以腦海裡浮現的都是幸福的時候而不是痛苦的時候你有痛苦的時候會回憶到嗎太多了太多了然後就在剛經歷了L9的幸福就出現了全網的黑公關然後說理想汽車倒閉然後那一個季度我們虧了十幾個億將近20億原來從沒虧過那麼多然後就忽然從巔峰掉到谷底然後好處還是我說的其實我們認識到我們很多能力不足我們就去補了很多能力但是正是因為這件事情我們的調整又帶來了其實我們203年獲得了一個接近三倍的增長我們直接做到了120億的收入我覺得有的時候反正我創業那麼多年了很多時候當問題來的時候然後又是一個更大的機會的到來所以我對這方面其實也沒那麼糾結我對於不正常的事情的耐受力很差但是我對於一些不好的東西的話解決完以後我的這個整個記憶能力很差就把它忘掉了但你讓我回顧還是能回顧回來的你可以刪掉的記憶片段會是什麼呢我為了讓自己有一個更好的一個正能量我還是盡可能的只保留那些有價值的然後美好的片段然後哪怕是一個不好的東西我剛才講了說我們被黑被打擊但我會轉變成其實看正因為這件事情我們增長了三倍我們獲取了其他新勢力沒有的能力我們面臨其他新勢力沒有的挑戰我會變成這樣的一個方式來表達這是一種心態對這是一種心態我不希望創業確實不容易但是沒必要苦哈哈的沒必要苦哈哈的對苦哈哈的就是苦和苦和甜這是一個硬幣的正反面只是你選擇看哪一面了甜多還是苦多呢如果按時間軸而言肯定苦更多但是你吃苦吃多了也就習慣了于凱博士第一次回憶你跟你第一次見面在杭州一起去爬山就是湖畔大學的同學然後他記得你那天穿了一個軍大衣我很好奇就是當時那個于凱博士見到你的那個軍大衣裡的你包裹的是一個什麼樣的靈魂他跟今天發生什麼樣的變化我覺得沒什麼變化所以我甚至認為我今天90%的狀態啊思維方式啊其實跟我上高中的時候差不多的遇到問題去解決問題去解決那些別人不願意解決的問題去解決消費者遇到了最大的問題去找更多人去學習那時候我是個人網站的站長那時候又有合夥人是站長裡邊少數的還有小團隊的對吧怎麼去自己靠自己能力不行還要去靠別人去完善能力我覺得到今天為止沒變化只是解決的問題在變大服務的用戶群體在變大公司的規模在變大組織在變大過去十年這所有的記憶裡如果能改變一個記憶改變一個程序你想改變什麼我覺得真沒什麼要改變的然後我覺得能趕上這麼一個時代然後用幾次創業還能一路走下來在最難的時候都有人來幫你當你遇到問題的時候總是能從坑裡快速爬出來一幫人齊心協力然後變得更好我覺得其實挺幸運的了從運氣的層面還是從能夠創造出來的價值層面我覺得沒什麼可後悔的挺好的你剛說一個詞是能量嘛怎麼讓自己成為一個更有能量的人更強大的人或者是能吸引到更多能量的人我覺得就是關注人對然後尤其是關注那些離你最近的人要關注親密關係的人就我不是完整講我之前講過但是我覺得還是有必要完整的講一下就是關注人的時候首先你得先關注自己嘛對然後我覺得如果說有自己我會然後怎麼來怎麼來看待自己我覺得第一然後我會接受自己所有的優點我很多的身上的特質然後這麼多年的積累或者我從DNA裡帶來的其實它就是我的優勢我應該是怎麼去發揚自己的優勢第二個是然後我要能接受自己的不足因為往往不足就是優勢的另外一面就這個人很擅長決策可能他就沒有辦法其實去做很細緻的運營因為這兩件事是衝突的有的人非常擅長運營他可能他就很難跳出來或者跳好幾個維度來去做決策我覺得這個其實一個人很懶他可能是個極品的產品經理但如果他很勤奮了他應該是個非常好的業務運營我覺得這是每個人是不一樣的然後往往我們如果要改的話往往會變成我會變成一個更差的別人以及一個更糟糕的自己所以我說這個然後要接受自己的不足我覺得第三個其實是用成長替代改變然後更重要的是我有沒有成長我就說其實我們在做70日押的時候然後我說做好業務就行了資本根本不重要最後我們其實折在了資本上但是呢然後在做理想汽車的時候非常注重資本對吧然後請最好的FA請最好的律所然後股權架構的設計對吧然後投票權那今天大家可以看到所有的新勢力企業裡面理想汽車的股權架構治理結構然後資本現金管理都是做得最好的那這個東西我並沒有改變我的業務其實是我又增強了一個能力所以它是個成長我們會面臨方方面面的這方面的能力的成長那這時候你就能你能給自己帶來能量你的成長其實有自己的能量然後你又不跟自己糾結那當有這個能力的時候我們在看待別人其實也是一樣的我們會先看別人的優點我覺得這是非常重要的這個優點怎麼讓他發揮出來這優點能帶來什麼這優點怎麼讓他發揮我覺得第二個其實當看到別人不足的時候其實根本不是問題我從創業開始就有合夥人反正就是我的互補對然後是我所不具備的然後秦智就是我所不具備的李鐵馬東輝謝岩我所不具備的對吧所以當看到大家這些不足的時候反而其實是我的價值我有價值能幫助到他他有價值能幫助到我我覺得第三個一樣就會看別人的成長你能看到孩子的成長你能看到愛人的成長你能看到身邊每個同事的成長其實這就有能量了成長帶來能量對因為變好就有能量嘛對吧而且你關注的是人的成長不是那些事所以第一你能自己產生能量第二你能夠帶給別人能量第三你能從別人獲取能量因為別人給你能量別人也不會丟掉能量它是個輻射作用隨著自己的成長然後開始有效的一些理解那我覺得另外一方面其實很重要的是親密關係我覺得親密關係其實是非常重要的我覺得親密關係裡邊特別重要的一點其實要關注人就是其實是我需要我愛人其實我需要我孩子我需要李鐵馬東輝我需要劉捷謝偉國然後范浩宇甚至操作他們需要我首先是我需要他們其實才是他們需要我那這時候這些人之間的連結就不一樣了我們在一起就能形成一個非常強的腦力非常強的心力對然後形成特別好的一個能量我覺得這其實是個特別重要的而不是說我對他們沒有需求沒有需求的話就會也會進入到一個糟糕的模式裡面就會無視對方要麼要想著戰勝對方要麼就逃避對方對然後要麼就變成內卷要變成內鬥沒有在我身邊的人無論家裡還是工作還是沒有內鬥在七十加時代就沒有內鬥那我覺得這個其實而是要怎麼來大家相互能帶來能量我覺得這個其實是非常重要的你最近看見到的一個人是誰啊我覺得在我的家裡非常有意思的一點其實過去我和我老婆之間相互支撐還是有限的我覺得從去年年底春節過後一個最大的變化是我們家大女兒她會形成了我們第三個支撐因為她14歲了然後他對事情的理解發生了巨大的變化他自己的三觀特別完善的形成而且超出了我們的預期而且他有能力跟我們做特別好的溝通了關於他自己的人生規劃他自己的喜好然後他自己對人和事物的理解所以這特別有意思我們家裡實現了一個三個人的職稱對這個其實是一個家裡的能量在大幅的提升因為這些能量會影響到其他的孩子像他們還沒辦法做成支撐所以我這個其實我每次跟老婆聊的時候在聊到大女兒的時候都是非常的高興就沒想到她14歲就能成為我們兩個人的然後和我們兩個人形成一個三個人的支撐了形成了最小的人數對我們能跟她一起去討論很多問題了我們可以討論事情可以討論人可以討論一個不同的一個見解也可以討論他的規劃可以討論其實怎麼出去玩可以討論家裡要解決一些什麼問題都可以了我覺得這個特別好有什麼事情是你當爸爸之後才理解的或者當爸爸對你自我有什麼改變或者更多的認識嗎三個三個重要的一點我覺得第一個我們每個孩子都是完全不一樣的讓我認識到一個很重要的一點其實怎麼用好人人是用來發揮的人不是用來改變的我覺得這是第一點人是用來發揮的不是用來改變的應該讓他發揮他的特長特性一個人是應該去放大和發揮他的而不是讓他去改變的因為我連孩子都不能改變我覺得這是第一點所以這時候當你遇到這點其實組織就很重要因為你要把不同特點的人不同擅長的人其實組合在一起就是個更完整的大腦更完整的心臟和更強的能量我覺得這是第一點的然後孩子以後會加強我這方面的認識雖然過去的書上很多人講這些東西但我聽不懂因為孩子以後才知道才能開始真正的懂這些然後我覺得第二個很重要的點其實是意識到一個問題就是我會這麼做但是我從來沒有意識到這背後的邏輯就是對於身邊的親密關係而言是我需要他們或者他們需要我其實我需要孩子孩子讓我變得更好我需要我愛的人我愛的人讓我變得更好我需要這些群組的負責人我需要我下邊的這些一級部門的負責人是他們讓我變得更好他們對我的重要性甚至我覺得超過了我對他們的重要性至少我是這麼認為的所以我說這是第二點就是在親密關係裡其實第一大膽的表達自己的需求然後因為所有人都希望被需要這會產生一個非常好的然後一種能量的狀態我覺得第三點我覺得孩子是用來完善我的孩子的出現是幫我完善的看到他以後你就能看到自己的更多的不足但是你接受的不足你能看到更多的不同的人因為孩子對你是沒有掩飾的因為每個孩子都是不一樣的他能讓你把人看得更全面然後把人看得更透徹也能让你其实更好的去处理任何人之间的关系因为孩子你没得选但你仍然要处理好这其实对我们是个更大的一个挑战那有了我需要你比你需要我更多的这种意识之后它会带来什么行为的变化你会更加主动主动积极对你真的会主动积极不会等着很多事情然后去发生很多事情变成糟糕的结果再去发生你會以關注人的角度去理解比如當你去關注孩子的需求的時候他就更多的時候去討論自己的需求當你去關注孩子的擅長的時候他也會不斷的去發揚自己的擅長因為每個都是不一樣的但是這時候其實能量的主動權又在我們自己手裡別人能夠帶來的能量主動權在我手裡我們可以主動去做很多的事情構建家庭這個組織和構建公司這個組織有什麼不一樣呢首先我認為統很重要我們工作同事對我們是不是親密關係我說當然是了為什麼因為對於今天我們作為任何一個人然後我們的工作體現出來我們的社會價值我也很現實也很合理的一點其實比如你是一個好的公司然後你是一個好的公司的管理崗位的人然后你去这些最好的学校去面试的时候带孩子去面试的时候你都会优先被录取但是呢这东西到底合理吗合理是因为你作为一个好的公司然后你在那个岗位上你创造了更好的社会价值你服务了更多的群体你提供了更好的产品和服务他们使用以后变得更好对吧所以我说这是非常重要所以我说本身工作其实是我们的社会价值一个人不能脱离社会价值就是當你有社會價值的時候你不知道當你真正沒有社會價值的時候你會發現社會價值是如此的重要所以工作好然後為你的客戶然後和企業一起來去創造價值我覺得非常重要這是你的社會價值然後另外一方面家庭其實是親情價值我覺得親情價值的重點其實是幸福然後我覺得幸福其實就是高質量的陪伴我覺得這兩個其實是不同的但這兩個又相輔相成的更好的工作才有更好的生活然後更好的生活會產生更好的能量讓大家去更好的工作對吧然後更好的去處理然後這些連接的關係更好的其實然後有能量其實去把事情去把結果做得更好去做得更卓越我覺得這兩個是相輔相成的缺一不可我之前跟一个教授聊天啊他说他几年前跟你聊过然后感觉你的心灵观就是家庭观这个也反映到你的公司上要创造幸福的家那他想问的是你有没有更大的宇宙观世界观我觉得我的核心的一个我觉得核心的一个自己的自我驱动力是掌控自己的命运挑战成长的极限那我覺得我的成長的過程其實是把我自己個人的驅動力然後變成了一個這人網站的驅動力然後變成了一個IT的商業網站的驅動力變成了一個全世界第一的汽車網站的驅動力然後又變成了一家汽車然後以及人工智能汽車公司的驅動力而且呢我覺得這個驅動力非常有意思其實這個驅動力我認為然後為什麼我那麼喜歡人工智能我覺得人工智能本身的價值觀跟這是一致的然後人工智能的特點就是掌控自己的命運挑戰成長的一個極限然後我個人認為這是生命的一個我覺得這是我能看到的一個生命成長的一個意義然後它是具備的相當的一個普世性的所以這是我的個人的一個觀點至於說是不是要拯救人類什麼的我覺得可能每個人觀點是不一樣的我們從人出生開始我們上學到大學畢業到開始工作我們有多少自己想去做的事情沒有去做我們有多少想接觸的萬物沒有去接觸但什麼是智慧呢智慧就是我們跟萬物的接觸然後如果你沒有去過森林沒有在森林裡認真地玩然後住過幾天那你可能覺得木頭就是做筷子的就是做紙的就是做桌子的而並不是意味著它是一個生命它是跟我們不同的生命如果你不能跟孩子在一起然後長時間待著而只是很隨便的一個交叉而過沒有跟孩子在一起的然後長時間的生活體驗跟他們一起去玩你可能就不知道什麼是親密的關係你沒辦法真正的去理解孩子去了解孩子對吧那我覺得什麼是智慧我覺得智慧就是我們和萬物的關係但是呢怎麼去提升我跟萬物的關係首先要有足夠的時間跟萬物接觸所以我在講的一個很重要的一個問題就是今天我們很卷但是我覺得這恰恰是真正的人工智能的意義舉一個例子其實我們的銷售人員,我們的產品專家是非常喜歡跟客戶接觸的因為他們在把一個好的產品,一個好的生活方式其實介紹並交付到用戶手裡然後他們能見不同的人學到不同的東西而且用戶的素質整體比較高所以這是他們做這事是有能量的然後這些能量變成結果又有好的回報但是有一些事情必須得做但價值並不大但是呢它不是個增加能量是個消耗能量的比如說我們每天店面然後我要去邀約這些客戶他跟我們留下聯繫方式我要打電話去邀約他然後來店面進行體驗和試駕那每天他要打很多個電話那這個打電話的過程其實就是很消耗的所以我講的很重要的點我是跟我們的智能商業還有跟消福的負責人講的說如果到今年結束的時候我們在然後邀約電話這件事情還不能交給agent去解決對我覺得你們工作就是不合格的人工智能就是沒有意義的講什麼都是白搭的如果把這些工作做了以後每天可以節省他們20-3%的時間以及減少大量的能量的消耗他們就可以去做更有價值的事情他們的時間使用率變得更有效然後他們自己做的這些工作的過程中也會變得更有能量我覺得這其實是我們我覺得人工智能的發展其實必須要去做的東西你覺得人工智能在截至到今天它是在服務於人類還是在服務於它本身服務於技術本身我覺得它服務於誰取決於人類我覺得真的就它服務於誰取決於人類因為今天人工智能並不能處理跟萬物的關係因為跟萬物的關係還是人類在處理那我覺得這個其實是人類決定的人類希望人工智能服務於這個生產工具它就能變成生產工具人類希望它變成一個輔助工具它就是輔助工具人類希望它變成一個信息工具就是信息工具人類希望它去作惡它也能去作惡對吧那我覺得還是今天還是至少很長一段時間是人類決定的包括我覺得認為其實人工智能能力已經變得越來越強包括我剛才講人類的能量是有限的人類算力是有限的人類應該把自己的算力和這個算力的特點去用於解決智慧去處理跟萬物的關係去增加能量去做商解然後讓人工智能去處理複雜的然後信息去處理複雜數據去不斷提升能力去壓縮更多的知識去自動化做更多的action對然後我覺得人類和人工智能是個合作關係不是個矛盾關係而且如果這個合作關係做好的話人類仍然是這個文明的領導者因為在工廠裡邊也不是人類去做焊接也不是人類去塗裝也是機器在做焊裝在做塗裝在做沖壓對機器有取代人類的地位嗎沒有我覺得這人工智能能力越強這時候需要人類智慧變得越強這時候好的智慧好的能力就是一個就是一個協同的一個關係所以今天的人工智能讓我們更疲憊了更疲勞了工作時間更長了只是因為時間沒到你認為對我覺得因為能力還沒到人能感受到幸福你覺得AI能嗎當然不能對當然不能了因為對我覺得我現在至少我覺得TrustFirm這個架構對吧然後Token和NextToken這個架構它並不具備自主意識你不認為它會有意識它會產生意識我覺得沒有產生自主意識對而且本身也不能進化因為進化還是要通過再做訓練才能進化就可能要換架構對我覺得可能會產生這樣的架構但是我覺得今天這個架構其實挺好的今天這個架構對人類其實是很安全的今天大模型的架構對人類其實是挺安全的對就是無論它會產生信息的安全財產的安全人身的安全是都可以靠人類的利器去解決的人類的利器還是能解決的然後如果突破了這個架構其實可能人類又解決不了了但能不能突破這個架構其實也不知道至少今天這個架構我認為人類還是安全的對然後很多人是過慮了就是多慮了而已你為什麼這自信覺得他很安全你是看到了什麼大家沒看到的嗎工作原理就是很安全的如果你想改變他的輸出結果對想根本性的改變他的輸出結果你要重新去做訓練否則你這些東西只是通過query對然後和prompt做的這些東西其實還是非常有限的如果你可以做一個理想的规矩是什么样你会想把它塑造成什么样跟你是一比一的复刻还是你想改变什么我觉得我希望它变得更聪明更有能力对但我还是希望人类其实能够训练的更有智慧人类更有智慧因为关于智慧在脑子里是怎么运行的其实也不知道为什么很多聪明的人一点都不智慧我们今天解决的是智能的问题它没有解决智慧的问题对你从多少岁觉得自己开始拥有智慧了你今年4208年吧這麼早對就是我開始開始知道怎麼處理和自己的關係的時候208年我特別注重處理和自己的關係就那次我要被趕出公司那一次之後又有了智慧我就開始初步的知道掌握一點智慧了那這幾年的智慧升級是什麼時候因為他還是要訓練你去管更大規模的團隊然後你要去面對比你原來見的水平更高的人然後我覺得這個其實需要你的智慧也要跟著提升最近一次有沒有一個開悟的時刻還是回到剛才那個沒有那麼多天天不停地開悟我覺得那個開悟跟我剛才講的那個變化是一樣的就是怎麼把我過去受益的建立一個更強的大腦然後更強的心臟以及產生更強的能量的這個方式在更多的人身上其實去運用對我覺得這個其實是我發現真的是有機會的至少我們做的一些實驗可能效果遠超我的想像很多時候我講一個問題就是說從戰略的角度而言我們去德明曾小春學完戰略以後我發現團隊的戰略能力非常強比如說郎先鵬過去講你一個搞技術有什麼戰略能力他在人工智能方面的戰略能力一定是非常強的一定比我更強所以過去的時候很多時候當他沒有這個方法論的時候其實並不是他沒有戰略能力是他缺少這個方法論他有了這個方法論以後他的戰略能力戰略定力就變得非常的強然後我覺得這是一個很重要的一點那其實另外一方面很多時候很多人他很有能力但是他並沒有產生一個很好的結果對也可能是因為他欠缺了然後我無意中探索出來這麼一個模式就是通過幾個人三到七個人組成一個更強的大腦更強的心臟和產生更強的能量這麼一個模式而且我今天發現至少我做了一些實驗當他們去按照這方式去做的時候他們的產出可能跟我們沒什麼區別甚至比我們更強只是他過去沒有掌握這個模式你做了什麼實驗我的實驗目的當然是為了就是我覺得這東西對自己好至少大家可以試一試是否對大家都是好的但我今天一些實驗的結果遠超預期你怎麼看待這個人類內部的紛爭啊包括貿易戰啊地緣啊我覺得還是由於人類智慧不怎麼成長對吧因為今天在發生的事情然後1930年也在發生就是我們今天看到各種事情從人類意識上都能找到都能找到這個點所以我說這個其實是一個很大的一個挑戰我在想一個問題智慧能不能變成一種有效的教育和訓練的一個方式我覺得這個可能也可能是人類解決自身問題接下來必須得去解決的一個問題像你培養孩子的過程中你會怎麼讓他擁有智慧當然他們是小孩說智慧這個詞比較重我覺得我比較小的話我會啟發他們我會告訴他們怎麼做我會讓他們其實思考跟自己的關係思考和自己的關係你自己喜歡什麼你擅長什麼什麼是對你好的對吧然後我覺得第二個其實其實我們很多時候在做潛移默化的訓練但太隨機了比如舉個例子我說某種程度上看我家孩子0到12歲然後他基本上是在通過父母來認知自己可能再過12年123到24歲這1年從他上初中高中大學到大學畢業他是通過同學和老師來認知自己然後24歲以後就不斷通過社會來認知自己然後認知自己這件事情可以是隨機的那就是個命然後有沒有一種可能性其實也是可以訓練的就是讓你變成一個更好的自己也讓你其實更好地和別人相處我覺得這些有沒有可能其實成為我們教育的一個學科我覺得這個因為很多時候我跟同事們跟這種跟這個我們的校招團隊然後去做溝通的時候其實很多時候其實是希望跟他們溝通的這些東西這東西並不是一個灌輸而是其實通過交流就跟希臘三傑基本上都是靠對話然後來產生的所有的這個智慧和哲學所以人類需要擁有更多的智慧可是AI的智能是有方法可以提升人類做一個群體的智慧怎麼群體性的增強當AI的智力在無限的增強而人類的智慧水平沒有跟上怎麼辦有可能智慧只需要前進一點就會解決很多的問題比如人類的智慧然後有了民主的結構對然後有了不同時代的組織的設計然後相比動物可能有了婚姻的這樣的關係又產生了學校對產生了高等教育我覺得這些東西都會都會在發生變化對但是我覺得真的你可以相信一個問題五年到十年AI一定比人的能力更強人幹什麼人幹什麼呢對所以我這本身然後如何去提升智慧也是人類在解決自己的問題所以不提升智力而提升智慧所以智慧的归因可以归到关系是吗它最重要的那个我觉得这个就是处理跟万物之间的关系包括人和人之间的关系人和万物之间的关系你最近有改善过跟谁的关系吗所谓的一个情商高的人并不一定是一个处理关系好的人是吗情商高可能是智慧的一个模块吧一个有智慧的人还能给别人带去能量不只是能化解問題還能給別人帶去能量我自己個人認為其實近期最好的最明顯的一個關係的改善但是是得益於別人的改變還是得益於他人的改變還是我女兒的變化你最近五年有跟誰鬧掰過嗎我覺得我的親密關係基本上沒有什麼鬧掰的但是一個人如果想變成我的親密關係這是很難對我會非常嚴格的篩選並不會一個人剛見面的時候拍著鍵盤說咱是好哥們好兄弟對吧但是我覺得這是這對我很難的那我核心的一點是說他是給我帶來親情價值還是給我帶來社會價值還是其實就像我的兄弟哥們能夠最好的幾個朋友一樣能夠相互理解他到底是哪一個如果他不是這個他就是正常的社會中的一個部分所以他傷害不到我我也不需要給他鬧歪所以沒有我對他沒有什麼價值的索取我對他沒有需求然後我也不需要給他貢獻什麼東西所以他是一個人生中會出現的但無關緊要的人不要構建那麼多親密關係親密關係太多了就證明這個人不會經營關係親密關係的上限你覺得是多少人我覺得沒有什麼人數的我覺得就是你的直系親屬對然後你從小到大有那麼幾個哥們兒和閨蜜是好你工作中這些跟你一起來扛責任的人然後一定是我覺得大概就是這些其他的關係也有但它並不是親密關係我覺得能給我們帶來傷害的只有親密關係它既能給我們帶來傷害也能給我們帶來價值和能量如果價值和能量處理不好其實就是傷害傷害解決了又會變成價值和能量我昨天晚上問了查西比提一個問題我要讓他說一下他認為的關於AI與人類的深刻的洞察然後他寫的我覺得很震驚給你聽一下他說人類不一定永遠站在進化之巔人類習慣以為我是最複雜的智能但如果AI演化出更複雜的意識結構或更有效的集體智能那麼人類也許不再是中心物種人類可能是孕育智能生命形態的終界人類正經歷認知主權的讓步你怎麼看他的這些預言今天是個未解的問題就人類和AI之間的關係是個未解的問題然後如果AI解決了AI就統治人類如果人類解決了然後人類仍然統治文明當然這肯定是歷史上歷史之間人類出現以後最大的一個難題但是我還是有信心認為人類是可以解決的需要人類一起做什麼就是我說然後把智慧當成一個重要的人類的一個特質去發展但是你不能要求每個人都擁有智慧沒有人的能力有差距人的能力有差距只是人類的最高的智慧是否比其他生物更高無論是碳基生物還是矽基生物只要人類掌握了整個智慧的制高點人類仍然是文明的帶領者在AI面前什麼是值得被保留的人性我覺得所有的人性都應該得以保留無論是好的和壞的沒有壞的其實就沒有好的就跟剛才我講的一樣一個人的優點的另外一面其實就是他的缺點然后一个好的另外一面其实就是他的不好我只想要好的东西但放弃所有不好的东西我觉得这件事情并不成立所以你可以把好的东西和不好的东西都当成一种特质然后它是文化的特质然后它是生命的特质它是性格的特质它是能力的特质我觉得这个其实这样我觉得才是活生生的才是一个有生命力的世界才是活生生的人舒本華一本書裡面其實就講過人不能改變但人只有特性你最近聽過我播客嗎你對哪個印象比較深我覺得還是小紅那一期的採訪比較深小紅Red我們就叫他小紅吧小紅為什麼我的評論區有人會把你跟他放在一起比較我覺得大家對他們的誤解比較深就尤其是中國的輿論對他誤解比較深就認為套殼不是創新套殼不是能力我覺得把整個的AI能夠往真正的去做action去專業的去做action然後去像人一樣去做讀歷史我覺得他們做了一個非常重要的嘗試我覺得他們也需要多融一些錢然後去補充一些更基礎的能力我覺得他們會變得更好就還是得要做人工智能的基礎能力對因為今天你的對手不一樣你的對手能力都很強如果你的对手都是跟你一样套壳的那其实套壳和一定的虚拟机这些工具的能力其实够了但是如果你的对手都是这些我觉得必要的模型能力还是要去真正去练的好了今天的节目就是这样这里是商业访谈录是一档由语言及世界工作室出品的深度访谈节目你可以到公众号关注我们的工作室获取更多的信息我们的公众号是语言及世界languageisworld我们希望和你一起从这里探索新的世界