Summary1 min read

《张小珺Jùn｜商业访谈录》136期

全球大模型季报第9集：和广密聊，Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS

播出日期：2026年4月14日

概览

本期《商业访谈录》继续深度追踪全球大模型领域的最新动态，邀请广密一同回顾和分析2026年第一季度AI行业的颠覆与演进。对“Coding”作为AGI（通用人工智能）发展第二幕的核心地位、硅谷三巨头（OpenAI、Anthropic、Google）的战略分化、产品路线与组织文化展开剖析，并展望“模型即新一代操作系统”的趋势。还涉及白领通缩、社会影响及投资视角。

主题及结构

[00:06] 节目开场与季度大事回顾
[04:20] Coding成为AGI加速器及其变革性意义
[14:30] 硅谷三巨头战略、文化、执行差异详解
[54:16] 其他关键玩家（Meta/XAI）及新生态创新
[62:52] 国内AI势力与全球趋势对比
[67:11] 模型公司新一代“OS”定位及未来路线
[72:00] AGI加速度影响白领职业、社会与投资策略
[80:05] 未来挑战、窗口期及个人建议

关键讨论与深度观点

1. Coding是AGI发展的“第二幕”

广密判定：“Coding 是新的 AI 加速器，正在加速 AGI 的实现。领先的 Coding 模型就像领先的 GPU。”[00:06]
关键意义：
- Coding 让AI从“Chatbot/对话”进化到能主动搞定高价值复杂任务的“Agent/智能体”模式，AGI突破临界点正在被拉近。
- “今年Coding像海啸一样涌来，有点猝不及防。”（张小珺）[03:12]
- 复杂任务的实现变得高效——从idea到原型开发，周期从数周压缩到数天。
- **一线观察：**顶级AI/程序员已经不自己写代码了，Coding AI已达到CTO/架构师水平。[12:30]

2. 硅谷“御三家”战略、文化、产品路线解析

2.1 Anthropic：一体化专注与数据驱动的“塔尖玩家”

组织/文化特点：
- 极度聚焦Coding，从2024夏天SolNet 3.5起全面all-in。
- 排除分心：放弃多模态（多模态模型）、2C市场，战略极度Top-down。
- 核心创始团队物理学出身，极重视数据闭环与工程效率。[23:40]
- “他们的文化是坚定执行，把脏活苦活做到底，数据比命还重要。”（广密）[25:13]
产品力与用户定位：
- 高定价、服务高端开发者，保持高盈利、高ARPU（人均收入）。
- 发布节奏极快——“过去50多天发了70多个新产品和特性。”[15:55]
- “Anthropic是战略专注和产品敏锐的胜利。”（张小珺）[29:58]

2.2 OpenAI：C端成功的典型，战略调整与多元创新

强项与困境：
- ChatGPT拥有最大C端用户池，曾两次范式转变的胜者。
- 近期面临增长停滞，“发现Coding比Chadbot大10倍。”[34:36]
- 战略上对Coding重要性认识滞后，现正全力补课，Agent和Coding团队地位极速上升。
组织文化：
- “OpenAI最大的问题是不够聚焦，赛姆有VC属性容易摊大饼。”（广密）[46:15]
- 强调0到1创新，苦活、脏活、数据沉淀方面略弱，易FOMO。[47:15]
未来走向：
- Coding能力已明显提升，Agent能力差距正在追赶。
- “OpenAI的组织和文化能推出范式突破，但务实细节仍逊色。”（广密）[51:25]
- 预判下一版“GPT5”级别新模型即将登场。[52:18]

2.3 Google（Gemini）：工程导向，C端多模态战略失误

现状与失误：
- Gemini 3曾引发热度，但用户复购与市场拉新平平，被认为高估。
- 组织更工程师和技术驱动：PM（产品经理）影响力弱，步伐慢。
- coding优先级调整晚于竞争对手——“晚了三四个月后可能就落后一年。”[58:24]
资源与未来：
- 算力最强，现金流充沛，最“稳定的跟随者”。
- 长期能catch up，但短期持续被Anthropic拉开差距。“Google更像是一个机器，可以随便换几个人。”（广密）[61:16]

3. Coding的核心壁垒和难点解析

技术、组织、数据三重门槛：
- 数据壁垒最大，必须能组织世界最聪明的一批all-in做数据采集与清理。
- “并非每家AIlab 都能让几百人只干脏活。”（广密）[25:55]
- 领先模型公司必须拥有最领先的Coding模型，否则会被第一梯队淘汰；Coding数据对外不易开放。
- 难度系数高，做不好可能被远远甩开。[27:05]
模式变迁三幕论：
- 幕一（Chatbot/对话）→ 幕二（Coding/Agent高价值任务）→ 幕三（自动化AI研究员，自动探索科学前沿）[20:28]
- “可能九成知识工作可以被自动化。”（广密）[20:10]

4. 新一代“模型即操作系统”（Model as OS）趋势

“模型正在成为新一代操作系统，未来最领先的模型，就像全球技术设施一样，会是生活、工作、科研的底层平台，甚至比Google今天的基础设施还重要。”[68:35]
应用生态将基于Agent不断扩展，模型掌控“无限扩展”的应用场景。
“这就是未来的新生态，就像Windows、安卓，模型成为新的全球GDP操作系统。”（广密）[69:45]

5. 新玩家与全球创新生态

Meta（TBD/Minas）、XAI、Cursor

Meta：强大人才储备、速度飞快，产品路线更倾向“个人助理”，产品/模型协同反推，需整合起新收购的Minas。[54:16]
XAI/马斯克：“战略摇摆大、团队流失严重，短线掉队但资源巨。做模型不像FSD数据那样，不能单靠堆钱猛攻而应注重数据效率。”（广密）[57:38]
Cursor：应用层公司难以超越模型公司红利，窗口期逐步消失，未来或被巨头并购。

6. 投资与行业格局展望

头部公司营收爆发式增长：
- “Anthropic和OpenAI今年底可能各自80、100亿美元AR，明年目标20~30亿美元已不夸张。”[19:40]
**投资主线极其明确：“模型公司本身就是最好的投资，每家都可能是未来市值十万亿美金级别。”（广密）[73:15]
**AGI基金策略：“你要投能持续做好SOTA model的公司。”[74:05]
投资核心指标：持续能力、算力规模、组织聚合、技术壁垒、人才密度。

7. 社会影响与白领失业加速

模型能力指数级增长，社会未准备充分：
- “过去一个季度AI的进步，等于人类智力二十年进化。”[64:12]
- AGI主攻的是知识、智力的去中心化，“白领中产将大批被取代”。
- “今年美国本科毕业生就业率历史新低，程序员、朱聂等职位消失最惨烈。”（张小珺）[65:18]
- “30%工作岗位可能会消失。”[66:32]
建议：
- 积极拥抱AI、成为创造者、主动学习新工具，才能抓住转型红利。
- “积极拥抱AI的人才是受益者。”（广密）[70:45]

8. 新兴前沿趋势与个人体验

Harness Engineering（环境工程学）兴起：“人和Agent地位逐步一体化，未来需要为AI配备完整的工作环境、流程和资源管理体系。”[61:49]
机器人、硬件与Vertical Agents（垂直Agent）：“机器人和AI for Science或许是下一个大平台。” “中国在硬件和机器人领域或可弯道超车。”[79:00]
One Person Company（个人公司）：“强大模型平台后，一个人就能做原来百人能做的事。” “10美元token能否带来10美元收入成为ROI核心。”[81:20]
个人感受：“过去一个季度，我从ChadGPT转型为中重度CloudCode用户，生产力提升极大，但危机感从未消失。”（张小珺）[83:00]

精选金句与深入思考

“自然语言是对世界的描述，Code是对解决方案的描述——代码及方案。”——广密 [21:09]
“做好coding的难度系数有多高？如果高于9分，Anthropic大概率会一家独大。”——广密 [26:20]
“今天胜利的秘籍，可能就是下个时代的毒药。”——广密 [53:05]
“模型未来就是新一代的操作系统。”——广密 [69:45]
“人类的知识和智力正在被AI极大压缩，过去靠学习获得工作，如今这些价值逐步消失。”——张小珺 [65:30]
“今天才开始明白：Coding和Agent，并不是一个工具/功能，而是整个AGI进程的决定性加速器。”——张小珺 [32:12]
“未来只有RoI正的创作者和公司能存活，One Person Company是终极解。”——广密 [81:29]

总结与展望

**行业加速进行时：**模型技术、Agent能力和赋能路径短短一季度实现跨越，全面加速。
**格局仍将反复震荡：**三巨头、Meta等头部公司持续相互超车，“巡回赛未到终局”。
**社会与组织大考：**知识型职业与传统路径面临系统性变革。积极适应、主动拥抱AI才能获益。
投资主线极致聚焦：“能持续做出SOTA（最优）模型的公司就是明日之星”。
**模型就是未来的技术底座与操作系统，AI的产业与社会影响将更全面、更深刻。

“各领风骚一百天，格局短期定不下来，你追我赶持续交替领先。未来就是模型的世界。”——广密 [72:29]

本期由语言即世界工作室出品，公众号「语言及世界 languageisworld」获取更多内容。

Loading summary

Transcript6 lines

[00:06]
A
Hello,大家好,我是小駿。今天給大家帶來的是全球大模型季報的第九集,這一集的情緒十分的複雜。一方面,你會看到正在急速進化的AI革命,Coding把AI從聊天機器人Chatbot的第一幕,推向了能夠幹活的Agent第二幕。研究員們已經開始不再親自寫代碼了廣密帶來的核心判斷是Coding是新的AI加速器正在加速AGI的實現領先的Coding模型就會像領先的GPU另一方面社會層面隨之進入了白領通縮與失業的窗口期整個社會準備好了應對這麼急速變化的AI革命了嗎? 206年期待我們和AI共同進步你相不相信code可以表达数字世界的绝大多数任务因为自然语言是对世界的描述code是对solution的描述就是语言及世界代码及方案如果领先的模型公司不重视coding它大概率会掉出第一梯队的对我觉得硅谷预算家过去三年有时候你觉得openai无敌三四个月前又觉得Gemini王者归来今天是Anthropic春风得意我是感觉每个公司都有自己的窗口吧各领风骚一百天今天胜利的秘籍可能就是下个时代的毒药对吧OpenEye在拆的GTT过于成功让他们专注2C而忽视了coding今天是全球大模型記報的第九集過去三年,我和廣秘一直在用記報的形式記錄著大模型的技術進步和趨勢走向從203年到206年,一直追蹤我們的聽眾會發現很多記報裡的內容都慢慢變成了現實那最近感受最深的就是我们去年记报里一直在说的CodingCodingCoding今年就像海啸一般涌来了感觉有点猝不及防那站在206年第一季度广明你有哪些突出的感受能不能先带领我们感受一下本集记报的概览内容過去一個季度變化實在太快了希望我們機報傳遞一些最新的洞察和思考幫大家更好的理解AI也提前應對好AI海嘯的衝擊今天主要聊幾個方向一個是給大家傳遞一些在矽谷的一些體感和觀察第二部分是分享一些对coding这个变化最新的一些理解和认识为什么coding是今天的主线任务第三也讲一讲硅谷叫核心域三家模型的一些观察尤其是战略组织和文化也可以讨论讨论未来模型的终极形态会是什么为什么是操作系统后面也可以聊一下对社会的潜在影响失业通缩和投资这几个方向去年我其實還有點擔心大模型的技術進步曲線會就此放緩了會不會206年有點無聊但是剛過去的第一季度的感受是完全相反的很多人都會反饋感覺有點跟不上了那你覺得過去一季度哪些事情是最值得給聽眾朋友們畫重點的我觉得就一件事吧过去一个季度最本质最关键的一个转折点就是Anthropic的Opus4.5到4.6这个模型的跨越吧我觉得算是一个从GPT3到GPT4水平的叫跨时代的提升吧就是让我们从chat问问题变成了真正的agent模式可以做高价值任务了因为你做的任务的价值量提升了所以它的价值就提升了优势值也在提升我的体感是过去一个季度模型水平进步的幅度可能超过了205年全年的进步幅度你包括Anthropic和OpenEye这两家都会有新的模型Mesos跟Spard马上要发布对吧我觉得这两个是真正的GP5的时刻吧然后之前还不算是吧对之前我感觉OpenAI的GPT5一直跳票嘛就是Opus4.56有这个意思了我感觉像半代可能接下来的真的算是真正意义上夸上了GPT5吧因为今天过去就是一个model你可以跟他chat可以对话问问题可以联网搜索对吧那今天是agenttech能力上来了可以帮我们做复杂任务了复杂任务的高价值量就上来了吧而且我感觉加速度特别快有可能今年夏天六七月份之前可能还有一个GPT3到GPT4的跨越就即便说Anthropocene新的Methods和Spark很强也好但可能他们的下一代更强因为下一代也已经开始在训练过程当中了所以过去一个季度的推背感非常强我是感觉AI的机点时刻应该已经到了过去一个季度是的,以前我们还觉得AGI挺遥远的但是现在身边有些朋友也觉得两年内肯定AGI就实现了那你对硅谷一线的生态都很熟悉有哪些真实的case能够给大家分享一下让大家能够感受到这种真实的代际的跨越可以描述的更有体感一点对我觉得硅谷这边一线的体感可以说一些case让大家更好的体会到就是你在这边的朋友就是前沿实验室的这些AI的researcher们包括很强的程序员他们基本上不写代码了去年可能一个系统当中可能还有七八成的代码是人写的今年可能是小于1%的就是大家日常的工作可能就是就像leader或者教授带着学生和teammember去工作一样就是AI来写人来审可能人来审的这个能力都不够了今天CloudCode和Codex在很多任务上其实已经到了很多公司的CTO或者首席架构师这个水平了就对标一个meta的R8和R9其实你看他开发一个feature可能两三次的迭代就跑通了对吧我们认识的身边的人基本上每天都消耗几百美金的token一周几千美金这个量还是挺夸张的所以这个就带来一个效果就是你过去做研发和做研究以前一个想法到跑通代码可能两三个星期现在可能有一两天两三天所以这是一个大幅的加速就是Coding和Agentic变成了一个AGA加速最关键的一个要素之一了吧可能仅次于GPU本身了然后我觉得还有特别有意思的就是说也有朋友跟我说最近很多AIResearch上的突破不是人类工程师带来的而是CodexCloudCode带来的我觉得这是一个更质变的信号就是说AI今天可以显著的加速AI而且带来一些突破了你以前解一个很难的数学MU的题可能解个半天今天Codex帮你解可能很快对吧也不是很多人都很擅长解题或者debug对吧你包括它对整个其他领域的研究加速也很大你比如说做多莫泰的朋友说他们以前做一个多莫泰的模型整个数据迭代可能就一两个月吧那个现在基本上几天或者一个星期就是coding加速后你发现对多莫泰的研究加速也很大这个让整个数据处理的pipeline其实提效挺快的主要的变化就是模型處理數據的效率是比人要高的然後你包括還有一線的體感就是這個是公開的就是Anthropic他们过去50多个工作日发了70多款产品和features对吧这个在互联网时代好像是根本做不到的我估计大家可能在网上都看到过那张图所以coding我觉得是过去一个季度最关键的关键词吧它会让最顶尖的1%甚至千分之一的人他的生产力放大了几十倍我觉得这个是一个很大的变化那你觉得Coding和Agentic带来的变化这么大有给这几家公司在营收上带来显著的变化吗我觉得这个是一个更有意思的就是说你看Anthropic他们已经官宣说AR超过了OpenAI对吧但更重要的是它可能头上的一两百万用户贡献的收入超过了OpenAI可能五六千万订阅的这些用户所以之前你觉得ChadGP在C端已经赢了但发现C端好像没有coding或者agent这个更大所以今天我感觉更有意思的是不再是只追求DAU或者广告这个规模而是追求tokenusage这个指标尤其是超级开发者或者塔街的这个用户这个感觉更重要所以你看coding的爆发性我感觉比chatgpt当年还要陡峭就是如果这个势头下去年底openair和anthropic他们的AR有可能就到80亿美金或者10亿美金那明年可能就奔着20多亿美金去了其实他两个已经成为了新时代的MAGA7这种公司了所以你看他明年如果盖的一个20多亿美金的AR那其实给个十几倍的PS好像也非常makesense对吧所以你看历史上几乎没有出现过两家公司齐头并进这么短的时间内做到千亿美金营收对吧Coding的runrate从过去两三年就超过了GoogleCloud做了可能十七八年的一个规模但GoogleGemini其实规模也很大所以你看模型的revenue增长是非常陡峭的听起来coding是智能的一支非常重要的推手突然让很多不可能的任务都变成了可能也让产品形态从chatbot走向了agent那我们去年QE的播客就在聊AGI的主线任务嘛你当时就一直在说codingcodingcoding包括你去年也跟很多人去说了codingcodingcoding你觉得当时你对于coding的理解已经足够深刻了吗那今天你对于coding的理解有什么新的变化我覺得新的變化可能更多是幾個強觀點或者視角吧我覺得第一個觀點就是說你相不相信code可以表达数字世界的绝大多数任务因为自然语言是对世界的描述code是对solution的描述就是语言及世界代码及方案对吧因为语言和代码是高度的浓缩抽象而且覆盖范围非常非常广如果这个假设成立codingagent做好了是不是就可以把白领知识工作者的大部分任务都可以自动化了就是今天我们在办公室电脑上操作的大部分工作人物基本上都可以被自动化了我觉得这是第一个观点吧我觉得第二个观点是如果领先的模型公司不重视coding它大概率会掉出第一梯队的而且也不存在只给自己用的codingmodel因为你自家的任务数据分布是不够全的肯定是落后的而且如果你作为一个领先的模型公司你过度依赖anthropic一旦你做到第一梯队对他有威胁了Anthropic大概率是給你斷供的,OpenAI被斷供了,AXIAD被斷供了,可能Google大部分被斷供了可能Somehow哪一天Meta也要被斷供了,有可能Coding這個跟GPU是一樣的所以你看Coding它不只是一個行業,也不只是一個應用場景,也不是一個產品,不只是一個產品其實它反而變成了AI整个路线途中一个重要的加速器所以我觉得它应该是一个当下最主线的任务你没有最领先的codingmodel就像是没有最领先的GPU你用A10跟别人用GB这个差别是很大的对吧那还是要追求先进生产力嘛不然你研发上就是很落后的我觉得第三个观点就是coding就很像亚马逊当年卖书一样你借助卖书把所有的仓储物流用户供应链都拉通了然后你再横向scale其他的SKU这样就很容易所以那你又从长期来看coding又只是整个AGA实现后可能很小的一部分因为AGA自动化了全球大部分的GDPcoding其实更多还是在整个AGA实现中起到一个加速和打样的一个意义吧我觉得之所以coding最先跑出来还是因为反馈闭环最短就是整个所谓的feedbackloop最清晰其实你看过去几年AI跑得最快的地方都是feedbackloop最清晰的我觉得第四个还有一个比较有意思的观点就是Coding在整个AGI的历史进程中到底处在什么位置因为第一幕我们看到是Chatbot对吧ChatGP模型可以对话了也可以联网搜索了但其实整个商业价值还是有限的第二幕今天走到了CodingAgent对吧Agent帮我们直接完成任务本质是能帮我们干活了进而还可以加速整个AGI或者说CodingAgent实现了有可能AGI的90%已經實現了我覺得好像也不用什麼範式創新就可以把大多數的知識工作者的任務自動化了第三幕可能就是自動化的AI研究員了這也是OpenAI可能最想做的每個人可能都有一個強大的你让研究助理去解决各种各样的问题那时候可能会去解决基础科学的问题比如说脑科学神经科学材料学对吧所以我们画一个AGA的路线图就像爬一座科学的高山但每个AIlab可能有自己的路线图那今天我们处在什么样的位置Coding也处在什么样的位置有可能今天还只是整个科学的高山攀登的开始吧对你说到这个我也觉得很感慨因为去年其实你说codingcodingcoding的时候很多人可能会觉得coding还只是一个垂直场景的事情他没有意识到coding能带来这么强的泛化性我觉得就一个精辟的总结叫语言及世界代码及方案因为只有这两个它的泛化性是充分被证明了的其他领域的泛化性还没有被充分证明你比如说我想通过数学来提升智能能力可能可以但是数学能表达的东西太有限了很明显我们今天是从第一幕走到了第二幕那从插宝进入了codingagent的时代那据你观察现在所有人已经充分的意识到coding非常重要了嘛那既然重要为什么有些人没有allin资源去做呢我知道的好几个AIlab好像都把coding放到了最高最高优先级但基本上也是过去一到三个月的事情你发现实际做好好像也没有那么容易所以我觉得大家心里可以打个分就是做好coding的难度系数一到十分你到底打几分如果低于四分呢那大家每家都能做好非常卷对吧如果高于8分9分呢那有可能領先的Anthropic可能會一家獨大大概率會繼續領先其實你也沒有其他什麽理由能繼續超過它我覺得取決於難度係數和競爭吧那你覺得做好coding的難點到底在哪裏就是大家既然都知道coding很重要了能不能給大家講就是如果要做好coding應該最重視的最頭部的三件事情是什麽我覺得最重要的可能就兩件事一個是組織和文化第二个是数据其实我觉得coding不只是一个技术knowhow的问题了更多还是一个战略和组织的问题我认识的研究员朋友都跟我说coding最重要的是数据这个壁垒但问题是你觉得哪一个AIlab能组织好最聪明的非常有想法的几百个人就allin搞coding一个事因为这里面有很多脏活很多苦活就是搞数据的活因为每个lab里头最聪明的人都想做自己的一些bet搞自己的实验对吧搞一些新的突破0到1都想成为一例我觉得这个可能是一个问题的根本那Anthropy可能不一样的点就是说他们这几个founder可能一开始就意识到数据可能是所有问题的根本叫模型机应用数据机模型对吧所以我感觉他们重视数据可能是刻在骨子里的有个rumor就说他们的首席科学家JaredKaplan就亲自在这谈论过数据这个好像是比较少见的我觉得更重要的还是说不做什么对吧你看Anthropic就完全放弃了多姆态对吧可能多姆态不在科技术的主线上也没有跟风做ResidueModel2C也放弃了对吧然后就是在Coding比较专注这是第一个我感觉组织上会不做什么第二个可能是数据吧第二个就是说数据这个点可能更难一些以前chatbot就是chat那些文本类的数据但今天可能更复杂了就coding和agentic它是一套的它既有任务又有环境又有整个的评估所以这个数据比以前的数据难了很多而且你要造出来很多数据所以Coding做好可能没有想象的那么简单我觉得更重要的还是说每个公司在战略组织文化上其实并没有真的重视起来其实你看过去半年Google和OpenAI是过去在争2C的其实对Coding也有很大的战略误判的其实是严重低估了Coding的重要性和优先级的除了Anthropic在当然现在一到三个月内很多人都已经开始把它当作最重要的优先级了那在之前呢其他团队为什么没有专注的去做coding他们没有意识到coding这么重要吗我觉得每家都有自己的战略优先级的选择包括过去的一些思维上的包袱因为你看现在有两条AGI的路线第一条是追求C端的流量Chess,GPT,Gemini,Doubao对吧第二条是追求高价值的任务Anthropic这比较领先那就看你想要哪个对吧Anthropic也许是被迫只能选coding了因为C端窗口他错过了其实你说C端重要吗有可能也重要就是有可能C端未来也是会覆盖掉高价值任务的其实你看25年其实是C端窗口很关键的一年其实很多模型公司都已经错过了C端的窗口了ChadGP和Google忙着抢C端的这个窗口才错过了coding这个窗口对吧我觉得可能战略你选择什么可能更重要就是这个可能是每个模型公司管理层最高思考的问题你今天资源很有限你到底是搞c端还是搞coding对吧因为资源境内是有限的然后可能是要放弃一些东西的我觉得更多是战略选择你到底优化一个什么样的目标到底要什么这个可能是更关键的但你觉得这第一条路和第二条路一个是C端窗口一个是高价值任务它们未来会merge吗它们会融合吗它们会成为统一的一件事情吗现在看还是两条路径我觉得融合的概率是非常大的包括ChatGT后面把chat跟agentcode这些东西都融合起来allinone一个平台本身是对的但是有可能存在另外一种情况就是说有的人只做塔尖的用户塔尖的用户就像量化一样就是只有极少数的人可能一两百万人贡献了很大的usage这是有可能的我也不知道未来C端的这个DAO还有没有意义有可能有意义但有可能那个塔尖用户的tokenusage可能更有意义因为它也是数据的一种它其实补充了于训练的数据数据的废脸我觉得还不知道因为我也不知道大多数人在未来这个时代中的重要性还有没有以前那么强有可能塔约的人会贡献整个世界的生产力更加集中我感觉强者横强是很残酷的但这又是一个趋势这是会带来整个社会的整个风光的变化这个我们后面会聊到那接下来能不能分别展开聊一聊据你观察这每一家的模型公司它的战略组织和文化特点能不能分别跟我们讲一讲第一个应该是Anthropic吧因为你对Anthropic相对是熟悉的你觉得他们是最早看到了什么迹象就battlecoding这个事情呢是怎么做的这个关键的技术决策关键的推动者是谁啊allincoding其实也不是他们dayone就能想清楚的我觉得一方面是c端没有机会了第二是24年夏天我记得发了solnet3.5其实那个给了coding正反馈其实也是在摸索的过程中把coding这条路线给摸清楚了但这个公司更值得关注的是它的几个特点就是在那之后24年夏天在那之后只allin了一件事就是coding今天做成了而且巨大对吧而且他们放弃了c端放弃了多姆态战略上是非常topdown的OPI是特别bottomup的所以AzurePeak有一个非常一致的目标就是搞好这个东西有一个自己的一个路线图对吧而且创始人特别汗脏懂技术带着大家搞数据搞工程对吧重视数据可能是写在基因里刻在骨子里的而且AzurePeak这个团队好像也一直比较稳定不像OPI团队没那么稳定人才流失之类的以及你跟Anthropic的人交流我感觉他们每个人都很相信AGI就特别AGI原生的那种这个状态吧可能这个创始人也特别有洗脑能力吧经常会传递一些比较像宗教一样的这个发言其实你看SWAP过去说的包括融资讲的好像全都实现了我觉得这可能是一个优秀公司应该有的样子吧就是弄清楚战略之后就坚定的执行组织和文化也都跟进对吧就是我觉得坚定最重要就不要摇摆那个其实你看他们很早就不做多莫泰了或者投入非常小可能这就不是他们所认为的科技术的主线很多人去年说预训练撞墙了他们好像也没觉得撞墙依然坚持做也是他们擅长的很多人觉得RO这个事封神的时候他们也没有把这个封神也没有去做所谓的Residentmodel好像他们没有刻意神化一个人或者某一块最终目的好像就是做好一个模型也没有觉得非得就一个环节重要更像是一个集体一个球队一个工业化的体系每一个环节都做好就是相比之下欧派可能有些做的不好的地方其实可能比较像vc对吧喜欢造新的概念把某些概念可能推的很高或者容易神话某一个环节就是以前神话portrait后面postrait对吧后面这个o1o3对吧嗯但好像ithorica就不太会就这个动荡摇摆很大我觉得这可能是文化特点可能比较重要的其实你看组织上的anthropic可能是一帮人就做一件事欧派你跟他小伙伴交流一下经常是一个人做一个新的事所以专注度聚焦我觉得可能是一个比较关键的而且anthropic好像一直是不怎么招那些bigname都是招Underdog而且对文化面试也比较严经常会问你很多文化问题比如说AGI实现了之后种种种种各种选择你会怎么做我的感觉好像Anthropic早期的人都还是比较AGIMission驱动的就是你看Offer当时比OpenID风险也大很多人还是进来了可能也是一个筛选吧然后这些人都还是比较AGI原生的所以他们的文化也一直比较稳定人才流失也比较少你说到onthropic我想到我觉得他们除了模型他们在产品上做的也挺有sense的他们产品有什么方法论吗就是感觉他的产品非常的AInative非常懂产品对我是感觉他们的产品文化和产品sense都是蛮好的其实随着模型能力的提升他们好像是把模型能力转化到产品转化到用户体验这个效率是更高的因为他们做产品的很多人还是工程师或者研究员很懂模型能力你比如说那个CloudCode的创始人BorisBoris其实是很强的coder他其实是想deliver一个最强的coding的工作方式在引领整个开发范势其实你看Cursor火了以后很多人在讨论说模型公司要不要再做一个IDE好像Arthorpic没有做IDE而是他做了一个终端的形式就是今天的CloudCode因为这个可能是更能承接住模型的红利的因为模型是指数级增长的但你产品也得指数级接触这个东西我是感觉他们的产品sense还是挺在线的就是产品比较面向AGI面向模型指数增长的这个红利上我觉得他们用户体验也确实不错然后产品的hardness这些东西做的也比较好对你刚才也提到了Andropic的组织和文化那它的foundingteam是什么样的呀能不能评价一下他们的核心团队以及这些做产品也都是来自模型team对吧其实你看他们其中两个founder一个是CEODario还有一个手艺科学家JaredKaplan他们俩是物理学家出身其实他们对AI的理解更多是从一个物理观察的角度出发的他也没想着创造新的什么transformer架构但就是会把transformer这个架构scale的比较好其实是像物理学家一样洞察了这个AI的规律找到了dataefficiency架构的efficiency工程的efficiency对吧好像也没有像欧派一样有执念非得做下一个范式就是踏踏实实执行的比较好好像也没有说绝对的各种secret别人不知道的但好像就是把工程把细节做的比较好产品团队其实很多还是工程师和Researcher其實是比較像早年Google的文化的你說他們沒什麼secret但他們其實是防洩密然後做信息保護做最嚴的一家矽谷模型公司我觉得是他们的文化吧就是内部很透明然后防止信息外泄可能一旦出现信息泄漏可能就开除啊或者很严格的那个大家也都比较尊重这个事儿啊所以你看大家对Uncensored的了解还是比较少的那你觉得,因为ONDROPIC它其实有一两年的时间窗口,因为直到去年都只有一部分人看懂了coding,那今年似乎所有人都开始allin了,你觉得它在coding上的护城河高吗?
[29:12]
有多高呢? 以及现在市场对于ONDROPIC是不是高估了? 因为他们产品线或者revenue是高度集中在coding或者agentic可能maybe百分之七八十的revenue都来自于这块我觉得就看这件事的难度系数吧未来竞争肯定还是非常激烈的但我感觉也主要是头上的三四家吧anthropic还是有危机感的吧如果就是现有范式不动就是往前scale可能他们还是有信心保持一定的优势的但技术变化总是很快的大家又很担心OpenAI搞出一个惊天动地的新的东西我自己的判断是OpenAI和Google最终都是能追上来的如果你说风险的话我觉得算力可能是一个之前包括他们自己内部可能也没有预估过去一个季度需求的爆发所以算力规划也保守了我感觉今年实现10亿美金的AR最大的bottleneck可能就是算力我估计可能后面要到处扫货各种GPU吧然后Anthropy我觉得有一个比较有意思的是他定位的是高价格带的那个用户群它的定价是很高的一直也没有降价其实欧盘以前是不敢把模型做的很大的因为它的用户量太大了很多人不付费但是呢你要是去定位一个高价格带的用户呢那我就scale很大的模型有最好的效果我就最高的定价也有好的margin所以他是做了一个塔尖的金字塔塔尖的一个市场所以就看他未来能不能守得住这个市场了这个很有趣对所以总结来讲我觉得Anthropic更像是战略的一个胜利或者产品专注的胜利或者文化呀我觉得这几个隐形要素是比较重要的我觉得不然他们不可能从落后的一个位置杀出来不然早就挂掉了你讲到Anthropic它做的是塔尖用户那OpenAI现在也开始重铸Coding它现在没有卖掉头了因为它已经成为一个大DUO的产品那它应该怎么做它的战略和定位呢我get到的sense就是OpenAI也要把coding放到最高越线级其实GPT5.4的coding能力最近社区反馈是非常好的甚至不弱但Agentic能力还是弱一些我的感觉是它的coding能力已经上来了其实Agentic能力上来有可能也是时间问题吧所以最后就看那个塔尖的市场是不是能守得住吧我觉得不好说如果它做得很强的话,那你还能不能只做那个高端市场? 我是感觉OpenAI的人才密度、资源、能力其实也是不差的,只是过去战略不太聚焦,或者没有意识到coding如此重要。 Dropin在商业化上现在除了coding还有其他的吗?
[32:10]
我覺得就是把agent一個做好吧也把agent的產品一方的agent的產品做好其實最終的目的就是用agent用AI去automate整個globalGDP對吧那如果從longterm來看我覺得OpenAI也好Anthropic也好Google也好最終最終都是奔向一個事叫有一個自動化的AIresearcher或者AIscientist幫你去做很多基礎科研的一個研究探索因为我们知道OpenEye有上市计划嘛Ontario今年有上市计划吗有可能10月份1月份吧我估计年底是不是都会上市他们都上市了会对于这些公司人来说会有什么影响吗你说那个内部员工吗还是什么内部员工就都有钱了我觉得research朋友们都是很担心自己的工作的我过去一个季度最大感受是最牛逼的AIresearcher都担心自己一到两年后没有工作了可能自己未来一到两年可能是仅有的一个工作的窗口吧因为后面AI可以automate整个AIresearch了自动化的研究的workflow有可能是未来一两年是最关键的他们工作和赚一些钱的窗口了吧这么悲观吗那以上是硅谷玉三家的第一家ontopic接下来我们来聊聊我们这个最熟悉的OpenAI吧对OpenAI我觉得上一期播客其实聊了很多好的地方对吧C端遥遥领先对吧九个多亿的周火但最近比较flat没怎么涨五六千万的付费用户过去立得过两次范式市场新下一次大概大概率也是欧盘能力的他的新的模型Spire应该很快发了吧大概率也是很强的还是一个待机上的一个提升反正综合的实力和人才密度都还是挺强的也比较重视research其实在内部也比较像一等公民吧但现在问题是什么呢ChadGPTC端看着赢了但发现Coding比ChadBot要大很多可能大10倍到10倍所以这是一个最大问题我想问问OpenAI是什么时候意识到Coding很重要开始加码的我猜也就两三个月之前吧因为之前还忙着跟GoogleGemini去抢C端的流量呢去抢DAO去做增长其实你看Meta来了那个Fiji做商业化对吧我感觉他还是像互联网的老人其实你发现那个并不重要其实是对coding有严重的战略误判的包括Google我感觉也被带沟里了其实大家对Coding都有战略误判其实不应该再用互联网思维用DU这些思维再去看这些东西了我看飞机已经被调了我估计可能是不是背锅去了这个战略决定跟最近SORA被关掉会有关系吗因为我觉得他可能意识到了Coding才是主线多么他不是那应该更加的战略聚焦我觉得肯定有关系吧因为GPU太有限了嘛其实多么他还挺耗卡的其实你说SORA发出来之后那么多人即便你模型做好了那么多人去创作这个对OpenAI有什么好处呢好像也没什么好处所以在AI时代DAU不重要不知道我觉得这个是开放答案有可能重要有可能只有塔尖的tokenusage更重要因为绝大多数人的智力没有模型高了那我不知道人类在整个社会中的价值是不是發生了變化那人類價值發生了變化誰給AI買單呢那塔街的用戶創造了更多東西你比如說腦科學材料新的藥物治療人類所有疾病好像又會有生產力的提升那通過稅收來調整進入福利社會但是這個對美國肯定是挑戰很大的因為美國是一個中產社會一个多亿的中产,程序员,律师,医生,中介,banker其实我是感觉可能很多人在未来一两年就是没有工作这个肯定会带来社会的贫富差距拉大矛盾的激化你说SAM最近有两次被袭击我感觉有可能未来这种事情会越来越多肯定会有这种情况你有没有觉得有一个现象是在美国对于AI的情绪更悲观在中国更乐观我觉得在硅谷的话是很乐观的吧但有可能这里面重要的一个点是技术变化太快进步太快每个人都没有安全感每个公司都没有安全感甚至说大家都担心自己未来一两年两三年以后工作都没了所以有点那种末日论的感觉但是我是感觉AI终究会带来繁荣但是这里面可能会有一个痛苦的窗口因为人类没做好准备AI过去一个季度的智商的进步可能比人类过去20年智商的进步要快那我们没做好准备怎么驾驭好这个因为很多的工作还是过去的范式所以这个错位有可能是比较痛苦的刚才我们说了Andropic和OpenAI那你觉得目前CloudCode和Codex它的市占率分别是多少我看Sam在推特上宣布了Codex有个30万的活跃用户应该是周活跃对吧那CloudCode我猜可能150到20万我估计可能是一个7比3的关系猜测我没有准确数字我只是猜测你看意識到Coding非常重要的還有一家公司Cursor但是我們到現在都沒有提起來模型公司現在都把Coding當作主線去捲那像Cursor這樣的應用公司雖然他們也自己開始訓練模型了那你覺得這個公司後面怎麼辦你看好嗎如果最強的模型公司不把Mesos跟Spar的這個最強模型API開放出來而是優先通過產品通過Agent或者Cowork的方式提供出來优先弄好自己的产品和生态那Cursor用不了最强的模型怎么办呢因为Cursor的本质还是吃到了模型公司技术溢出的红利那如果模型公司选择不溢出了那好像也合理就像自己接住嘛除非有一种情况是Carrier的模型或者自己Train的模型也跟Frontier差不多了但今天肯定还是有一个depth所以我感觉Cursor最好的是卖给微软做开发者可能还是比较好的或者卖给马斯克对所以CursorminusOpenCloud它的本质可能是一样的都是吃的模型公司技术艺术的红利但是它是阶段性的大家都有窗口有的人可以借助窗口变成一个伟大公司但有的窗口终归是阶段性窗口吧就是壳公司好像还是阶段性的创口对吧不一定有的壳可能是有价值的如果未来有新的交互了用户的contacts都在了我觉得是存在创口的机遇的只是说模型公司作为大哥他也想吃掉这块肉就看谁的速度快了今天问题是模型公司的速度好像比创业公司速度更快他自闭环了吗对那說回OpenEye你對OpenEye的前景現在是覺得更樂觀還是更悲觀啊如果這幾家模型公司都交替著往前走未來比拼的關鍵是什麼呢我對全球領先的三四家甚至三五家模型都很樂觀我覺得未來這些模型公司都非常重要現在市場對OpenEye的敘事是比較悲觀的我是沒有那麼悲觀的我覺得有50%的概率整個AGI最終的Winner可能还是openai因为在这个时代今天胜利的秘籍可能就是下个时代的毒药对吧openai在chattergpt过于成功让他们专注tosee而忽视了coding因为要重视那个inference的成本所以模型一直没有做很大那今天anthropic的成功呢更多还是渐进式积累的把细节做好我觉得更多是执行的胜利专注或者组织的一个胜利但有可能并不一定能抵御住欧盘下一个范世纪的突破因为欧盘它有一种文化是自下而上的就放开你去自由的探索因为今天coding能力很强了可能一两个人就能干出来一件惊天动地的大事有可能未来决定胜局的可能就是一两个人有可能就是欧巴在这种文化下是有可能搞出惊天动地的新范式的所以今天你看着有的优势都不见得是优势了我觉得未来今年一年年内格局是定不下来的过去三年格局都没稳定过只是持续的淘汰赛今天又是巡回赛可能还得打一年就是以前所谓的壁垒是防冷冰器的对吧但今天是各种现代化武器模型又开始自我迭代我是感觉以前讨论那些壁垒不知道规模效应数据飞轮网络效应可能都不知道有可能未来有未来的这些东西吧你觉得OpenAI有什么做得不好的地方吗你刚才也说到你批评一下它我觉得还是有不少做的不好的地方的我觉得这个可能也是值得借鉴或引以为戒的吧我觉得最大的可能就不够聚焦吧因为赛姆他还是一个VC出身容易摊大饼对吧就什么都想要也比较容易fomo其实他文化也是自下而上的反正自下而上这个呢分硬币的两面有好有坏你比如说其实以前是应该是一个支线但团队都在努力的推说很重要对吧去找赛姆要卡那赛姆还是会allocate很多资源给到骚扰团队其实就很像VC去allocatecapital其实没啥拒绝有可能这是赛姆他不是技术出身的原因吧可能团队要那就给了想做的项目可能也很多另外一个点我感觉他们文化上是特别value这种0到1的突破但是没有那么value1到10的突破那这种文化引导下来就会导致很多人异国很强就没有人做脏活累活苦活所有人都想去做突破性的工作所以就没有人踏踏实实的搞数据清理数据做好产品运营对吧包括你看ChadGP这个产品很成功但是感觉又没有灵魂你都不知道CHP這個產品經理是誰是SAM還是誰所以我是感覺很有靈魂對他更多是一個技術模型很牛逼比如說CHP很成功规模这么大但是总感觉产品没做好那你交给字节这种文化下做ChatGB这种产品我感觉肯定是做的更成功的说回来OpenAI可能最大的战略误判还是整个域训练和coding这两个没做好这两个还是最根本的因为之前它是有很强的领先优势的可能领先一年两年因为SAM不是技术出身可能对技术路线或者做哪些技术决策可能还是不如玩Software这种技术出身的人更果断吧其实你刚才说XHBT没有灵魂我在想会不会今天的产品其实不需要人赋予它灵魂呢因为本质是AI墙就是你要一个产品经理去赋予它的灵魂未必是一种ego我觉得有可能最后只拼GPU了因为最后大家都能卖过那个基点可能全球三五家五六家都能卖过AI的基点有可能就是拼GPU了因为AI自己成长得比人快,已经自动化了AI的research整个process,有可能研究员插不上手了。刚才我问你今天的Onthropic被高估了吗? 那么今天的OpenAI被低估了吗? 我觉得阶段性被低估了吧,因为最本质的还是模型的进步,OpenAI这个文化这个组织我觉得还是能继续推出来,SolidModel,我判断openai的coding和agent的能力大概率还是能追上anthropic因为最近战略大转向我觉得也是个好事吧然后我觉得更多是两个公司的文化openai一直想做爱因斯坦anthropic就是把整个白领工作给automate就是openai想跨过coding以前没那么重视coding想直接去做爱因斯坦但是你发现这条路很难而且没那么实用因为Anthropy做的很实用实战特别好所以revenue爆发也快有可能让他们获取更多资源加速整个AGI有可能是一个特别务实的路线但OpenAI今天也意识到这条路线很重要所以也掉软墙头也要把这条做好吧所以我的判断是OpenAI也不会掉队可能跟Anthropy可能还是齐头并进Google肯定也能上来所以取决于coding的难度系数吧所以我是感觉今年的格局肯定还是定不下来的还是你追我赶交替领先点OpenAI马上就要发新模型了对于这个即将要发布的模型你有哪些观察和预测吗我觉得是真正意义上的GPT5吧之前GPT5跳票太多了之前的5.12到5.4可能更多还是GPT4level的model吧我觉得Spark有可能是真正意义上GPT5待机上提升吧这是一个语气吧第二个有可能他们在Swift就是软件开发软件工程有可能还是没有AzurePeak强但是其他地方可能都会大幅的提升因为AzureCode在软件工程是优化特别多的但是长期来看Agent能力我觉得都是能上来的第三就是我感觉Chat和Code那个allinone的产品可能是对的策略但Spark更多是一个新的平台未来可能每个月都有新的model出来在这个平台上持续迭代有可能会迭代很久我觉得最后可能还是比拼算力了OPEN的算力可能比ANSEL可以要多很多那取决于后面的迭代速度了那接下来我们来聊聊硅谷玉三家的最后一家巨头Google的Gemini对我感觉Gemini3.0当时是被高估了其实Benchmark刷得很高其实你看C端其实没有持续增长用户也不太买单Gemini看起来很好但实际体验用起来也没那么好我感觉Benchmark有点过度优化了产品能力不行其实你看Gemini3连PC的桌面板今天都还没有然后他们更多还是一个工程师或者技术驱动的文化其实PM这个文化好像也没有那么强或者没那么强势吧其实你看Gemini3当时热度很高感觉像Google王者归来除了让Google的股价翻倍了证明不是AI的loser了其他好像也没捞到太多好处吧那个3.1好像也没有真的大的突破我觉得反而让他们沉浸于Gemini3的成功喜悦之下严重误判了coding的重要性这个可能还是一个失误吧然后但我听说最近coding也伤到了公司最高危险级但其实已经晚了三四个月了才意识到coding的重要性其实有时候火一个模型其实没啥还是要持续的底里边牛逼的模型可能更重要吧其实Gemini之前战略上更重视C端和多模态其实忽视了coding的因为256年可能是C端格局最关键的两年窗口因为你错过了C端有可能未来也搬不回来了那个所以就忙着跟ChadHP争C端这个反而给了Anthropic在Coding一个非常好的黄金窗口Anthropic过去也抓住了但其实有可能这个时候Google应该降低在多莫泰的投入啊优先把Coding这个补回来了如果你Coding落后三个月以后可能就落后一年因为它会放大我觉得主要还是组织问题吧Google的组织文化可能也跟OpenAI这两个更像就是说它是一个自下而上的文化每个人可能都有自己想做的有重要的人Senior的人占住位置有些东西可能也不容易被加上去然后反正我感觉Gemini的印度人比例越来越多了我也不知道这是一个好的信号还是一个坏的信号反正我觉得长期来讲购物还是叫最领先的追随者资源和布局上没啥短板战略上只要跟随answeringopenicon就还可以我觉得掉队的可能性是很低的但短期好像还是需要调整短期我觉得可能也拿不出太多牛逼的东西但拉长看总是能追上去的我觉得拉长看Google可能是最稳的因为算力是最足的现金流是最足的其实Google的worstcase就是TPU都可以变成另外一个英伟达对吧然后反正虽然他们有politics各种组织移动缓慢各种问题但是你看这个这个公司已经到第三代职业经理人了这个挺厉害的其实很少有科技公司能到第三代职业经理人而且运行的很好他更像是一个机器或者体系化的运转了甚至说你可以任意换掉一两个两三个人好像对这个机器都没啥太大的影响而且他们优势有很多有操作系统有googleworkspace对吧然后对你刚才说了一个点很有意思你说发一代非常厉害的模型没啥用要持续的deliver模型那这种持续性你觉得是有什么带来的第一你每年要有几百亿美金的投入第二你管理层方的魄力认知战略的bet第三你要有牛逼的团队其实我感觉持续deliver牛逼的模型是对所有科技公司的一个大考其实这个考验是巨大的有没有公司每年能投几百亿美金连投三到五年管理层是不是有这个认知有没有这么多人才的吸引力号召力而且要对的团队而且有战略的bet今天只有一个模型都不够了而且要跟产品策略结合所有人去做coding你也不能全部都只follow那你肯定也站不到前面肯定要有自己的bet对吧在callback你之前说的一句话就是你说你提到ondropping的时候说当所有人觉得RL强化学习好的时候他们也没有把强化学习当成神也没有去做所谓的reasoningmodel而是选择bet了coding这成就了ondropping今天的地位但同样今天当所有人都在追赶coding我们是不是能够跳过这一幕去直接bet下一步你觉得还成立吗既然coding都做慢了那跳过它可不可以呢我觉得没必要跳过它可能还是一个基础能力除非有一种可能就是C端这个个人助理未来可能真的非常重要C端可能跟这个高价值任务是融合的也有可能Coding和Agentic这种高价值任务的能力最后大家都能追上来但你掌握了C端的分发可能还是很重要除非说你说你去做数学对吧但数学能表达的东西比较有限或者你去做世界模型但世界模型今天还没有proven包括你做下一代范式但下一代范式呢这几个frontierlab都投入很大有可能是在巨人的肩膀上实现的我不知道跳过去做啥就是好像今天这个大惊慌也挖出来了从chatbot第一幕到codingagent第二幕到第三幕就是一个automatedAIresearcher好像这三幕就是主线你跳出去是不是就偏离主线了那现在来总结一下上面这些硅谷玉三家吧对我觉得硅谷玉三家过去三年有时候你觉得openeye无敌三四个月前又觉得Gemini王者归来今天是Anthropic春风得意我是感觉每个公司都有自己的窗口吧各领风骚一百天还是会交替领先以这三家的人才资源和组织我感觉都不太会轻易掉队短期是被低估了你就买谁的股票就可以因为这些公司年底都IPO了有可能未来就是他们IPO以后投资者会卖其他的所有科技公司去买模型公司模型公司可能就是未来科技投资的主线就刚才提到能做好的模型或做好的AI产品是对所有科技公司的一个大考做不好可能就是要被淘汰的,做得好可能就是受到投資者喜歡的。好的,again,這裡不作為投資建議。
[54:16]
那除了這個矽谷玉三家,我們也點評一下MetaTBD和XAI吧。你看一季度,Meta在重金挖人之後開始交作業了。你看好小渣和埃塞納王主導的Meta大模型嗎? 他們到底在battle什麼呀? 我觉得Meta是最有机会的挑战者其实已经取代了XAI成为了硅谷四号种子选手其实MetaTBD这个team人才密度是很高的也知道各家的knowhow因为他们从各个AIlab汇聚过来其实进步速度是很陡峭的九到十个月做出了一个还不错的model我觉得长期模型能力上是有机会catchuptier1其实你看他们思路也比较简单就是七八成就学Google对标Gemini对吧也有NanoBanana他们也有一个Mongo文生图的模型多莫泰模型另外可能20%也也学OpenAI吧就是OpenAI的PostTrain和R2做的比较好但是我感觉Meta这边的产品战略还不知道是不是清楚即便他未来有一个好的model了但总是要把这个好的model最后deliver到产品上的我感觉以Meta的特点可能还是做个人助理个人朋友会好吧就是更低门槛或者就是把opencloud做一个更低门槛的包括你看他们收购了minus如果真的能用好minus有可能也是挺有机会的啊我觉得是后面比较期待meta到底推出什么样的agent的产品但说实话我是感觉中国公司的中国团队的产品创新率都比meta要强呢其实硅谷公司是擅长技术模型这个layer的创新其实中国团队是擅长产品的创新的我是觉得meta产品创新率并没有字节那么强其实你产品和模型codedesign一起做好向下反推模型可能也是一个思路但另外就是长期看我不知道meta这个团队稳定不稳定吧因为砸钱这个文化也不知道是不是健康的因为你砸钱很多钱很多人就是为了赚钱就在这先苟着先抵着边盛鸡蛋好了就可能就不容易takearisk愿意去冒险我感觉openai还是愿意冒险的一个文化和组织创新力是比较强的Mynas被吸收进了Vyta,他们现在有什么整合动作吗?
[56:45]
对,我之前以为会集成到WhatsApp和ins,但好像一直还没做。 Mynas的收入涨得挺快的,非常快,因为这个产品,因为大家一直在喊Harness这个概念,其实Mynas,我感觉是Harness的鼻祖是一个独立团队把Harness这些东西做得很好那今天模型公司把这Harness这个概念像宗教一样喊出去了其实Manus更像是Harness的这个鼻祖吧看看后面能不能整合吧就是主要可能是跟TPD的这个关系你觉得Manus进入到Meta会发展得更好吗不知道你觉得Manus卖便宜了还是卖贵了卖便宜了肯定卖便宜了但是再过一两个月OPAS都出来了MINUS还怎么卖啊我是感觉AI的BETA更重要整个大水漫灌每个人都往上涨就是有可能我们今天不需要想终局问题大水漫灌每个人都涨得很快就是MINUS当时如果更快是可能有机会更快更早的做到一个B0两个B0的AR有可能它今天就是一个百亿美金估值其实中间可能还可以更快好的那马斯克的FCAI呢他们最近也是刚刚经历了人事的大震荡内部到底发生了什么我感觉跟他们错过整个coding的赛道也有关系对吧而以及我在想为什么马斯克他能够把TeslaFSD做得挺好的做FCA却不行呢就是做FSD和FCA这种大模型它的本质差异是什么对我感觉XS短期是有点掉队的因为最核心团队其实都离开了其实foundingteam都挺强的都是世界级的国动自航Tony这些我觉得短期XS是挺难的至少可能现在不在一个正确的路径上吧除非说elon哪天又大调整了就是你说他最重要的问题我觉得还是战略摇摆吧最初可能伊朗相信大力出奇迹,弄几十万卡的集群,protrain很大的模型但是好像不是这样,你得把数据做好,你得把dataefficiency做好你盲目的skill这个模型参数好像并不是问题的根本今天的BotNike好像不是在模型大小,而是数据别人可能用一个小你十几倍的模型可能比你做的还好,这个就有点尴尬甚至说中国的争流的模型可能都比xia今天要好对吧然后你比如说之前xia还想拜托多姆泰他音频做的也很好但好像这个也不是什么主线对吧好像也没太大用可能车上你跟grok对话还可以那中间可能也想做chatbot做ai搜索今年可能想allincoding其实这个战略摇摆呢就会让团队很乱你这个事刚上手还没坐热伊朗可能没有耐心又拉去做另外一个事我觉得还是耐心可能不够战略不够坚定就摇摆的比较快而且团队老是换人嘛所以我觉得这个崩溃的源头可能是伊朗可能对FoundingTeam有点不满意就是但其实FoundingTeam是最世界级的一个团队其实这个是有点有点没有耐心了感觉然后我觉得确实有像你说的跟TeslaFSD这个区别其实做好模型的数据可能是一个要有耐心比较长期的一个工程或者偏research的test到底什么数据是好数据怎么做的更好但Elon可能好像还是希望短平快整个feedbackloop最短恨不得两个星期就看到效果对吧所以这种文化就会导致团队追求短期的效果而牺牲长期的质量所以有些longterm的问题可能并没有准备好然后你比如说这个数据质量到底怎么样Infra的框架到底怎么样但我感觉也不代表XAI彻底就没戏了因为他手上还有很多的GPU而且Elon作为一个顶级企业家调整能力又特别强包括他搞数据中心搞这个新的Fib这个芯片厂我感觉更像是个人的宏大愿景其实这个东西可能需要的时间还挺长的有没有真的能弄起来一个团队帮他deliver这个我感觉AJ的竞赛是比其他很多领域都要竞争激烈的就很像是你开着F1的速度跑一个马拉松而且在城市里跑对吧所以你需要20%3的聚焦如果CEO和leadership不聚焦肯定是不行的我觉得伊朗是不够聚焦的而且AI的投入还是一个马拉松得持续投入能不能给我们讲一讲一季度还有一个非常火的新词就是HarnessEngineering对我觉得这个提供几个思路吧未来我们应该把AI的agent当人看应该把它看成一等公民跟我们是一体的那人应该有的东西agent也应该有对吧人类的知识工作者有工作的环境工作的电脑工作的各种信用卡对吧那未来可能在一个偏心世界你也要给agent去搭一套agent作为人类作为一个一等公民需要的环境对吧我觉得这是一个思路那第二个点呢就agent想做好一方面是模型还有一方面是harness那agent你就把它比喻成就像是一个人加入到一个公司一个团队有些公司有公司的这个管理和环境它能让一个正常的人他的下限很高有通过管理和组织一些约束对吧嗯那其实agent也需要它的管理学和组织那这就是Harness的这个意义其实有了Harness以后呢其实普通的模型也可以做高价值的任务了加上过去Cloud整个需求的溢出它接不住所以非SATAmodel就是包括开源的很多模型也能被用上了我觉得这是一个更大的意义然后我觉得第三个点就是说更多带来一个思维mindset变化就是说以前是看2C和2B对吧传统时代但今天是到底是to人类还是toagent如果是toagent那可能看中的不再是DEO可能是token的usage或者token的价值margin这个可能更重要因为以后用什么工具可能不是人决策了可能是agent去调用哪些工具去决策了对我觉得这几个思路刚才我们看了硅谷玉三家那你对国内的玉三家有没有一些观察和评价因为你看硅谷的玉三家也有一些风化嘛有的过去一年在BET2C有的在BETEnthropic这种高价值任务那国内呢他们是不是也有一些风化我感觉国内好像都在追求Enthropic的路线这好像成为了一个共识一年前好像还不是共识就是共识是最近几个月吗过去三到六个月吧因为C端已经没机会了好像大家也意识到Coding和高价值任务这条线上线好像比C端要更高就是国内的KimiMinimax和智普都在BetonDropping这条路线那豆包呢豆包看起来是在C端做最好的因为大家其他几家都是觉得跟豆包没得打才转型的我觉得Coding和Agent是不能输的豆包肯定也是大概率都能追上了而且可以有可能做得更好我觉得最后可能还是拼组织能力资源吧你觉得国内这些模型公司现在的胜负手是什么呀我觉得还是综合的其实不是一个能力最后就取胜了你说我一个人才牛逼我一个方法牛逼我一个bet牛逼我感觉是非常综合的AI今天进入了一个叫工业化时代我不知道未来会不会进入无聊的大厂游戏有可能会这样大厂游戏无聊的大厂游戏为什么这么说无聊的大厂游戏就是有些窗口已经关掉了那发展到206年你觉得模型公司的竞争到底在争夺什么在追求什么我觉得抛一个观点吧其实模型可能就是新一代的操作系统未来最领先的几个模型可能就是世界最重要的技术设施你生活的问题也是问它你工作的自动化也是它你研究科研的支持也是它可能它的重要性比今天的Google对世界技术设施的支持还要重要未来模型可能就是支持应用的无限扩展这就是agent对吧那也支持形成了一个新的生态操作系统的定义它就是支持应用的无限扩展可能就是今天的agent慢慢它也会形成一个新的生态就像安卓OS这个生态windows那也可以兼容各种意念不仅在你的电脑手机可能还在你的眼睛各种地方过去称得上操作系统可能就是Windows、iOS、Android和微信吧有可能不管你追求工作助理Coding还是生活助理ChatHP、Gemini、豆包有可能最终最终大家都会走向世界的基础设施一个GlobalGDP的OS操作系统这种方向吧今天看你觉得AGI的路线图和时间表在你心中有没有发生什么样的变化以及它对社会层面会产生怎样深远的影响社会应该怎么消化这个技术的巨大的变革就是刚才聊到我感觉路线图更清晰了从chatbot到codingagent到automatedAIresearcher这三段路然后以及时间表我感觉会加速的更快以前好像说好像还需要两三年我感觉好像也许今年年底或者明年初可能就有一家公司宣布实现了AGI了然后社会影响我觉得很多人确实没做好准备因为整个割裂感太强了就是几百个researcher或者两三千个researcher在前沿看到的东西更多的但其实这些信息是没有传递到社会上的所以社会的准备肯定是不够的因为这里面最本质的一个点是人类的知识和智力变得廉价了以前我们通过学习读书获取了知识可以有个工作但是今天这些智力和知识好像模型里面都有了被大幅的压缩了变成一个计算资源或者token这种体现那我就感觉有可能百分之七八十的人在社会上的价值和意义有可能会发生微妙的变化因为以前人类觉得自己是最聪明的那你发现模型比人类要聪明了好像我们不是最聪明的一个物种了所以这个是比较有趣的以及有可能AI会带来很大的一个通缩你像我用了ChadHP和Cloud之后我再去找顾问和买其他软件的需求就小了很多它一个产品可以满足我很多的需求有可能长期看很多SaaS也是消失的我不知道印度的ITY包现在活得怎么样有可能印度的ITY包已经不如模型了吧包括今年我感觉美国的本科毕业生是就业率历史新低因为AI今天已经把工作两三年三四年的朱聂的工作岗位工作环境都已经被自动化了吧包括朱聂的程序员所以今年肯定是人类开始面临失业比较痛苦的一年吧有可能今年30%的工作岗位就没了那这些人没有工作了之后会干嘛呢我觉得挺担心的你看Meta裁员裁了1.6万人我不知道这1.6万人以后会干嘛他未来可能再裁1.6万人有可能微软也不需要15万人有可能3万人有可能比今天15万人干得更好就人才成长和培养的路径好像被AI给蓝要截断了就是我十年前毕业可能还能有个成长工作的环境但今天好像是另外一个环境了对你预期我们俩这个工作还能干多久啊我觉得你的IP是比较值钱的吧有可能我们下一期的播客不用我们自己录了吧但我调研了一下好像效果还不太好有可能下个季度的播客可能它就根据我的笔记就自动形成一个博客其实我们今天的博客我感觉已经半自动化了这个博客的大部分的提纲其实是CloudCode帮我写的因为我过去几个月也变成CloudCode的众多用户它根据我的一些notes一些记录的一些东西又根据过去大模型记报的框架我感觉有可能我写的东西已经没有CloudCode写的好了投资的工作会一直持续吗存在吗有可能我觉得就后的最好的模型公司有可能就是最好的投资了那你就分别持仓就好了你也不需要干啥了但是技术变化非常快嘛我觉得没有的人是安全的每个人都有危机感你说现在当智力和知识都被压缩进了模型那人为了去干什么? 去创造吧,如果很多人有创造力,还是能搞出东西的。因为以前我想创造,我没有那个支持。有可能一个人两个人未来会做出很惊天动地的大事因为整个info从你有想法到跑通代码可能很快有可能创造力会被极大的释放第二审美test可能还是很重要的有审美和test的最后可能还是会deliver很多东西因为人以前有很多的想法是无法实现的但今天整个技术设施极大的繁荣有可能都能实现对吧比如说以前你要做一个有影响力的媒体可能要几百个人现在好像一个人对吧做个自媒体也非常有影响力这就是整个技术设施极大繁荣的结果如果agent开始大规模的取代白领能不能对我们的听众朋友们给一些建议agent取代的是不拥抱AI的人积极拥抱AI的人可能是受益者吧那在206年的一季度你对投资有哪些新的思考我觉得投资上有可能最好的三五家模型公司如果成为全球GDP的操作系统我觉得每家可能都是十万亿美金未来加起来三五十万亿美金我对这个的belief越来越深了你最理想的AGI的portfolio有没有变化我觉得没啥大的变化就是更极致一些一句话总结就是说你要投能持续做好SALTAmodel的公司我觉得这个指标可能是未来投资最关键的指标就是你要做一个好的AGI的portfolio我认为可能就是模型吧我个人的主线一直是模型我觉得其他支线任务是比较少的我个人本身八九成的精力都在模型上其实就做一个模型基金也挺好的就是现在策略反而越来越清楚就是你投资最大的一个bet就是全球最领先的三五家模型未来都是十万亿美金那你三年后五年后甚至七八年以后你全球GDP的30%5都已经被模型automate那那如果你相信这个那就表达的更极致那就全仓做一个模型基金也挺好的所以今年可能更聚焦也更相信这个策略对应该更极致更极致的表达问一个终局问题你会怎么看这些模型公司或者说模型竞争的终局还可能会有时间窗口让新的模型公司出现吗对其实刚才提到了几个要素第一一个科技公司每年能不能投三五百亿美金的投入而且要持续投三五年你看小扎一年大几百亿美金第二个点就是创始人和管理层有没有这个认知和魄力你没有认知就没有魄力你就不敢买卡你怕买了卡砸手里嗯那即便没有认知那如果有魄力就像小扎那样放手交给团队也可能也可以不知道最后结果会怎么样第三呢你也得招到起码上百名世界级的AI的科学家对吧其实小扎砸那么多钱好像也是有道理的就买时间嘛然后但只有这三个还不够就你只做一个通用的模型好像还不行还得有一些战略的bet产品的gotomarket的方式对吧而且你有了钱好像今天都不一定买到GPU我感觉再出来新的模型公司不是没机会但这个难度比我们想象的大非常非常多这就像我们想再造一个台积电你说他有一个窗口和资源限制的问题硅谷最近也出现了很多新型实验室,有你看好的没有?
[76:05]
我不知道这个世界上还会不会再出现更多的OpenAI和Anthropy的机会,因为GPU太有限了,资本其实也比较有限,其实OpenAI和Anthropy还是挺重视下一代犯事的内部投入也很多我觉得优秀人才的流向最能说明问题吧就是你就看最优秀的AI人才会不会流入哪个NewLabs我觉得今天好像NewLabs的技术路线还没有收敛真正的Skilling还没有开始Data的Skill还没开始所以可以再观察一下那整个一季度硅谷还有哪些前沿趋势值得分享一下可能最实际的AR最说明问题吧因为ansorpic和oppa可能公开的已经30多亿美金和250亿美金的AR了当然但他俩口径可能不一样我估计可能今年底可能都80到10亿美金明年1502亿美金其实他们已经是新的mic7了嘛再往下就是Cursor可能25亿美金技术红利都很强涨得都很快再往下就是Propricity可能超过了5亿美金再之后声音的两家也挺快的ElevenLabs和Suno可能都超过了3亿美金其实Manus和Logo应该也都超过了4亿美金了其实成长都很快GenSpark发展也特别快我感觉头部的AI产品AR可能主要是这些吧然后硅谷我感觉在医疗投的也比较多比如说OpenEvidence或者Average这两个还是发展挺快的对我们刚才聊了很多都是模型公司那你怎么看其他的一些方向比如说机器人啊AI硬件啊VerticalAgents的这些等等的新的机会对我理想的AGIportfolio就是最领先的三四家模型分别放20%剩下的比如说10%在机器人,10%在AIforscience,还有可能10%在去agentinfra这些,比如说agent那个平行世界需要的东西我觉得机器人和science可能是大模型之后下一个大的平台吧我对这两个是比较兴奋的然后我觉得有可能机器人在未来6到18个月是有质变的可能架构突破了技术路线也收敛了data的scaling和真的scaling开始了反正现在机器人数据采集的需求挺多的最近像那种第一视角egocentric的这种材料很多包括遥操作的包括5米手套的其实大家刚刚弄清楚这几类数据怎么用有可能后面data的scale更好架构也有一些突破有可能机器人会发展的更快我对这个还挺乐观的就是因为这里面中国团队会有更有优势你发现以前硅谷公司只觉得算法重要但是没有硬件完全不行最后过去一个季度我感觉是大家都开始重视硬件都要在深圳招人了站在今天你怎么看待AI应用公司啊你觉得AI应用的机会是变大了还是变小了现在还相信OnePC就是一人公司吗如果模型平台就像我们说的变成全球的技术设施它足够的powerful那每个个体都可以做很多事情就像微信的自媒体我们还有影响力就像抖音的创作者每个人创作一个内容都可以传播很大我觉得OnePC还是有可能的吧可能就是未来的一个常态就模型就变成一个新的平台足够的powerful每个人都可以做很多的事情从一个idea到代码跑通到最后revenue实现可能是非常非常高效的也有可能就是说我最近听到一个比较好的指标就是说你消耗了10美金的token你能不能赚到10块钱你得把这个ROI跑正其实很多人是没有跑正的或者这个币环是没有跑通的我觉得这个可能是一个比较重要的指标今年会是爆发点吗我觉得期待吧就是我觉得过去的一个季度AI已经进入那个极点了其实今天是在加速的显著加速的是说你自己吧过去一个季度你自己生活有什么变化没有状态我觉得很担心跟不上AI的进步因为每天每个星期进步太快了学习压力太大了然后过去一个季度我从ChatterGP变成了CloudCode的中度用户我感觉我的生产力其实提升了很多但我依然还没有像那种塔尖的开发者一样能消耗那么多token你现在能消耗多少头发我的cloudcode的10美金呢我是一直没用满啊大部分时间是用不满因为做research整个那coding也不太一样持续消耗嗯对字幕by索兰娅✿好了今天的节目就是这样这里是商业访谈录是一档由语言及世界工作室出品的深度访谈节目你可以到公众号关注我们的工作室获取更多的信息我们的公众号是语言及世界languageisworld我们希望和你一起从这里探索新的世界