128. Manus决定出售前最后的访谈：啊，这奇幻的2025年漂流啊… - 张小珺Jùn｜商业访谈录

Summary1 min read

张小珺Jùn｜商业访谈录 128期详尽总结

主题概览本期节目是Mynas联合创始人及首席科学家纪易超（Peak）在公司决定出售前的最后一次深度访谈。两位主角以平实、坦率又技术前沿的交流，对中国AI创业和Agent创新赛道进行了长达数小时的溯源与复盘——从纪易超个人十余年的两次科技创业、技术转折、模型变革、团队与认知成长，到Mynas/Manus为何放弃AI浏览器、转型做“通用Agent”应用，如何理解产品与模型公司的分野、Agent发展的体系创新、生态定位，以及对行业趋势与团队文化决策的不遮掩呈现。对于中国AI软件出海、Agent应用创新和行业长期趋势观察，有不可多得的细腻深度。

结构总览

主线话题及人物背景

纪易超自幼科技/创业的成长环境（[00:07–00:15]）
两次主要创业（浏览器出海、知识图谱/NLP/Agent）
Mynas/Manus的项目缘起、团队构成以及转型历程
AI行业分层（模型、infra、应用），技术进化节奏对创业认知的影响
国内外大模型公司、Agent、应用、数据飞轮、团队协作等
对Agent长线发展的反思、对中国AI创业的现实与展望

主要讨论脉络与洞察 A. 个人与行业起点（[00:15–00:18]）

家庭背景：父亲为北大物理系教授（科学家），母亲为中关村连续创业者。
从小在“学界+创投”夹缝里成长，自我定位“科技创业者”。
高中iOS开发，研发出国内最早第三方浏览器出海产品（Memmysquare Browser），到手30余万美元现金流。
App Store兴起（2009）带来的技术/商业转折机遇。
Keen insight：「App Store给了’怪孩子‘证明自己创新有价值的第三方指标。」

B. 从“朴素商业模式”到“AI/NLP领域”的第一次转折（[00:19–00:24]）

国内外市场/支付体系的成长性对创业形态影响
“破解自己软件”让国内用户用免费版获吆喝，海外用信用卡正常收款。
因对弱网环境/翻页预测等需求关注，自然过渡到NLP（自然语言处理）领域。
神转折：「真正的创新点在于，有明确需求驱动技术迁移和自驱学习。」

C. 知识图谱、NLP、垂直整合的“失败经”：创业时代的教训与技术代际冲击（[00:24–00:41]）

2013年Word2Vec论文，向量化出自然语言文本带来“新世界大门”。
对传统命名实体识别、依存句法分析、知识图谱手工编辑的反思。
团队由此转向OpenIE（开放形式信息抽取），做自建AI端到端知识抽取管线（2013–2018）。
多轮技术迭代：从LCM+attention到Transformer/BERT，每次范式变迁都使多年成果落空。
GPT-3出世后，个人模型和垂直整合路线“被通用基础模型革了命”。
重要反思：「每轮进化都踩着底层技术。真正的创业教训：没有人能垄断数据/知识，也没有永远可持续的技术壁垒。」

D. 产品视角的再分野、Agent和应用赛道的转向（[00:42–00:59]）

从“自己会被更大更通用系统吃掉”的前车之鉴反推：不再追求底层closure，而以PMF为导向转攻agent产品生态。
“产品能决定自己的evaluation才是唯一壁垒”——技术/模型公司迟早要面向应用落地。
人物心理成长：不再为证明自己，CEO一号位角色自省（[00:54]，“我非常讨厌管人”），更适合产品主控、技术副驾的分工。
选择“chrome插件”产品形态（Monica）：空容器/分发灵活、context观测场域、用户习惯无缝迁移。
加入Mynas团队与创始人Red（萧红）的彼此信任机制——一群没有极端情绪、有健康理智价值观的“低调中坚型”连续创业者。

E. Mynas/Manus项目转折——为什么“放弃AI浏览器”，转型云端通用Agent（[01:00–02:11]）

AI浏览器产品先后两次快速试错总结：
1. 本地端推理模型价值被夸大，绝大多数用户只在意“最好效果”。
2. AI接管用户电脑，造成多任务（Long Horizon Task）周期与体验割裂，用户无法“脱离设备异步操作”。
3. 浏览器迁移历史极难打破分发局限——创业公司挑战Chrome绝不可取。
4. 产品自用“不够酷”意味着大概率没戏。
团队急刹车、行业内外“高频无所事事”——给创新型团队以深度“自主冷静期”，迅速转型新方向。
Inspiration：「观察到Cursor在工程师外的高阶用户群爆发，编程已变为通用任务解决能力，Agent应成为‘通用工具位’。」
成品思路：以云上VM为“赛博环境”，浏览器即环境，Agent为主角。Manus项目正式立项，3个月打造出核心原型。

F. 通用Agent与产品哲学——目标、边界与现阶段定位（[02:12–02:49]）

为什么“通用Agent”不是套壳
- 不是简单的多工具并列，而是统一的session/context/记忆流转；带有“多场景能力协同”的网络效应。
- 定位为高价值、专业脑力劳动者的“云端超级助理”，强调并发、异步、持续自治能力。
技术壁垒来源
- 深度自研沙盒虚拟机系统（Ubuntu/Windows多环境Firecracker全虚拟化），让Agent“模拟人用电脑”。
- 深度整合全球多家模型算力供应商（Anthropic、OpenAI、Gemini等），灵活调用，不自建基座但具备极强的能力主权和行业影响力。
- 强调不走模型垂直整合大力军路线，坚信“应用数据飞轮+影响模型厂商”的策略才能持续进化。
关键指标：坚持企业AR（年化经常性收入）为组织运行基石，高价值用户的“Agentic hours”远重于DAU。

G. 团队机制与文化观（[01:29–01:45]，[02:50–03:00]）

组织结构：核心6人均为身心健康、高度自省的连续创业者，分工产品/技术“分权而互信”。
决策机制：小红Red为产品拍板，但各条线专家话语权突出；“不做什么”比“做什么”更重要。
内部持续A/B test，多终端实地打磨；“克制”和“理智”是团队文化内核。
拒绝投票，推崇充分发言力与最终高效拍板。
产品feature增减定位：「每增加一功能，就是对所有其他价值的稀释」——节制优于激进。

H. 火爆后质疑与市场观（[01:48–02:00]）

为什么用邀请码？云计算和模型方算力调配跟不上Agent高并发Token消耗——“发布当天靠供应商现场插卡”。
国外爆红是顶级硅谷用户社交网络自传播（Andrew Kaposi、Patrick Collinson等），国内自媒体出于长期“广结善缘”主动跟进。
产品坚持高价策略（对标ChatGPT Plus），不卷价、不做补贴——高品质核心用户画像决定市场。
面对外界声音坦然、淡定，主张“打铁还需自身硬”。

精彩观点与名言/quotes
请见文末对应时间标注的精华语录区。
关键时间轴 & 重要章节（实际节目为长谈，推荐对号入座查阅细分）

[00:07–00:18] 纪个人成长环境及早期创业
[00:19–00:24] 浏览器出海、App Store影响、转向NLP
[00:24–00:41] 知识图谱时代、NLP技术范式转移
[00:42–00:59] Agent思路萌芽、团队选择、分工观
[01:00–02:11] AI浏览器项目复盘及放弃、Agent产品转型、Minus启动
[01:12–01:45] Minus产品设计、用户画像、技术实现细节
[01:29–02:00] 团队管理、产品增长、决策机制
[02:12–02:49] 通用Agent vs 整合工具、市场定位、行业壁垒
[03:00–03:37+] 火热后的冷静、市场PR与增长观、全球生态位、行业展望
[后半程] 对头部模型公司、开放开源生态、长线创新、行业大势的系统性讨论

代表性金句摘要

“我专注于如何用通用范式解决问题，用通用方法投入更大的算力，而不是加入更多人为的知识。”（纪易超，01:56）

“产品的唯一护城河，在于你内部对‘好’的定义，比任何模型参数都更有壁垒。”（纪易超，01:36）

“创业公司最大的不确定性往往不是被大公司卷死，而是主动失去了自己的独有价值。”（纪易超，03:32）

“每增加一个功能，都是在稀释所有别的东西的价值。”（纪易超，02:55）

“我们不希望再凭爱好往前冲，而必须以数据和实际市场为第一性原理。”（纪易超，00:55）

“不要把人类的分工/data给Agent，模型是更全能的，不应该生搬硬套。”（纪易超，03:00）

“我们每次调整、不做什么，比我们做什么更重要。”（纪易超，01:36）

“企业能活下去不是权利，是自己日复一日持续争取来的。”（纪易超，03:33）

“不是AI让你恐惧，是你用得还不够多。”（纪易超，03:32）

“对于agent产品来说，收敛不是拍脑袋选赛道，而是让用户数据自然塑造结果，做出自己都觉得‘酷’的东西。”（纪易超，01:10）

“能不能打破浏览器分发壁垒？我做了两遍，给出的答案都是不行。”（纪易超，01:09）

“创业浪潮里，早一步是先驱，早十步就成了先烈。”（纪易超，00:49）

“我们每个人都不会为人带来的复杂性而自苦。”（纪易超，01:32）

“产品要能服务那些最挑剔的用户，这才是最难的GB。”（纪易超，03:17）

代表性段落与详细见解/亮点精读

Mynas与Minus通用Agent的策略转型

“我们做了两遍浏览器，后来都意识到，无论AI多强，无论技术怎么变，只要分发能力被平台掌控，创业公司做浏览器都不值得。”
“Agent不是多场景堆砌功能，而是实现用户context自由流转与多元内生协同。”
“我们核心指标不是DAU，而是高价值用户每天实际的Agentic hours。越精深，才越难长期做大。”

团队与管理哲学

“CEO只能做一次，尤其得清楚自己情绪曲线和‘正道’还是‘赚钱’的冲动。”
“我们的管理机制是：goal要拍板，priority半专制半民主，options要完全开放讨论。不投票，靠补充方案争优。”

模型与应用公司的天平

“做应用的速度一定比模型快。通用模型迟早会‘外包’给最会用的应用方优化。”
“模型公司未来肯定两面走，谁都会有应用。产品数据飞轮是下半场决定性的壁垒。”
“我们的优势正是紧跟所有模型厂商的创新，而非死磕一套all-in。”

产品边界与生态位

“通用Agent是人用所有端云工具的入口，但服务人——不是为了替换人，而是真正提升非专家也可用的能力。”
“下一波爆发绝对跟主动性（proactiveness）有关，AI的解放是让用户把时间差、抗干扰能力释放出来。”

AI/Agent行业趋势判断

“AI行业不是平台跃迁。强者只会横强，但产品创新和数据飞轮、evaluation才是进入新周期的核心。”
“Agent里的产品壁垒，不在token消耗量本身，比拼的是用户到底复购在哪一端，是人还是AI决定了’稳态’。”

结语与主持人寄语本期在2025年岁末节点，为中国AI“通用Agent”型应用赛道，以及顶级技术产品团队的出海与形态演替留下了极具参考价值的第一视角证词。无论听众是AI创业者、投资人、技术实践者，或对团队文化/跨国协作有兴趣的创新行业关注者，都能在此总结中获得关键线索与立体感知。「如果我们能陪你走一段未知的孤独的路，离目的地更近一点，已然很温暖。」——张小珺

附录一：精选金句/片段

[00:37] “App Store的变现门槛让所有瞎搞的人第一次能证明自己的创新有价值。”
[00:53] “我觉得创业的最大收获，是让我很早认清我们只是‘顺着技术往上爬’，无论时代演化，历史总会押韵但不会重复。”
[01:10] “我们团队如果做出一个我们都觉得‘不够酷’的产品，就绝不发。”
[01:45] “团队每个人都身心健康、无不良嗜好——现在AI行业身心不健康的人已经很难成功。”
[02:00] “决定不做什么，比做什么更重要。我们每个月都在删feature。”
[02:12] “Agent作为产品，唯一壁垒在‘evaluation/taste’，能自己定义好与坏，你的数据飞轮才转得起来。”
[03:00] “我们做‘纯血派Agent’，不是把人的分工生搬硬套，而是真正让AGI用通用方式解决现实世界复杂问题。”
[03:32] “AI不是让你恐惧，是因为你用的还不够多。”

（部分摘要内容因原文叙述丰富，时间标记点以±2-3分钟为弹性参考）

如需深挖某一特定话题、某段技术观点的梳理，或精简为文本金句/访谈提纲，欢迎随时补充需求！

Loading summary

Transcript3 lines

[00:07]
A
hello大家好欢迎收听张小军商业访谈录我是小军这是一档由语言及世界工作室出品的深度访谈节目我们希望和你一起从这里探索新世界首先是205年的12月1日,嘉賓是Mynas聯合創始人和首席科學家紀易超Pick。就在剛過去的凌晨,Meta宣佈全資收購Mynas,而在這期節目立志的彼時,也就是月初,收購事件尚未發生。最終,這期節目成為了Mynas最後的訪談。 hellopeak先给大家打个招呼并且做一个简单的自我介绍好大家好我叫季超朋友叫我peak我是ManisteeAI的co-founderandchiefscientist然后今天很荣幸能参与这个节目的录制你从小的经历感觉就很与众不同就是很小4岁就去了美国然后二年级又回国高中开始创业大学辍学了又创业然后又读完了研究生你讲讲你的这段经历吧首先得從我家庭背景我覺得我很幸運我的父親是北大物理系教授就是傳統意義上的科學家然後我母親算是老一輩中關村連續創業者當然現在可能可以叫企業家所以我從小在一個這兩種怎麼說你不叫文化就兩種不同的風格中一塊去成長我可能就在兩者中取了一個中間點就是所謂的科技創業者然後我從小的話其實不是那種聰明孩子學習也就一般但是比較喜歡自己瞎琢磨多一般就偏科其實我不知道我學習到底好不好或者聰明不聰明因為我覺得我就沒怎麼學然後我比較幸運的是我很早就找到自己喜歡做的事那時候是大概是209年然後蘋果其實除了iPhone之後的第二年然後那時候對我來說有一個很大的改變就是AppStore出現了AppStore我觉得是对我来说是特别重要的一个转折点因为在AppStore之前其实世界上很多人像我一样就喜欢自己捣鼓软件或做东西但是你其实缺乏一个很好的全球化变现的一个能力但这时候对于高中生来说如果你只是在瞎捣鼓一些课外的东西的话這個東西其實是比較離經叛道的你知道吧就是你沒有一個很好的第三方指標來證明說我的這個愛好其實是有價值的而AppStore當時的出現給了我一個契機就是說我可以向我的父母同學乃至於老師證明說我瞎搞的這個東西是能產生經濟價值的所以我就算是中國第一代軟件出海的創業者對當時那時候還在上高中然後我是做了一個第三方的IOS瀏覽器叫做MemysquareBrowser猛码瀏覽器當年也稍稍火鍋一點然後用的是最樸素的那種叫buycopy就是賣一份就賺一份固定的銷售額的這種模式然後所以很幸運很早的時候就有了比較穩定的現金流對這個有多穩定現金流那個軟件從第一個版本到最後我大概賺了30多萬美金當時我覺得那個對於一個高二高三的學生來說已經算是挺開心的一個事而且關鍵是它的銷售的模式很清晰對吧我不需要去考慮太多的比如說AIpurchase應用內付款或者提供一些增值的這種模式我只是非常老實的賣一份copy然後你給我一份錢所以其实对于我怎么说呢维护的成本是比较低的是一个当时还成立的一种商业模式但是后来大家都知道移动端软件已经不太再支持这样特别朴素的商业模式了因为大家都要先免费获取客户对或者就说当时是一个很好玩的情况因为那个时候从桌面互联网到移动互联网我觉得是有一次平台或者简单来说就有一个硬件媒介的变化对吧所以你有一个新的一个媒介出来即使你是传统的大厂比如说国内当时的BAT然后海外这些公司其实大家都是跟Powder一样众生平等都在做一个全新的尝试然后那个时候其实就会有一段在我看来可能是蛮惶期的一个阶段所以你有很多的机会去做这样的事大家還沒有反應過來後來的諸多的商業模式但你看反觀現在AI我可能就聊到哪說到哪你就覺得很難的一點就是AI雖然是一個新的一個技術突破但是實際上沒有一個全新的一個平臺出現所以你看這回的話我覺得沒有存在那個蠻荒氣無論是巨頭還是創業公司還是個人開發者大家的反應都一樣快做的都非常的乾脆利索對所以我覺得我算是改成了一個好時代當時這段創業怎麽結束的這段創業其實我覺得沒有一個明確的結束的那一刻其實它是我創業的一個起點那時候我覺得還不能嚴格意義上來說稱為創業因為我只是一個學生個人開發者用一個最樸素的商業模式去獲得了一定的現金流但當時的話你有一定的現金流同時你要做一定的marketing對吧但是我也没有团队就一个人就自己在比如说在国内外的论坛上发帖然后当时国内没有很成熟的那种就是支付渠道因为你知道现在AppStore你可以用比如说像支出宝微信或者用creditcard你可以去付款但当时我记得其实只能支持国际creditcard所以中国国内基本是没有什么付费的这感觉跟现在AI也挺像的反正当时我就想既然国内我很难去获得现金流我在国内就只能赚吆喝所以我那时候会破解自己的软件然后在国内论坛上发你没钱你就给我捧个人场對然後你在這樣做的同時期你就獲得了一些來自於比如說資本界的關注所以那時候也很好玩我當時高二高三的時候然後當時在參加一個当时感觉还是比较有创业氛围吧那时候中文村然后我应该就在中文村参加了一个创业活动我有点想不起来是哪一个了然后当时的话就认识了真格基金对然后这个故事就非常简单就是当时徐老师对徐老师问我小伙不错你想创业吗然后我当然不想创业了对吧因为我既然有一个稳定的我可以边上学边躺着赚钱的一个先进流那何必要创业呢但是我覺得畢竟徐老師大家可能當時都是比較熟悉的因為他應該也是北大那個體系出來的然後當時我回家跟我父母提了一下這個事然後我這方面確實感謝我父母他們就說這個你是值得去好好考慮一下的然后我觉得那个时候对我来说也是陷入一个纠结就是我可以有几个选择对吧也许可以我申请学校去上一个好的大学走现在跟大多数人一样的一条路但另外一点就是我觉得AppStore给了我一个特别好的一个正反馈就是你只要创新也许就能有回报当时想的会比较天真就是说我好像做出一个好东西自然就会有一个好的结果然後當時其實我漸意識到這個不是一個常態我是很幸運的踩中了一個時代的機遇好其實我也許我什麽時候都能繼續去讀書所以我就想我其實現在優先考慮的應該是一個機會成本對所以我當時就拿了termsheet然後決定這大學我不上了我要去創業對但是當時的話為什麽接受真格的offer其實也是他們給了我一個承諾而且我覺得一直是這個承諾兌現至今他們不會管我幹什麽我爱干嘛干嘛对所以我觉得这个其实对于一个学生来说我觉得我能有的一个最好的一个选择所以当时的话我就拉上另外几个同学比我大两届他们已经保送区北大了然后但是又被我忽悠出来但当时我们其实已经意识到就是你如果还在做这样朴素的一个按哪一个copy去赚钱的这个模式已经不太work了那个时候已经感觉到不work了对吧很明显因为当时的话已经又过了两年了然后这个时候你会发现无论是国内还是国外尤其像第三方iPhone浏览器的这一个市场里头其实已经出现很多不同的玩家了巨头已经回过味来了所以我们就觉得这个东西一定会走向一个免费或者加免费加增值的这条路但当时我们还做了一点最后的一个尝试这也其实后面一切的起点就是我们觉得我们既然要卖一款付费的浏览器我们应该在功能上有比较大的一个跃进首先一点当时NameSquareBrowser它的交互体验确实比较好的但当时其实还有另外一个背景就是那时候无论是国内还国外都是3G初期的一个阶段那时候其实移动互联网远远没有像现在这样就这么的流畅那时候可能大家还会更多关注比如说网速慢的时候怎么办弱网环境怎么办所以当时我就提出要解决一个问题就是我们能不能去预测用户的下一次点击比如说那时候我还记得大家用Facebook国内应该是用人人网校内的改名叫人人网我记得那时候大家很多人都觉得好像web版就是移动端的网页似乎比当时那些比较初期的客户端要好用所以很多人其实是在用移动浏览器去进行一些社交媒体的使用所以你会经常有那种翻页下页这个操作然後後來有更多人在手機上開始看新聞其實我當時就覺得如果能準確預測用戶下一次點擊的話我可以進行preloading就是提前加載下頁的內容讓它的響應會更加的快然後這個其實就機緣巧合之下讓我進入了NLP就NaturalLanguageProcessing的這一個領域就是自然語言處理當然現在大家可能不太提這個詞了因為大模型已經把這一切給統一了對然後那時候大概201年開始我因為這一個需求所以開始研究這一個方向然後當時做那真的是太早了我很幸运点就是我感觉一直我在学习的东西都是因为具体的需求在牵引对所以刚好也就跟自己兴趣都会比较align所以就接触这个行当开始做所以浏览器其实真正意义上到后来它的结束是什么是我发现了更好玩的东西就是在原处里所以因为它的模式一直是很单纯的卖一份copy它就渐渐就变成了一个没有人去维护的一个状态然后随着比如说到最后应该是iOS系统不断更新它的兼容的版本已经就是跟iOS不兼容了所以你自然而然就被从AppStore下架了所以这是一个自然死亡的一个过程当然我觉得这还是很幸运的就是让我人生的第一个产品就同时满足了出海加AI加上变现这件事所以有一个很好的开始现在反过去说的话浏览器这个事情当时怎么做有可能后来摸到移动互联网大牌吗有这种可能性吗我觉得当时的话我其实收到过一些收购的offer我觉得也许卖的也挺好的因为我觉得其实浏览器谁的offer這個就不要說了對不能點具體名但我覺得就是瀏覽器可能從古至今包括今天包括很多團隊也在做AI瀏覽器待會我們會聊到我覺得一直都是有一個點就是它其實不是特別適合以一個創業者或者說一個顛覆者的形態來做它其實更像是巨頭你已經有了分發的渠道之後去擠上天花的一個事對所以我如果回看當時的話我不認為以現在的我的經驗或者閱歷我能做出什麽更好的選擇第二段创业呢第二段创业的方向第二段创业的方向其实应该刚才讲的第一次真正的创业就是因为在做这个浏览器的时候意识到就是NLP这个领域真的非常有意思但那时候其实也是很有趣就是201年距离一个石破天惊的paper我说的不是transformer其实2013年是一个TimNikolov当时Google推出一篇paper叫Word2Vec就是第一次能够把也不是第一次就是较为可靠且高效的能够把自然语言文本离散化的自然语言文本变成丑秘像量这个其实对我来说是我认为我心中最石破天惊的一个转折点因为它头一次能让我们比较方便的把一些源自其他技学系和深度学习领域的方法应用在自然源处理领域像当时比如201年前后大家做自然源处理可能关注几件事比如说你要进行比较复杂的分析的话可能会有一个技术叫做dependencyparsing叫依存拒法分析当然现在可能这个词已经死透了可能新一代做AI的人都不知道这个词了然后中文的话那时候我们还会关注额外的所谓的tokenization当然跟现在的大模型的tokenize相比可能会更原始一点因为中文本身它会有要切分这个问题当然不止中文就是中文日语然后其实德语叫decomposition就是拆词这个问题所以那时候做的还是一些比较怎么说呢为了自然语言处理而做的一些比较专有的解决方案它按现在的话说是不太scale的因为其实你需要很重的标注才能做好而且你本身的模型也没有那么的强大所以当时的话我觉得给我最大的一个触动是2013年的Word2Vec这个paper出来然后我觉得这一下新世界的大门就打开了然后这个让我真正意识到我的兴趣可能其實是在NLP而不是在繼續做瀏覽器然後也很感謝當時真哥兌現他的承諾我說我不想做瀏覽器了然後真哥隨便然後當時的話我就看中了NLP但是其實也是看中另外一個市場機遇當然回過頭看我覺得是錯的這是怎麽回事呢當時到2013年其實已經開始有傳聞就說蘋果在籌備一款可穿戴式設備其實也就後來的AppleWatch然後這個當時給了我特別大的想象空間因為我當時覺得那個時候的搜索還是你輸入一個問題一個query然後他給你10個藍色的鏈接這個東西能夠work的根本原因是我們在與電腦這樣的一個大屏幕進行交互那假設未來比如可穿戴式設備或者說語音的介面就是voiceinterface更加成熟的話這一個交互模式可能就不work了所以當時我想解決的一個問題是什麼就是說我能不能以一種更結構化且更緊湊的形式把知識跟用戶之間的交互進行一次革命然后这个当时就引向了一个方向就现在可能叫语义搜索叫SemanticSearch这个东西我当时会觉得这就是下一代的Google我作为一个创意者我会不会是当年的Google像当年的Google颠覆Yahoo那样所以我们团队大家都很兴奋然后我们想解决的问题逐渐也就细化了下来这其实是一个非常技术驱动的问题我当时在想如果你想用一个更紧凑的结构去回答用户的任意问题的话那其实你需要的不能是网页的原始信息因为大家都知道其实搜索引擎的工作原理当时可能就使用倒排索引就是说你输入一个关键词它会把所有包含这个关键词的网页通过一些排序算法进行排序把Top10给你所以你用户输入的问题最后获得的东西仍然是原文是自由文本这个东西自由文本你想象一下如果你用AppleWatch你不可能在上面就反复滚动去读完对吧如果你是车机或者像Siri这种interface的话你也不能让它去朗诵那么长的文本因为人的带宽听力的东西其实你会很着急所以我們覺得當時從技術層面來講下來它缺的是什麼是一個高效緊湊的representation就表達形式而那個時候我們想到的一個概念其實是知識圖譜知識圖譜現在也是一個半截身子埋在土裡的概念老詞對但是當時我們也是有追求的團隊然后我们再基于知识图谱这件事我们再往下下转看到底是什么限制了知识图谱这个概念真正落地我们当时找到的一个切入点是我们认为知识图谱其实完全都不够完备因为那个时候你能找到的知识图谱无论是通用的还是行业领域知识图谱也是一个很久的一个词它其实大量的依赖是人的编辑比如说如果你要在一个行业内比如当时有做些什么工业领域的知识图谱比如科学领域知识图谱其实都是需要一些专家进行去标注比如你要标注的SPO就是三元组这样类形式去进行标注而通用或者说通识领域的知识图谱其实当时世界上有几个比较大的平台有一个叫做Freebase好像后来是被谷歌收购了他们就以一种中包的形式让大家贡献这些知识后来它应该演化成了WikimediaFoundation下面的一个项目叫做Wikidata它里头做的就是比如说关于你张老师你是一个实体叫entity你下面有各种你的属性比如说你的出生日期你的之前工作的场景你的节目是什么这样你能形成各个实体之间的关系这就是所谓的知识独补但很明显这个东西完全依赖于人类這個東西我覺得是我們探測到的一個瓶頸所以我們想找到一種技術來把這件事自動化當時的技術供給能做到什麼呢就是剛才講到那一個年代的NLP還在一個比較初期比較混沌的一個階段當時要做的事情可能已經有的方案是這樣你可以首先進行叫命名實體識別叫NERNameEntityRecognition就相當於你讀一篇文章的時候你把裡頭所有的實體能夠由一個AI模型來標記出來但這樣的話你其實只獲得到了實體就比如說張曉俊這是一個實體然後這檔節目是一個實體但是所謂知識圖譜之間是要有編的edge這個編是怎麼來的當時有另外一項技術叫做關係提取叫relationextraction就是對於兩個實體之間我能探測到比如說張曉俊是這一檔節目的主持人那麼主持人這其實就是一個編或者叫predicate衛語然後這樣的話我們用這兩套技術能構建怎樣的一個知識圖譜就是說我如果能限定領域那么我能进行很好的实体识别如果我能限定提取的关系的总类型我也可以进行这个工作比如说我提前知道这世界上有什么的节目的主持人是谁这是一种关系人的出生日期是什么时候这是一种关系但很明显这个东西好像不可枚举对吧因为任何两个实体之间的关系它应该是一个无限级所以我们就意识到当前的技术肯定是有局限性的那么我们当时就投入到了一种新技术的研发後來的話這個技術在學術界的定義應該叫做openinformationextraction叫openIE開放式信息提取它跟剛才這些技術的區別就是說我不需要提前定義一套規則或者schema就是說我不用規定哪些東西是實體因為傳統醫生的命名實體識別可能關注幾類比如說人名地名然後組織名這些東西你看這其實又是一個白名單機制我們要避免這層面的白名單同時在進行關係提取的時候我們要避免提前預設的這些關係而完全變成一個schemaless就是說無大綱的形式的提取所以最後我們做到一個技術是什麼就是說AI在閱讀一篇文本的時候它能夠自己識別出這裡頭有哪些潛在的東西是實體以及這些實體之間的關係是哪些並把它們提取出三元組並持續自動的構建一個知識圖譜所以这个在当时我觉得还是很重要的一个技术而且我们选择了最苦的一条路就是我们从零训的模型而且你想这件事是从2013年底2014年开始的我非常幸运又不幸的赶上了LOP技术最跃进的那几年所以我们一开始的话当时是一条我们团队分两边一边在做基于传统的依存计划分析的一个解决方案同时我这边在做基于word2vec项量化的一个解决方案然后做了几年之后我们发现这个东西好像可以去scaleup然后开始用LCM去做后来是LCM加attention再到后来我们觉得其实word2vec或者说LCM加attention它其实在输入层的信息损失就很大因为那个时候如果你用基于纯词相量的方法去做的话它无法分析分清楚一个完全同名的词的不同的含义我舉個例子比如孫悟空孫悟空可能是咱中國傳統COG中的孫悟空可能是我舉例子像日本七龍珠裡頭那個孫悟空其實在後來還有王者榮耀裡有孫悟空對你如果完全基於這個VirtualX這種技術去做的話你發現同樣一個詞它在不同上下文中的意義都被壓縮在了同樣的一個512或768位的相量中所以當時我們就很苦惱說能不能再進一步其实就需要有一个上下文相关的叠码方式然后那时候我觉得那几年是非常幸福的一方面是什么就是你基本上想什么这个世界上就会发生什么那时候再后来Transformer出来了BERT出来它很好解决contextual就是上下文相关这个问题但是不幸的就是每一次这种技术迭代你会发现我们过去几年积累基本都算了不用去做了所以很痛苦然后我们就是当等于从2014年底一直做到2018年才把这事做完我们当时所有的模型是自己从预训链区开始做起的是非常痛苦的一事然后也很早就是多大的模型总共加起来我们有两个模型总共加起来大概是两个0.3B的模型那时候这叫大模型但是现在这已经都不算什么对然后也很早的遇见一些问题比如当年像Bert他默认情况如果没记错的话他的contextlens或者说我们还叫sequencelens是512个token512我的天哪你如果去掉比如說它一開始的CLS跟SEPtoken你只有510個token這時候如果我要讓AI去自動在互聯網上去讀網頁的話這個是完全不夠的所以我們當時從2018年底就開始解決LongContext的問題但是那時候我們解決了LongContext在今天看來很小兒科我們解決16K長度然後我如果沒記錯了那個模型後來我也開遠了反正我們當時就一直在做這個事然後當時做了一個產品叫做MagicNagy是来自于我很喜欢的一部动画里的一个超级计算机对然后他做的事情就是如刚才所说AI能够自己去到网络上去看各种各样类型的不限领域的文章并持续构建并更新一个知识图谱然后当时我们做的这个事按现在的学术定义应该叫LifelongLearning或者ContinuousLearning对反正就很好玩然后这个项目其实做的我们是自己很high的我到今天也觉得这是我智力和我的编程和research能力的巅峰对在后来人就已经逐渐老灯化了就水准开始下降但是那段时间的话我们做到后面就会觉得很痛苦就是外界的创新实在是太多太快了直到2019年的某一天我拿到GPT-3的EarlyAccess我觉得天要塌了为什么因为是这样就我刚才讲的我们当时选择很苦的一套路就是一切我们要做垂直整合对吧就是模型自己做产品自己做那好我其实每一次产品的迭代我等着我底下模型的完成那时候模型现在还跟现在比简直非常小但是同样evaluation这事也很恶心对吧你的infra也要自己去搞所以我们当时迭代的周期基本是两到三周能有一个模型的迭代但是两到三周在当时的外部这简直是巨变了然后拿到GB3的时候我测了一下我觉得偏他的原因是什么我们把同样的任务我拿GBT我随便写了一个prom那时候大概没有什么prom的艺术对吧都胡写我发现他有跟我们自己训的端端端模型五五开你知道吗而且我当时就意识到一个问题就是他虽然现在很贵但是它是一個通解就是那個時候我們在比如LP領域內大家互相交流你會有很明確的感覺就是比如我跟別人自我介紹的時候說你好我是Maggie團隊的我們是做信息抽取的然後這邊可能是做機器翻譯的然後這邊是做客服系統的大家精微分明對吧就互相握手互相學習但GP30出來之後其實它印證了一件事就是好像我們做的不同的任務是能夠大一統的其實它不是第一個工作就之前其實Google有一篇叫FlintT5的一個paper出來已經當時有這個苗頭了但是那個時候大家還覺得Google土豪太厲害了做出一個很好的demonstration但是你要垂直領域還得靠我們但是GPC3出來之後就徹底就把我們那條心給摁死了你知道吧所以當時我的第一反應就是趕緊賣掉公司賣了嗎賣了賣誰了變現了是吧其實你好先進我聽下來就是你從1年做的事情感覺和現在大家做的事情差不多我覺得就是順著做了一遍我覺得不能這麽說就是你應該說大家在每一個階段遇見的問題是類似的但是你每一個階段其實都未能解決未來大家再次遇到的時候的問題比如我們當時說的longcontext從512個token到16k現在的longcontext可能是指的比如說20k到2million對吧所以我只是說歷史的話它會押韻那肯定不會重複這個東西你當時做這些你的目標是什麽因為我感覺一直在順著這個技術往上爬但你的目標是什麽呢對我覺得這是一個很好的問題也是上一次創業中我覺得我沒有想通那個事就是可能那個時候還是年輕包括現在我看到很多跟那時候我一樣年輕創業者大家我覺得優點是什麼就是非常的遵循自己的本心比如你喜歡什麼事你就先把這個事做下去當然你可以好點說就是如果你看中了一個技術問題且这个技术问题真的别人没解决的话那他往往可能会是符合第一性原理的就是说它是一个很重要的带解决的一个问题对所以当时的话我们预见如果你现在切到产品侧可能会有几个问题第一点就是我们会觉得应该做一款很成功的搜索引擎来替换掉Google但实际上首先我们低估了搜索引擎本身这件事这个其实当时很多人不知道就是Maggie这个项目我们没有使用任何第三方的搜索我們從爬蟲到索引引擎全是自己去建的自己手寫的我覺得那是我工程能力的巔峰然後我們其實低估了一件事就是說你光有技術其實你解決不了一些非技術問題比如說現在我都不太看好你再做一個新的索引引擎因为比如很多的数据员跟Google已经形成了一种就是他们之间也是一个互利互惠的一个可循环的关系你再以一个搅局者入场的话其实你无法重复谷歌过去20年来积累的这些数据员的这些事对所以当时我们就觉得产品一方面是我们的技术和非技术原因没做好另外一点我们当时很期望发生了就是说有一个新一代的可传代式设备或者全新的人机界面的出现这个东西可能到今天为止也许可传代没有充分的落地同时新的人机界面也许是直到XGPT才真的落地所以我觉得产品层面的错误一个是技术一个是可能确实是早了但是创业就是这样你早一步就先烈对吧所以不对早一步是先驱早十步就是先烈对所以当时我们就先烈了然后第三个我们觉得当时商业上也没有想的特别清楚对所以一开始想的是做一款就是完全2C把这个做大但后来其实因为做了很多年技术不断迭代你会慌所以又想能不能直接做一些2B但明显团队的基因不是这样的对所以我觉得那一段创意经历其实让我学到了很多当然特别爽然后特别爽就是因为那是一个我觉得很多创意者梦寐以求的一个状态就是我就想把我人生的夙愿给做完夙愿是啥人生的夙愿你人生的夙愿是啥就是我想自己从头基于一切都是自己写的自己写的info自己做的模型去解决一个别人没有解决好的问题可是Google这个事已经解决好了Google没有解决好你觉得它哪里没有解决好它是这样首先Google是通过收购Freebase对吧它其实获得这个之后它只是获得一个很好的一个社区然后它当时也有一个另行的项目叫KnowledgeVault还是什么东西然后我们跟他们做个head-to-head的对比就是头对头的对比我们当时在最高知性度下的准确度能达到89%点解所以我们的准确度是比他高的同时我们不仅支持中文还支持别的一些语言包括就反向写的阿拉伯语这个现在可能大家不觉得是什么但当年这还是比较厉害的一个事然后同时我们还自己去演练了像那个四项量搜索那个现在可能也是比较常态了我们当时为了解决这个scale的问题我记得是跟英特尔合作找了一个新的方案他们当时有一套技术叫做PMEM就持久化内存我们自己写了一套项量索语基于那HSW算法然后去搭建了整套这个东西就是我把我这辈子想试的技术都以合理的方式花投资人的钱给搞定了对所以我觉得在那个项目做完的那一刻我的人生就圆满了你知道吧所以就在后来像包括现在做Manus这些事我心里已经没有什么就是那种就是我要证明自己或者我要做什么这个才能死而无憾我早就无憾了所以现在我就可以一个很轻松的一个状态来做很多事所以你还去工作了对我工作了一年半那段工作经历其实非常开心非常開心為什麼是個大公司嗎當時還是一個獨角獸狀態然後就相當於在臨上市前的一年多但是當時又剛好趕上GPT當時我是因為GPT3的出現我意識到危險了所以相當於我是在拆GPT出來之前一直幹到了拆GPT出來之後相當於我在那家公司叢林的做起了LM的業務對所以那段期間怎麼說呢這個公司的一個工作模式當時很多人不喜歡就是說好像所有的這個research或算法崗位大家都在公司內部打榜因為那是一家2B的公司就B2B做AI2B那AI2B的一個經典的問題就是說你如何去量化用戶的收益你除了一些比如說最終的經營指標以外你其實也需要一些過程指標当时的话有一个部分团队的任务是说我把所有用户的需求转换为可量化的benchmark这个就是research和算法长最喜欢的事情就是打榜所以那时候我的主要工作就是打榜然后打榜又很开心因为当时公司内部的一个激励方案很有趣就是公司内部有个类似卡购那样的一个榜单系统然后你赢得越多你的奖品是什么你能获得更多的显卡所以你會進入一種強者橫強的狀態你知道嗎就是所以我當時一個人能存好幾十張卡然後我一堆卡的資源閒置但是我又可以去導顧很多這個我想試的東西因為總有客戶會需要嘛對吧所以我可以做很多的實驗然後同時我的算力又是最充裕的我能skillup所以我在那一年半裡頭我一直霸王在第一名所以我覺得那段經歷特別開心的你以前上學的時候好像沒有這個勁頭是嗎你以前上學的時候是那種特別喜歡比分數的學霸這種類型嗎好像不是吧不是因為我好多課我都沒上所以我特別感謝我的高中当时在北大附中读书然后我觉得我特别幸运就遇见了一群超级开明的老师就是开明到什么程度就是有的课不想上老师说那你就不上了后来学校还给了我一个也不要一个小顾问我们有一个计算机社团就相当于我在学校里头有一个不上课都可以去的办公室有空调有电脑让我好好的捣鼓我喜欢的东西所以我觉得太幸运你第二段创业终止的那一刻你在做什么你在想什么我当时的想法是这样就是我知道有一個新技術出現可能要殺死我這時候我的選擇是什麼當然是選擇加入了對吧但是當時的想法是這樣我剛經歷上一次創業的一個創傷就是你自己要做垂直整合真的很痛苦就是每天醒了之後我常說一個比喻就是每天醒的時候你都感覺海水在上漲但是你不知道會漲到什麼程度也許你第二天醒的時候就已經到鼻子這了就很恐怖的感覺所以當時我想法還是我喜歡創業的但是我不想做垂直整合了所以当时会有一个比较天然的想法就是那时候大家会把创业AI创业分为几个layer的几个层比如说那时候有模型层有那时候好像叫infra层就是基础设施层以及应用层然后当时我就想ok那我面前其实也就三条路那时候其实到了二年底二三年初大家看了拆GPT之后其实国内很多机动模型公司已经开始动起来了当然我也跟所有人都聊过但是没人能说服我就是这个东西到底该怎么办因为我觉得我不太再想体验这种特别难受的状态所以我的更多的目光是看向了所谓的基础设施层跟应用层但这时候其实也有一个问题就是大家当时一直在说这个事但是没人知道真正的AI应用杆该长什么样尤其你想23年年中的时候真正有PMF或者说有一定声量的产品可能就两个一个trans-CBT一个character. ai对然后character.
[29:15]
ai这种东西我非常清晰我不懂这个东西因为我用了以后我自己用不进去你不拆用户不是不是用户我肯定做不好这样的产品而拆GDP的话这其实是一个天时地利人和的一个状态我之前也觉得就是拆GDP其实出来一瞬间拆Bot的赛场就已经结束了所以我明白我想做应用或者做infra层的东西但我没想好我要做什么对所以我就看一些机会同时的话也就去怎么说看看相关的项目然后在政隔了一段时间对吧对在政隔呆了一段时间然后也算是跟更年轻的创业者一起交流就把我过去的比如说悲惨经历跟教训可以提前告诉大家所以今天这节目我也想跟大家分享一下悲惨经历对然后再到后来的话其实也是当时认识了小宏就我们现在Manist的CEO然后他是怎么说服我加入或者说为什么我要从第二轮创业之后去开始这个事你中间隔了多久当时就那一年半的时间再掙個一年半對再掙個一年半時間然後那段時間你就明確不想做大模型不想去任何的一個大模型公司我幾乎跟所有的大模型公司聊過你有喜歡的嗎GoogleGoogle海內外都聊了是吧海外聊的當時海外沒幾家海外基本都聊了然後國內的話也都聊了包括當時為什麼是Google你不是要幹掉人家的嗎就是你沒幹掉他你才會格外尊敬他然後當時我的想法就是我想找一款AI產品不是我自己去主導而是一個很空的畫布就大概是這樣的一個感覺就是因為對其實上一次創業到最後我其實還學會了一個很重要的事就是我意識到我根本不是做CEO的那塊料我既不喜歡商業化我也很討厭管人對所以我覺得這是交了一個學費就是我知道我不該做CEO我應該找一個比我適合做CEO的人你覺得你是哪些方面不適合做CEO呢我覺得完全就是一個情緒上就很抵觸情緒上就很抵觸對情緒就很抵觸為什麼呀CEO哪些比較煩你的人性首先有一點就是說我與其跟電腦打交道我很喜歡跟電腦打交道但我覺得人太複雜了就是你的組織在隨著變大的時候其實你的發現你這個複雜度其實是指數級增長的我觉得我不是那块料我搞不定太多人与人之间的更微妙的这些事情你看起來比小紅要易很多不不不其實我們公司除了張濤以外全都是愛人你是愛人對我只是開朗的內向你知道嗎就是我在跟你聊我在跟你聊具體的業務的時候我能講很多但是其實我你是愛什麼愛NTJNTJ感覺都亂大街了大家都差不多了對所以就是我覺得首先管人我覺得我不太行第二點就是我有的時候會陷入一種特別追求正道的思路什麼叫正道就是說正道對就是你有一個能夠賺錢的方向和一個能夠把一個特別有趣的技術走到底的方向我毫不猶豫的油門踩死往右走但是我知道這一定是錯的所以我需要有一個人把我給管住就是在我又想發癲的時候給我摁死對所以也是經過創業之後你會充分意識到自己的不足對然後所以我當時想法就非常清晰就是我想一不想當CEO不想當一號位第二我想找一个能够探索的画布注意我说的是画布而不是一个已经成型的一个产品然后去迭代它对因为我觉得当时所有人不过都是在下注没有谁说真正有一个非常系统性的systematic方法去知道接下来AI产品要做什么什么叫所有人都在下注当时大家都在基于自己的一个直觉判断去说我要做一个什么东西但其实我已经经历过几次这样的创业我在想我能不能这回做的正规一点我能不能像字节跳动一样有一点数据思维然後所以當時我就覺得我不應該自己在叢林去一種就是我因為相信所有去做的事情我應該有一個過程去更多的觀察觀察用戶最好的方法是什麼就是有一個初步PMF但又非常空的畫布在這所以當時我跟小宏當然因為他也是就針隔頭的也是像我們老一輩創業者現在都已經是中等的年紀了所以就是当时他做一款产品叫monicamonica现在也有很多人用很多用我们现在都在同一个实体下面monica这款产品它其实是一个chrome的插件chrome插件我当时觉得这个产品的形态非常戳我是为什么因为首先它其实没有改变任何用户的习惯你在浏览器中你仍然在使用你所熟悉的Gmail你还在看YouTube它没有因为是AI所以侵入你的生活而改变什么所以用户的原本的轨迹不是被强行改了你的观测是一个无偏的观测第二点是什么就是当时很多人你要做AI的话你可能都你要先下注去做一个方向因为你不能在一个界面中无限的叠加不同的元素对吧那你产品的复杂度会变得很高像我很喜欢GitHub有句话叫everythingaddeddiluteseverythingelse就是你每增加一个东西都会稀释所有价值但浏览器插件的绝妙之处是什么它的功能的分发其实是基于context的就比如说跟视频理解相关的东西只会在你看YouTube时候出现然后跟比如自动编写或者文章文章改动的这些功能只会在比如说Gmail或者Googledocs里出现所以它其实消解了功能增加带来的复杂度爆炸问题所以我觉得浏览器插件是一个绝妙的观察用户到底在怎么用AI的一个窗口它甚至不能叫一个产品形态它是一个空的container一个空的画布所以我觉得这款产品是绝佳的作为进入AI应用时代的门槛观察到了什么观察到一些非常有趣的东西待会再讲为什么做Manager可能都会讲到然后这块我觉得这是非常值得做的但是我其实也没想好其实你有别的插件为什么要跟小宏合伙首先我很幸运跟他交流之后发现他太适合当CEO了怎么说他擅长所有不擅长的东西而且其实如果你反过来说你在看当今国内外AI创始人一号位的整体这个版图的话你会发现小宏有一个非常稀缺的特质什麼他很正常他身心健全沒有任何不良嗜好沒有任何極端的思想這不是一個正常的指標這已經很難得了你知道嗎我覺得現在整個這行業有很多人比較偏執或者怎麼樣但是講真其實你沒有喬布斯的命卻得了喬布斯的病你在說你自己嗎對而且我經過慘痛的失敗之後我意識到這一點但是他們還沒有意識到所以我覺得小紅身上最可貴的品質就是他特別正常相信常识是吗对还是你会说话对相信常识且相信团队而且就是好多事情的判断它会更加的怎么说你既可以说是就是数据驱动也可以说是直觉驱动但是他是一个真正的能把公司从一个阶段持续带到下一个阶段的人而我可能如果自己从头做的话我只会在我喜欢的那一个阶段很爽对所以我觉得太难得了哪些细节能让你见他第一次就觉得他很正常我觉得不是见第一次你们见了几次其实很多次就包括后来的话其实也是一起吃了两三次饭然后也长谈了很久对然后最后他怎么打动我加入呢还是因为一句话他说jake我知道你做过浏览器你做过搜索引擎你做过语言模型你想不想在一个产品里把这三个事都重新做一遍我觉得好呀这个好像听起来也挺吸引人的然后当时就加入当时加入之后也非常清晰的一点就是这次创业其实我不是来做monica的就是Monica是我们大家的一个学费比如说整个这个公司的一个cashcow就是它产生现金流但是我们一定加入把这个团队团结起来包括后来张涛还有更多的合伙人加入我们是要一起搞一个全新的事情的在你们多次的长谈和聊天中你觉得哪些细节让你觉得它非常的正常我觉得还是对比出来的就是因为同一个阶段我一定不止跟小宏有所接触对你肯定见了嘛对是的怎么正常的我觉得别的创始人都太艺术家了太艺术家了是的是的你就比較藝術家是吧你如果這麼劃分的話我不敢說藝術我不配我不配我不配這個詞太藝術家了對別的創始人我覺得太藝術家了小鴻非常的現實對就或者說包括整個現在我們公司的這一個運行其實我覺得都是很穩健的甚至有時候我們內部粉絲會覺得有點保守但這才是一個叫什麼就是更尊重對尊重常識我覺得你這個詞說的很好你說誰是藝術家我們可以逼掉太多了就是我举例子比如说你知道那个产品吗我知道对然后你知道点点然后像这个点点我记得见过他对然后像那个还有那个做那个记得那个你都见了我大家都会来找我聊一聊然后我就觉得大家都太太艺术家了太艺术家了对然后我身心不够健康是吧就很偏执你知道吗就是多少有点抑郁多少有点抑郁多少有点抑郁然后对其实小红也有时候会抑郁但我就一直他就比较emo有时候是对对对但他不属于抑郁对吧他不抑郁整体是比较阳光对而且不会那种深夜发癫就是那种现在这些都对于创业者来说你觉得不是优点了是吗我觉得不是优点绝对不是优点这我觉得是很大的一个变化就是说以前移动互联网时代我还挺喜欢这类人的因为你的编辑成本很低就是说你可以去比如说赌一把搞一个大的看用户是否你能找到一群跟你公正的人才逐渐去做大但其实我们觉得现在AI这个行业首先当然就elementorinferencecost一直在下降但其实我们心中隐隐觉得它更像传统的制造业它一直有一个固定的成本在那你如果没有任何的优化的话其实你随着你用户量的增加你的成本是线性去提升的所以这整个事对经营的操作能力的要求是比上一代移动互联网创业要高很多的很有趣我觉得是高很多的移动互联网更喜欢艺术家对移动互联网实在喜欢艺术家而且其实你能很低成本的获得一批初始的用户但是AI我觉得不是AI不是这样但是你從一開始就pass了大模型這家公司是的你也都了了我基本上都了了但這個原因完全因為PTSD但是大家會覺得AI時代不一樣的是可能大模型和產品是一體化的所以說擁有大模型的公司更有可能做出好的產品就是他們那個沿途下旦的理論你從一開始就不認可嗎我認可這件事但是我认为有一个时间限后问题就是我现在的一个观点其实是可能都不用太久吧也许比如说六个月之后其实你不用再分所谓的模型公司跟应用公司基本上每一家头部应用公司都有做模型的能力其实这个事已经被Cursor给跳出来了我觉得之前大家还有一种秘而不谈精微分明的状态但你看Cursor已经跳出来他们搞了他们新的模型叫什么来着ComposerOne对吧其实我觉得首先就是做模型或者说做垂直整合这件事它其实最影响的是你初期的迭代速度就是我上一次创业最惨痛的一个教训就是你在不确定的时候你开始做bottomup的这种就自下而上的迭代的话你会被你的模型迭代所影响其实这个不仅是创业公司的问题就是你哪怕你强如OpenAIOpenAI我非常尊敬他们的也就是他们一直非常尊重这种自下而上的这种模式所以它能产生很多新的创新但是如果你首先你一个产品引领的思路来看的话你某种意义上来说一你在买模型彩票因为即使你有一个比较好的一个roadmap其实你在最后完成PostTrade那一刻之前你都不知道这个模型到底能不能达到你想象中的这样的一个需求所以很多时候你是因为有些突破所以反向在引导产品的走向这个我觉得我之前已经吃过这个亏这是第一点第二点就是我刚才讲的就是模型你即使能通过很多的比如说你优化你的pipeline你增加你的人手或者让你整个链条更加的流畅来增加你的迭代的速度但其实这个世界上只要有产品经理存在你一定是追不上产品经理的脑思维的活跃度所以我觉得比较健康做反应是当你的产品已经出去PMF且已经到了一个比较稳定的一个状态下之后你以一种增加稳定性或降本或突破天花板的思路再去做模型这是一个先后的问题你當過CEO然後也當過就是旁觀CEO的人你就身心健康對於現在AI的founder來說價值大嗎有意義嗎我覺得非常大就是因為你很有可能會受挫或者說你必然受挫但是身心健康的人是打不死的就是你能夠一次一次的很謙卑的再重新站起來再去很冷靜的看待外界的變化來回馈到你的一个决策的一个思路上这其实我觉得在我加入就是蝴蝶向我们这母公司之后我们看见了无数次这样的事大家没有那种因为我是一个身心不健康或者我有过度的一种执念而选择一种蛮干这个思路我觉得整体就非常理智你们从几月聊到几月份然后你加入了minus其实中间隔了很久我有点记不清了但我觉得前前后后应该有4个多月四個多月我記得我第一次跟小鴻見面的時候是在北京寰宇會下樓的時候他說他剛跟你在這見了你是在那裡答應了他加入Mynas有可能這一年過得太快了好多細節都已經想不起來了我最後正式加入應該是204年的3月對年初加入的所以二三年底開始聊的對是的然後同期你也聊了很多那個時候出來做應用的方式對也不僅是應用就是剛才是講那三層嘛其實都聊了對大模型公司你有喜歡的公司嗎大模型的話肯定都聊了對反正當時的話其實可能比現在看起來更欣欣向榮一點对然后当时其实我比较喜欢两家我不是马后炮我觉得确实也是当时判断比较好应该三家吧我比较喜欢千万DeepSeek和Kimi对然后DeepSeek当时也是因为很好玩就是其实很早就跟他们有接触是因为那时候我之前的一次创业是在做那个自主图谱构建且同时我们自己丛林搭建整个这个搜索引擎的infra所以其实我们有很大的预训链数据集所以当时很早就跟DeepSeek的朋友认识了然后但后来我没有把数据单独卖给他们我直接把那个我们当时做数据集开源了也算是给大家留下一点遗产然后千万的话也是因为跟他们团队的很多人都比较少然后当时就觉得千万是做的非常扎实而且他是真正第一个非常宽松的开源的模型我这个尊敬的程度就是非常的高而且另外一点就是他让我看到了大厂里头一群年轻人能干出来的事情的一个表现对我觉得非常难得然後Kimi的話一方面也是真格投資的然後甚至當時投Kimi的時候因為我在真格所以當時交流會比較多對然後我覺得首先這個公司是比較有品味的品味是的Taste這個還是很重要技術品味嗎我覺得品味這個詞大家經常說我可能會關注一個非常具體的一個指標對不起不該叫指標不能這樣去扎著就是說大家常說品味我覺得該怎麼體現出來呢品味可能體現在你的evaluation或者你內部的benchmark上甚至我觉得这可能是创业公司对不起不是创业公司所有AI公司唯一的护城河就是因为你自己内部的衡量指标无论是对于模型的benchmark还是对于你人的激励其实决定你家公司和产品该走的这个方向对所以我觉得这个还是很不错的那个点觉得我不应该去大模型公司而应该去应用公司的人非常少应该是我觉得这就是我刚才说我特别幸运的一个点就是我提前吃了很多大家后来才吃了亏他们今天开始吃了没我覺得很多人已經在吃了且付出了更慘痛的教訓比如說我覺得現在其實很多之前講的一些國內大模型公司可能從最開始不是什麼百模大戰嗎其實當然那個9都已經先死掉了最被大家提起的幾家其實也有些已經漸退出了這個賽道我說這是挺正常的而且自從其實DeepSeek出來之後我覺得還是對大家產生很大的客觀的衝擊就是它讓一個模型的保质期变短了特别多训大模型我觉得最痛苦的是什么如果说我以前的痛苦是来自于我要做垂直整合我要快速迭代的话现在变成了一种如果你只做模型你不是sota就没有意义但一个sota模型你的保质期其实只有1到1个半月就是一种非常激烈的不进则退的一个状态而且大模型就我刚才讲的就是以前我们做LOP的时候其实你能有很多不同的你可以叫赛道比如我做信息抽取你做什么东西你的所谓的好的指标是多元的而LM或者说你这种nexttokenprediction范式的模型它其实统一了各种任务的建模虽然大家也说我要做coding我要做多么太怎么样但是世界上的能够衡量的指标的维度其实非常清晰的你几乎没有多少腾挪的空间但做产品的稍微美妙的一点就是你起码能够自己定义什么是好所以你起码能在一个错位的赛道上去跟别人竞争你有更多的发挥的空间今天追求sota还有价值吗我觉得一定是有价值的这个我觉得是无论是模型公司还是甚至是做agent公司我觉得都要追求SOTA这是一定的因为还是刚才讲了一句话就是你的evaluation或者说你关注的那些你选择的benchmark决定了你的taste能否落地你从第一天就pass了这些大模型公司你觉得他们的未来会怎么样我觉得其实是这样就是大模型公司一定最后都会变成同时做模型和同时做应用的公司其实你看美国现在版图基本已经是这个方向了OPEC我认为它现在更是像两家公司一个模型公司和一个跟它有强关联但并不绑定的researchlab而Google的话始终它就是一个双向都很强的公司而Anthropic他可能之前还一直会比较关注说他作为一个B2Bmarket比如他做他的这个CloudAPI但其实CloudCode的巨大的成功也给了他们很多正向的一个激励像他们自从那个MikeKrieger就之前的就他们现在的CPU加入之后其实他们对产品的打磨也做得非常好而且MikeKrieger他也不仅是在做就是大家广义上来说的面线用户的产品他对很多面线开发者的产品的把控也非常好像比如大家对于像Cloudscale都给出很高的评价这也是一种产品能力对但是我觉得这可能就是大家都会走向那条路反过来说我觉得如果最后不再分大模型公司跟应用公司的话我认为其实做出一款好的应用且被大家喜欢的应用其实比做出一款够好的模型难得多因为逊模型这个东西它的知识的流通在业内是非常快速的尤其在硅谷没有经验你可能一个老公在OpenAI他的老婆在Google沒有什麽秘密你知道嗎所以這個東西一定會流通的所以我覺得到最後其實會變成一個應用之爭然後每個應用背後會綁一些模型所以未來模型公司和應用公司是沒有那麽警衛分明的對我覺得不會那麽警衛分明你刚才说你当时还聊了一些海外的公司包括Google你还聊哪些公司当时对他们怎么看在23年对吧23年对其实当时的话几乎所有在做某些公司我都聊了然后当时其实23年初我也录了一个podcast当时还是在以真格的那个ER的身份去录的就说一些暴论的现在看了好像都对太幸运了对然后当时的话我就其实比较看重几点然后这个都是有史可查不是事后诸葛亮第一个是23年初我说我关注longcontext当然这个待会可能聊到我觉得这个错了对然后第二点当时比较关注的就是在自然语言和系统的边界你可以说是functioncalling或者就是说跟environment的互动其实就现在agent这些东西对这个是我当时比较关注的一点然后第三点就是这个其实当时分享的时候没提但我其实还一直还挺信scaleup这个事的因为这也是大家常说的battlelesson就是苦涩的教训这件事就是人类历史上AI的进步基本全是用通用方法加投入更大的算力而不是增加人为的专家知识的注入所以当初对于scaling这个事一方面是很看好然后很早买了NVIDIA的股票然后这是谁的股票NVIDIA然后当时我就心里会觉得Google最后一定会很厉害但是他确实用了很久才很厉害你加入Mynus是24年的3月份然后到24年10月份你在做什么对这个其实也是我忘了萧红之前有没有跟大家分享过一事就是她为什么叫我加入且用那句话说服我就是说要想不想做浏览器搜索引擎和大猿模型再做一次因为当时我觉得我们大家整体做了一个错误判断就是因为当时Monica已经有了一定量的用户量我们会觉得也许我们可能是当前世界上最懂用户怎么在浏览器里用AI的团队那么我们的一个直觉的惯性的外推就是说我们要不要做一款浏览器这个其实想法是比较有数据支撑的就刚才讲的就是比较理性的去看这个事因为万利卡当时已经是资金流是正向的且增长还不错但其实有一点很好玩就是如果你去看Chrome的那个插件商店的话你能看见所有别的产品的一个活跃和下载量因为它这个是一个很透明的一个生态然后当时你看整个插件生态里头的头两名分别是Adblock就是去广告的和Grammarly就是帮大家改那个语法的其实他们做了很多年对吧他们产品一定绝对没有问题非常polished的产品但他们最后都停留在大概50万左右这个量级50万其实确实是很大的对于一家创业公司来说但是如果你跟整体Chrome这个浏览器的日活的话Chrome的日活我记得能有20亿如果没有记错因为我也没有准备可能数据有错但我们当时觉得好像我们做到底也只能渗透到比如不到1%的Chrome用户因为插件真的是一个形态比较高阶的一个模式因为好多普通的用户其实甚至不知道Chrome能装短期插件所以我们当时第一直觉是也许我们被插件这个东西给约束住了而我们当时想的比较天真那我们想的是我们能不能跳出插件而变成一款独立的就是一个原生的浏览器在用户的电脑上同时这样的话能做一些别的事情就比如说我们可以做端测的模型当然这个其实就是一个坑待会会讲到然后我们当时就开始做浏览器大家都很兴奋然后从我加入之后马上就快马加鞭去开始搞一直其实从4月份我们搞到了大概9月份我们大家做事还挺快的我们其实内部已经早就有一个能用的一个浏览器产品然后这个我们其实内部摸了一圈之后意识到这事有问题怎么有问题这个有问题点非常好玩就是我们当时做了的当时张涛加入了吗加入了加入了还是几月份我是4月份加入涛哥应该在一两个月之后就加入了你给大家来介绍一下你们这几个co-founder对吧因为大家分不清楚你们这几个人对我觉得这是一个特别棒的一件事就是为什么我这些先开个玩笑就是为什么我觉得不当CEO很好因为虽然Manus的宣传片基本是我出镜为什么是你出镜因为要说英语然後這時候自然有人支持有人罵對吧他們看著宣傳片罵都說這蕭紅太壞了所以感謝蕭紅幫我擋了很多槍然後是這樣的就是整個NAS這個團隊或者說蝴蝶下面這家公司其實我們有6位合夥人我都不知道對其實主要就是平時在外面可能露臉稍微多一些的是張濤我們的CPU他會負責很多的無論是產品以及其實更多比如與外部的對接包括一些對外的宣講這事這是張濤之前是也是一個非常非常senior的連續創業者他經歷了什麼豌豆家神策後來光臨之外都做過然後這是他負責產品對他負責產品以及對外的這些合作然后是萧红Red和他是我们的CEO然后还有我们的CTO潘潘以及我们的一个负责我们的CMO慧洁他们三个其实是之前就一直在一起创业做过两三家公司了他们其实是Monica的原始的创始人这三位对然后再之后就是我还有我们的CEOCC他是一直负责比如说这个公司运营财务相关的同事所以其实我们有6位同事是合伙人对现在创业公司团队会变得更大是吗对因为他需要能力更负荷我觉得其实是这样的就是说首先现在可能有一个外界的一个观点好像说在AI时代团队会变得更小我们觉得这个东西首先你不应该作为一个指标或者说它应该是一个被动的指标就是我们绝对不会为了团队规模而进行任何的特殊的优化我们只会自然而然的去观察团队规模的变化但我觉得确实如你所说有一点就是现在你很难去分清各个能力项因为你很难做到完全正交像比如我们做agent这个行业的话其实你的research跟engineering是很深的耦合的而产品你又在同时引导你到底这个系统家伙该怎么做所以确实我们这6个人基本全都是连续创业者而且之前大家可能都扮演过不止一个岗位对所以我觉得这也是大家合作比较好的一个点但与此同时你又很难得能找到一些大家在自己领域做得很深却又能听得进去别人话的人就是我说我们是一个非常难得的团队因为我们6个人都是身心健康然后无不良嗜好且观念不极端你下的不良嗜好都是什么样的不良嗜好我开玩笑的至少我们对烟酒我们都不太沾你们的决策机制是什么样的我觉得这是我们一直在持续改进的一个事就是我觉得创业公司其实在不同阶段或者说你在解决不同的事的时候你需要不同的决策模式我们认为就虽然我们是连续创业者但其实我们也都不成熟最近在逐渐走向一个更理智的一个方式我们可能这样总结就是说你要把你的管理分成几种不同类型一种是专制的或者有英文词叫BDFL就是BenevolentDictatorforLife就是仁慈的终身独裁者这我们叫极权式的还有一种就是民主式的我们觉得如果你把你整个决策分为三个阶段的话可能叫GPAG就是Go你在定目标然后P就是你要定优先级PriorityA就是Alternatives就有不同的选项在决定这三个事的时候你要用不同的模式你在定這個goal的時候你應該是一個比較專制的模式就相當於是也許是比如rep作為CEO他應該就把大家的目標給定死而在决定priority的时候应该是一个专制加民主的一个决策形式比如可以首先有一个人能拍板但是大家能充分发挥自己的意见因为这会会涉及更多不同的专业expertise这些东西而在大家提供方案就这alternative的时候是一个充分民主的因为在这个阶段也许我们觉得就是可选方案的数量甚至比质量更重要因为很多时候如果你没有足够多的数量的话你的决策的空间其实一直是非最优的就好比你训练了一个模型但你的actionspace本身就有问题那你挑什么呢对吧所以我觉得这是一个混合的一个模式当然我觉得我们还都非常的业余最近也在不断学习这件事有什么样的事小宏会拍的吗有什么事情是他一个人会拍的吗会的我觉得就是小宏还是作为产品方面的最终的决策者我们觉得这是非常重要的一点就是我们包括我自己都比较相信的一件事就是与其悬而未决不如赶紧试试因为就是好多时候我们在做一个新的领域的时候其实第一你过往经验不一定有用第二点就是你现在想更多其实你没有额外的信息的输入对吧你仍然是基于你模型内部的参数化知识没有做RAG对吧你也没有一个检验的结果你在想太多你不如先把这事干了拿到你的reward再去做所以这个一直是我们的核心的一个指导的一个思想所以他做CEO和你做CEO的区别可能是你可能是技术驱动他可能是产品驱动的这将会导致你们公司的基因是一个产品驱动的基因是的但是我觉得小宏我非常尊敬他的就是他也充分尊重我就比如说对于一些技术方面的决策我也是可以做技术领域的BDFL就是我是可以当技术方面的独裁者这也是可以的所以整体是自上而下还是自下而上我觉得我们在逐渐从一个自上而下的体系尽量去变成自下而上因为随着团队的扩张和团队成员的质量的不断提升我们觉得自下而上会有更大的一个动力像之前的话比如我们在一个纯粹的快节奏的过程中你可能自上而下是一个更稳健的一个做法但现在我们在逐渐的变得更成熟我们刚才在聊4月到10月份你在做什么对对不起我都已经聊远了当时我们做了其实很多事情但是其实围绕的一个目的就是如何做一款AInative的浏览器就是所谓的AI原生浏览器当时做出来产品的形态其实跟现在的这个ChadwickAtlas还有像那个Dia已经很像了当时我们想的切入点有几个一就是说我们要训练一个端测的一个模型来让一些操作能够在用户的电脑上去完成既不产生API消耗同时也是充分尊重用户的隐私这里就埋了第一个很傻的坑就是拜托你做的是一款浏览器浏览器本身就是联网的你为什么要追求一个离线端测运行现在想起来可能有点傻第二点就是用户其实大部分时候不会关注你到底是离线的还是怎样的他们要求最好的效果而当时的话你其实在电脑上比如即使你只做苹果对AppleSilicon芯片你其实也就跑一个3B轴的模型就已经差不多是极限了那用户会拿你跟云端的旗舰模型去对比你的效果一定会差一些这是我想的第一点现在觉得很可笑第二点其实至今有很多人在做的事情就是想让AI接管用户的浏览器来完成一些自动化的工作流这个事我们当时也做了但是这就我刚才讲的为什么不对劲我可以展开讲一下它是我们觉得有几点吧可以细数一下第一点就是说如果你让AI接管用户的电脑的话你会发现一种很奇怪的使用体验就比如说我让AI去帮我在一个网页上完成填表那这个时候AI当他填了一个字段之后我一滚屏幕比如我想看看下面我其实打破了AI的observation这可能待会再解释吧就是agent去工作的一个流程那这时候agent可能会他把这网页又拉了回来那这个体验很奇怪就好比你有一个特别聪明的实习生但你好像非要把你跟这个实习生一起共用一个电脑这个体验就很怪就是两个人在一起抢一个系统而实际上我们现在用的所有的操作系统和软件本质上来说还是为一个人同时使用设计的所以这个体验就不好第二点我们发现什么样的任务真正是有价值的因为包括现在也有很多人在做所谓GUIagent就是用户界面自动控制的agent你会发现如果你让他去完成一些你通过简单几次点击就能完成的任务的话你觉得是很亏的因为你的迅速的决策其实比AI还要快而你即使让他比如很简单的帮我点一个外卖他可能每两步之间每两个两步之间的推理可能也会5秒10这样的一个时间当然现在会更快但你会觉得这好像没有产生多大的价值对吧我干更快这是我们常见的一个想法那AI真正有价值的应该是那种长任务就是longhorizontask就是它的范围很广它也许超过了我的能力或者说它要运行很长时间且运行很长时间或者多部几乎是一个必然的事因为这种任务我才不愿意做我才想交给AI去做但这时候会有一个问题因为你做的是一款原生的AI浏览器这时候AI其实是在你的电脑上运行虽然我不是说模型在你电脑但是它在持续操纵你的电脑那就很尴尬我不能把我的电脑盖上我电脑盖上之后我的电脑就休眠了就卡死了怎么样在AI在持续进行长程任务的时候我还要一直盯着它保证我电脑不睡眠吗我自己又不好干别的所以我觉得这两种体验我们用的时候都觉得非常的奇怪当然这只是一个模模糊糊觉得奇怪的一个点其实更大的一个问题是我们觉得团队没能回答一个核心考问就是到底做了这样一款原生的AI浏览器之后有什么是我们本来的Chrome加Monica做不到的吗后来想想好像没有完然后我们就开始逐渐变得理智我觉得这个过程也很重要当你做完一个产品的时候你会站在一个想说服自己的立场上即使我们都是中登连续创业者大家还是会有这种惯性就是我刚做完一个东西我起码自己还是偏心于自己一点的但是当你逐渐发现更多这些问题暴露出来之后你会更趋向于一个冷静的判断然后我们越想越觉得这事不对就是人类历史上浏览器的迁移其实有几次好像也就两次吧一次是从网警就Netscape到IE还有一次是从IE到Chrome这两次变革的根本原因其实还是你的渠道分发能力所决定的对吧IE是通过预装Chrome它可能稍微复杂一点就是一方面当时谷歌已经成为事实上大家的首页且同时IE遇见了一些非常严重的技术问题包括安全问题这是一个历史机遇但是如果我们现在在一个Chrome运行的已经很好且有Monica这样优秀的插件在的一个生态里头用户有多大的动力会愿意因为AI而把自己浏览器换成一个新的呢所以当时我们就开始思考这个问题但是心里还是没有最终下决定要怎么办直到又是后来这个老天帮忙我们有一天上网看那个推特发现我们很尊敬的一家美国创业公司叫做TheBrowserCompany他做的一款浏览器可能很多朋友用过叫做ArcArc是一款主打设计当然后来也会有一些主打设计感以及后来也有些AI功能的一个浏览器他很受一些小众的极客的喜欢比如他率先做了那种就是竖排的tab编栏然后他突然创始人JoshMiller说我决定discontinueArc了就是我不做Arc了这是一个很大的一个决定然后他说的原因一下就跟我们一下就共鸣了他说我做ARK这么久我甚至无法说服我的亲戚朋友从Chrome换成ARK所以我们觉得好吧他已经把我们心里的担忧黑纸白字的写出来了我们就觉得可能真的浏览器不适合创业公司去做颠覆做两边浏览器对吧对这是我的第二遍浏览器然后又得到了相同的结论当然可能之前我没有这么系统性的想过这个问题因为那时候还是像我刚才讲的凭爱好在往前冲的这样一个状态而这次我们其实很理智的想了一件事觉得这个不太对但是也是比较幸运当时看到一些别的就是一些苗头绝份挺大这个项目當時是這樣就是我們從我加入204年的4月瀏覽器其實到8月就可用了但是8月9月甚至一直快到10月的時候其實心裡還是有些波動所以真正停了就算是9月底吧應該是小宏說他當時就覺得瀏覽器有點不對但是不敢跟團隊說原因是因為你們都是被他用瀏覽器忽悠進團隊的所以覺得特別是你吧其實我覺得我跟張濤吧應該說對你和張濤對他肯定是這樣就是這也是小鵬比較好的一點我們就說就是他非常會考慮大家的一個感受而不是以藝術家的方式去解決一些問題對但是那段時間其實反過來看我覺得特別寶貴就是大家在一個很自然而然的形成共識的過程中逐漸逐漸放下了瀏覽器這件事處於一種幾乎無所事事的狀態當一群不太笨的人無所事事的時候就會產生很多很好的想法所以你們是你們是怎麼達成這個要放棄瀏覽器的共識的是他來找你說的嗎其实每个人心里都会提前感觉到一些不对我觉得一个最典型的一个点就是当你一款产品你觉得已经打磨好之后你突然觉得不是特别酷这个产品就如果我按今天的话我可以断言说如果一个产品做完你觉得不太酷就别发你都觉得不酷没人会觉得酷不是特别酷这个表达很艺术家对这是非常艺术家的一件事因为我此刻站在用户的立场上就是如果你本该最喜欢这个产品的人你都不觉得喜欢那你怎么能奢望用户会喜欢你呢对吧我不是以一个决策者的角度在说这件事我在站在用户的身份去想在一个新的时代把上一个时代产品重新做一遍你觉得是一个好的创业思路吗我覺得這個話不能非常一概而論的去判斷我覺得首先我有一句特別喜歡的一個名言叫做Foreverycomplexproblemthereisananswerthatissimple,clearandwrong就是說對任何一個複雜問題總能有一個簡單清晰但錯誤的回答我覺得我們很多時候都得過度總結一些事情所以我覺得這件事我不能二元的直接就去切分它但我覺得這確實是值得警醒的因為很多時候大家選擇這種做法是基於一種思維的惰性我覺得就是你在参考过去一个时代的成功的因素并想用一种新的技术去把它再做一遍但其实你要考虑到环境的一个外部环境的一个变化所以我觉得这不能二元的去切分你们放下了AI浏览器的产品但是其他团队还有在探索的你觉得AI浏览器的未来会怎么样我觉得我不能替别的软件做主而且我不是说因为我们放弃这事就一定不对是因为我们团队自己达成的共识是我们可能做这个东西的收益不是特别的明显因为你想如果我们选择了另一种心态就是说它好吧这个产品不是特别酷但既然已经做完了我们就发出来看看但这时候会把你带入到一个比较不好的漩涡中就是当你发了一款产品之后一个负责任的团队会持续维护它但这会带来很大的机会成本我们可能因为要不断进入一种自证的循环中去措施明明更有价值的新的机会而如果有一个团队现在已经把浏览器AI浏览器我说做到一个他们已经比较满意的一个程度的话我觉得你进入一个自证的循环应该是对的因为你可能今天是一款所谓的AI浏览器但你沿着你自己选择这条路你也许会发展出一个完全不一样的产品形态没人知道会怎么样所以我觉得我不能替别人做这个决定你看小洪說服你加入說的是在一個產品裡把瀏覽器搜索引擎和大魚塭模型全部重做一次然後到了24年的9月10月你們決定放棄瀏覽器這個項目你當時心裡有波動嗎你的真實想法是怎樣你會覺得被他騙了嗎我觉得其实不会就我刚才讲到一点就是他只是最后用这句话把我说服我加入但我肯定不会只因为一句话就被说服对吧所以我觉得我非常珍惜的一段还是首先我们通过Monica真正的拿到了一张理智的AI应用的传票这是非常重要的一点就是Monica我觉得这个产品的意义是非常非常大的第一它是一个正向先进流的产品这个词我可能会说很多很多遍一个团队如果有一个正向现金流的产品你在做第二个曲线的决策的时候你会变得非常的理智或者说你既大胆也理智我们之所以后面赶有豪赌很多的东西是因为我们知道monica一直在帮我们赚钱所以我们会一个非常客观又大胆的方式去做决策第二点就是Monica真的让我们知道用户在如何用AI让我们理解了context的重要性或者说Monica这款产品其实跟Chatbot最大区别是什么就是如果你在用Chatbot的话你一定要做的一件事是把你要看的网页的内容复制粘贴进Chatbot的对话框中而Monica它本身就是一个在主动的去观测你的context对吧你只要在用浏览器浏览器插件就在看着它其实就把context的传递变得非常通畅这其实给我们很大的启发以及更具体就是我们知道一些用户的整体的行为习惯当然我们会非常尊重用户的隐私我们不会去窥探你具体的这个session但是其实通过一些宏观的这个透明的统计数据能看出很多pattern很多模式对不起为什么这些产品都是M开头还包括你之前的公司对这个我觉得是很好玩就是我第一个产品叫猛瓦连瓦器NemusM开头第二款产品叫MaggieM开头然后MonicaM开头Manus也是M开头然后我觉得这完全就是一个巧合可能M开头的产品运气都不会太差对當然Manus可能有一點私心因為名字是我起的怎麼取的這個名字這個名字其實當時我們糾結過很多名字但是後來是真正讓我們想通這件事的一個點是我們想明白了自己該做什麼就是當時的話其實做瀏覽器的時候我們已經一心有一個感覺就是模型在解決的是智力但是再強的智能你也不能把環境給內化掉所以你一定是需要一個手來去觸及到現實世界中否則你再強的思維你也只是一個理論物理學家或者說甚至你可以說是一個剛中之腦所以我們想做的是讓智能真正去觸及現實世界所以讓我想到了其實是MIT的校訓叫MensetMenis是一個拉丁語翻譯成中文一個叫心與手或者心手合一我們覺得別人都已經在心或者說心智這件事上做了很遠的探索所有的機動模型公司使命如此而我們要做的其實是那个手所以manus就是拉丁语的手的意思说说你们在那段闲散的无所事事的时间里怎么产生manus这个idea对这个其实是一个到10月对吧对其实是一个渐进的过程然后我觉得又一次是上天赏饭吃就是当时大家就是还在正常的运营monicon同时也会做一些别的实验但是当时我们会发现那个阶段下已经有一些AI产品受欢迎尤其是coding领域的那时候像那个cursorwindsurf包括后来的devin其实有很多用户然后我们作为工程师我们肯定会用对吧然后我们发现其实公司里和很多非工程师都在用Cursor这个就让我们很意外因为Cursor它的产品形态仍然是一个IDE就是集成式开发环境就是写代码的人才用的一个东西让我们发现比如公司的运营同事他居然在用Cursor去写博客我们的数据分析同事在用Cursor进行数据分析和可视化然后这个就让我们非常意外就是因为它本来是一个最专业的产品形态却有很多它非原始设定的目标用户群在用然后我们就会去站在他们身后去观察他们你们到底在怎么用cursor很好玩就是因为左边都是代码右边是他的那个跟AI聊天的窗口很多这些同事他们也不会写代码他们根本不看左边的东西他们就是在不断的跟AI去交流让他去把一个事情完成AI通过编程的方式以编程或者代码为媒介去完成一些非编码任务我们觉得这个其实是非常重要的一点就是让我们意识到其实编程不是一个垂直能力编程其实是一个通用能力它是解决通用任务的一个媒介那这时候我们要想的就是cursor这个形态其实对他们来说不是最优的有几点一个是我们刚才做浏览器这个尝试的时候学到的就是说它不应该跑在你的电脑上要不然它不能解放你的在长程任务中的注意力问题对吧其实老说attentionisallyouneed我们希望解脱用户的attention让模型能在对不起让agent在云端去进行去异步的去执行有异步之后其实能还带来另外一件事就是并发就是如果你能让很多不同的任务在同时去跑的话这才是真正的成倍提升你的效率所以这是第一点我们认为Cursor这种产品它应该换一种产品形态跑在云上第二点就是代码这件事应该作为一个工具而不是它一个主要的呈现因为对于很多人来说看见代码是有一点天然的紧张感的对吧尤其它跑在你的电脑上Cursor会经常问你一些权限就是说我觉得我想安装这个软件我能不能帮你把这个文件删掉其实这个对于很多用户来说你看不懂技术名词之后你唯一的选择就是好接受接受接受但这很恐怖我们有一个朋友他当时用cursor他也不懂技术就瞎用结果cursor把他的网卡驱动给卸了电脑上不了网对所以我们觉得不行应该就是用同样技术但把技术复杂度包装起来然后第三点就是这个产品面向的人是谁其实不应该是专业的工程师专业工程师的这个领域的卷度已经几乎饱和它是一个绝对的主航道所以我们应该面向的用户按我们的话说叫Prosumer或者说所有的脑力工作者但你却不是程序员因此我们就觉得应该改变一种产品形态然后很幸运的是当时在浏览器中已经做了很多的技术积累比如说我们对Chromium内核非常了解然后我们自己也做了整套AgentX的这个调度系统那好对我们来说好像这个事也没有那么难我们要做的就是把整体AI浏览器这个东西搬到云上所以当时内部立了一个项然后也是我瞎拍脑袋起了一个项目代码叫Airbnb是什么意思呢叫Browserinbrowserintheair就是浏览器里面运行的浏览器其实且跑在云上对所以就是也比较幸运就是我们并没有浪费太多当时做浏览器期间的技术积累所以当时从9月底10月开始正式搞其实也就6个月就把Manus做出来了而且对实际上Manus不是3月做完的Manus其实1月就做完了从几月开始搞我们从九月底开始开始搞然后其实到二五年的一月中其实Manus基本已经做完了但当时我是决定说我们不该马上就发为什么因为是这样就是当时我们能拿到最好的模型是Cloud3.5SonicV2就是Cloud3.5的第二次迭代它初步具备了一些Agentic能力但是它其实会有一些问题比如说大家可能从技术角度来讲吧就是说它缺乏一个真正这个reasoning能力然后另外一点就是我当时也听到了一些rumor就是他们应该在两个月后会有一次模型发布当然我也不知道最后到3.7会有多好但是我觉得我们最好能把我们发布的时间点跟下一次模型迭代对齐这样的话其实我们的产品发布的一瞬间其实能享受到最大的一个代际的提升模型的溢出对所以就是我们应该再多花一个半月的时间去打磨这款产品然后跟下一次模型的迭代对齐再一起发布那你们从放弃浏览器那个项目到享受minusidea中间很短时间其实你可以说短也不短我觉得当时真正意义上可以堪称无所事事的时间有两周半这么短的很短是啊是啊其实那段时间不能无所事事就是我们都很积极的做很多不同的实验那你那时候焦虑吗我不焦虑一点不焦虑这就是为什么我们说有一款正向现金流的产品很重要当时我们想法就是大家想想虽然可能烧了一些钱烧了多少钱做那个浏览器论器其实还好因为我们当时投入的人力可能也就十几个人然后除了人力以外其实没有太多别的成本Monica当时能给你赚多少钱Monica其实在Manus上线之后我们的投入可能少了些但是现在可能又抓起来了但当时Monica已经有接近12个million就120万美金的AR而且它是一个盈利的产品但现在跟Manus相比120万美金AR不算什么但是那个时候作为一款AR产品来说我觉得是很棒的一个成绩了这是外部AR吗当然不是外部我们非常看重这点就是我们一直在强调什么是ARAR是MR乘以12MR是什么东西你不能把你一个月内获得的年付算在当月之内你必须得除到每个月然后所以我们内部看AR或者MR我们就一个口径就是你看你stripe上面给你的MR数据以及你移动端的MR数据要不然的话你有太多种方法去把这个MR这个数字造的很大但这个就是你自己骗自己然后现在刚才我说就是这也是一种benchmark对吧就是对于产品来说这可能是你要优化的一个指标对于模型来说你要选一些benchmark作为你优化的方向这两个都会共同决定你的taste所以我觉得这个是非常重要一点我们非常抵制ViveAR这个事Minus有多少AR现在Minus现在1个亿已经超过了1美金然后是这样我们之前的话还有一种比较复合的收费模式就是说你除了订阅以外你还会有topup就是你可以额外的去增加一些单次的充值但是我们觉得这样的话其实给用户确实有很大的灵活度但其实也给用户造成很多困扰所以我们现在不断去简化这些定价这个方案所以目前的话我们基本就是你可以很简单的理解为你有一个免费的方案以及一个你可以自由选择订阅金额的一个方案默认是40美金一个月你從3月到9月加入這家公司以後這半年你對它的感受有什麼變化嗎我觉得有一些变化首先就是它跟我之前所在的创业模式特别不一样之前可能是一种非常比较非常的就较为慢节奏且谨慎的一个状态因为一旦你要做一些技术层面的技术层面的决定或者读注的话你会比较慎重但是如果你是家完全以产品驱动的话你会发现整体的节奏会快特别多甚至一开始说实话我是有些不适应的我会觉得好多事为什么这么的草率为什么产品会更快产品一定更快因为产品的话你的迭代的成本首先会更低一点因为刚才讲首先你没有垂直整合模型这个问题第二点就是你如果一切都以敏捷开发的话甚至很多时候你可以说我先发了再看看有没有什么问题我再修但是你知道如果你自己训过模型你知道在进行数据清洗的时候那个代码你最好别让AI写因为你写好那个数据你按下回车之后你可能会有一个几十万美金的trainingrun你的心理压力程度是不一样的就是经常你要做技术或者模型层面的工作的时候你很多做的事情是有后效性的就是你做了这件事你做完之后很难被轻易的纠正或者说它就会在历史长河中留下一些问题但产品的话你的掉头会非常快所以我觉得就是这个团队很好的践行了这一点然后我可能花了一两个月时间才逐渐适应很多研究員或者技術風格的人不喜歡這種方式他就會覺得他的技術文化比較差他覺得太快了他覺得沒有真正的技術bet對你來說沒有這種問題嗎我覺得是這樣就是技術bet這個東西是聽起來非常好的一件事如果你是家硬科技公司你該做這個bet因為這可能是你最終的差異化所在但首先如果你是一家產品公司那麼你就不該有bet這個概念或者說你會進行一些輕量級的可逆的bet大家不是經常說什麼雙向門決策單向門決策嗎如果你作为一家产品公司你还在天天想着你要不要bet什么东西那我觉得你们是一个处于一个比较拧巴的一个状态对这个还是要调整一下所以你们没有bet其实这么说吧就是我们所有的bet都不会有那么重的bet没有技术bet技术bet也有但是所有的技术bet都不会是那种比如说我需要两个月的时间去看到下一个预训链拆空了之后我再决定怎么样就是叫什么这个皇国兴衰在此一役这种事不会有的像比如说一些模型公司的话我觉得你还是要有一些bet的这就是我觉得两种mindset的不同那你们的bet是什么呢产品形态一个产品形态其实你可以说一开始不逊模型这件事也是一个bet因为那时候我们开始做这个决定可能现在大家逐渐也许是在我到处游说之下大家接受了这件事但是那个时候其实很多人还是不太看好所谓的contextengineering这件事的尤其是我们当时开始做对壳这个词其实我挺喜欢的因为壳这个词它严格上来说你可以从操作系统概念叫shellshell可不是一个低技术门槛的事而且壳跟壳亦有高低这我可以举一个比喻就是如果monica它明显是一个套壳它其实是像生鱼片对就是说它生鱼片的好坏基本完全取决于原材料就是你海里捞出那个鱼怎么样你几乎是一个煤炭加工的一个状态就给用户对所以你的价值增加是很浅的但是像manus这种东西它仍然是一个壳但是它不是生鱼片它也许是什么水煮鱼或者什么因为我海鲜锅没有吃过这可能不知道它是不是很复杂的一个东西什么四川水煮鱼这种东西agent与chatbot的最大区别是什么就是chatbot这整个系统里只有两个元素人用户以及模型你们两个之间以一个往复的形式去交互但其实agent有一个第三个元素是环境或者叫runtime这个东西其实很重的一个事所以你agent的这个壳可能跟插宝相比完全就不是一个厚度的壳它是地壳一样厚的一个壳所以曼德斯做出来最难的是什么样Linus我觉得有几个非常难的点第一个就是你启动越早你越难首先你能相信Linus这个东西能够做出来这个是我认为第一个很难的事情第一个idea是什么第一个idea其实就是从浏览器的自动化放上一端去这是你想的吗这个我觉得是大家都会看到的一个点我刚才讲的就大家一起商量但是我觉得我们看到Cursor之后其实Cursor帮我们把很多事情理清了所以我们一直都非常尊重且欣赏Cursor这个公司它给我们很多的idea然后我觉得这个就是第一个点就是其实好多人说造出原子弹没那么难但知道原子弹能被造出来是最难的而当时我们相对我们定义了所谓通用agent这个词而在这个时候我们觉得首先我们能够相信NAS能造出来这就是一个bet因为他要我们有没有举公司之力吧当时也没有那么多人在这个项目那时候非常少我们一开始从五个人开始做实验然后每遇见一点好的这个苗头我们就会从莫妮卡里面调动更多的同学进来所以莫妮卡当时有多少人运营Monica当时团队应该有几十个人几十个人然后你们这边五个大概就是这个架构对吧对而且当时我们还分两边就是我跟涛哥我们在北京然后小宏就是Monica团队主要在武汉对所以当时北京这边基本就是你可以理解成创新业务事业部这样的一个寻找第二曲线对寻找第二曲线对所以就是一个渐进加码的过程所以你看这也是一个比较理智的一个做法对吧就没有那种就是就都不做了全都去搞新的对逐步去做我觉得这是第一个bet就是说Linus这种产品形态的东西是能够被制造的这是第一个bet然后第二点其实开始做之后我们也有确实犹豫过就是要不要开始去模型因为当时你能拿到机座模型硬件真的是很难受的就是Crop3.5SoundedVR也许算是一个里程碑但是其实你按今天的眼光看它的稳定性可靠性和它的泛化性其实还差非常多而且直到今天其实很多模型都没有解决的一个问题就是怎么说呢现在大部分模型我认为仍然是为checkout场景而进行后训练的这还存在一个alignment问题待会可能会进一步去讲这个问题所以当时的遇见了一个客观的挑战就是我们要不要通过进行自己做模型这件事来弥补这个模型的不足但是我是觉得我们又是在一个技术快速上升的一个阶段因为你刚刚看到Cloud3.5V1跟V2之间的进步有多大所以我觉得我不该bet这件事不该bet在这个方向上而应该bet另外一件事是一个很轻量的bet就是那时候没有contextengineer这个词我们应该充分相信做agent框架是能够带来很大的提升的对这是第二个当时做的bet然后其实第三个bet是什么呢就是我们已经看见Cursor获得了很大的成功且很多人其实心里也会有一种想法就是说我们是不是该做和Cursor类似的事对但这个东西就是我们觉得做中国版Cursor很多人可能现在也在做这个事情但是这当时就至少我心里还是比较坚持的因为可能一直以来我创业获得的正反馈都来自于创新所以我觉得这还是挺开心的就是我们应该去做一些有差异化的事情而服务好那些prosumer而不是跟他们在一起去卷对反正这是当时做的三个判断然后比较幸运好像都对了这个判断好像很多都是我不做什么对是的我觉得不做思考很长时间决定我不做什么我覺得不做什麼真的特別重要因為你說AI我覺得最大的一點就是它是讓創業公司的產能變得很大所以好像以前比如我們之前移動後來往內創業的時間可能大家沒有那種我不做什麼的自由吧就是我在做某一個領域我要做一個新的領域或者業務的時候我受很多的约束所以外部的因素会阻止你一些过于天马行空的想法但AI时代大家好像眼中的机会很多AI又充分解放了生产力所以我觉得每天都要回答就是不做什么就Manus到现在我觉得都是一款相对克制的产品然后像有一些别的agent公司他可能会觉得我增加很多不同的tool就是给AI给agent增加很多不同的工具而我们每个月都在想我能删掉什么所以仍然是不做什么是我们始终要想的一个命题即使是通用agentminus是不是一个很重要的点是在那个时候没有做一个中国版的谁谁谁minus那时候是没有一个对标的是的我觉得至少我自己的几次创业我从来没有想过对标这个事为什么你们要做一个通用的agent对这也是一个特别好的问题就是按照传统的创业的理念大家可能应该是这样选中一个nichemarket或者找进一个垂直领域扎进去做深这可能是更正常的一个做法但实际上我是有几个不同角度的观察既有技术又有产品形态的思考首先一点是技术层面就是我上一次创业其实就经历了一种专有模型被一个大一统模型吃掉的这样一个体验所以现在这套技术体系之下即使你在做一个垂直的agent你背后用的是什么无非还是通用基座你可以做一些specialization但是你可能会遇见模型探索这些事待会可以再讲另外一方面Manus本质上是什么它其实是一个通用的模型加上一个计算机因为每个Manus的session就每个绘画背后都会有一个单独隔离的虚拟机纱盒虚拟机这个东西学名叫做图灵机不是有一次叫图灵晚辈吗就是理论上来说它是能够去模拟或者运行任何算法的首先这样我们就看到Manus底层的两个技术供给其实是通用的那么走垂直其实是在上面加约数这是第一个技术判断第二点就是我们一开始就像做monica一样我们好像没有做特别大的使用场景上的bet而是一种类似于达尔文的心态在观察就是说我如果我给用户提供的是一套通用的技术架构的话我获得的优势是什么就是用户可以按他的想象力去使用这个产品同时我们作为创建这个产品的人我们的使命是通过观察用户的整体的collective集体的一个行为模式去捕获到头部的场景再让我们的产品团队去做最后一公里的优化就像我们一开始其实拿出来之后我们其实在宣传中和我们所有网页的case中都是天南海北的什么类型的东西都有我们不要把用户先提前做一个引导让他用什么逐渐逐渐我们发现好像用户很喜欢做slides做PPT用户很喜欢做网页用户很喜欢做批量的文件处理然后我们发现这些可能是值得我们的产品团队介入去做一些定向优化的所以Nandus是一个完全由用户所塑造的一个产品且同时又保留了极强的通用能力而通用能力的话就带来我说这个产品方面的第二个点就是说我认为很多能力最后会收敛比如说当时的话deepresearch就深度研究这个领域可能还比较新的一个概念但实际上你看现在所有不同产品的深度研究的能力基本比较收敛了尤其像比如Gemini也有deepresearchOpen也有deepresearch但这当然确实还会有些差异但这个能力已经逐渐的所有产品中都具备了这就让我想起以前做搜索引擎都是一个体验或者这么说你为什么用Google而不是用币硬如果你每天只查那些最头部的那些查询词的话你发现你几乎用哪一个主流的搜索引擎它的第一页结果都是质量接近的为什么我还用Google呢因为Google永远能在你的长尾query中给你惊喜这样解决的一个问题是什么就是说如果你能够让这些常委用户获得满意他其实能够更容易的获得我们叫做AHAmoment就好像这个东西只有在这才能被解决我举个例子其实当时有一个分子生物学家他用Manus就他觉得非常的惊喜是什么呢他想用deepresearch这个功能但是他的这个实验仪器导出的是一个非常小众的一个数据格式他用别的产品是做不了这件事的而他把这个文件上传给Manus之后Manus说这是一个很奇怪的文件格式我先去研究一下研究好之后Manus自己去Github去下载了一个开源项目来解析了这个数据格式然后再继续去完成分析所以就是这种常委的没有人会专门为他做的场景有一款通用产品能够解决这个用户会获得极大的一个满足感而且这些常委不等于低频因为这是这个人他每天的工作所以对于单个人来说这是一个recurring持续的一个任务这是在产品层面的第二点产品层面第三点其实也解决了一个频次问题就好比你如果要做一个垂直的agent你在用户心中你建立心智其实比较难的讲真比如说如果你的土币还好因为土币可能是很多人每天的事情但是就像你在每一个hackathon都会遇见一个团队要做一个旅行规划agent一样旅行规划这东西其实对于普通老百姓来说可能一年就两三次三四次频次太低对你让用户记住你是很难很难的一个事情对而如果你做一个通用的一个产品的话其实你有更大的概率来服务用户的方方面面这样的话你能有更好的一个评测但同时你要做通用的agent你有不同的技术方案的选择比如说有一些产品它可能也追求通用但实际上它可能只是把不同的功能放在了同一个界面下它本质是多个产品只不过共享一个域名而已而Manus我们会非常坚持的一件事就是说Manus是一个单独的unified一个统一的agent框架所以用户在Manus中进行不同任务的时候他的上下文他的记忆是可以自由流转的所以我们能做到的事情就是跟垂直的功能相比我们永远能多做一步我举个例子就是世界上其实有很多能做网页的AI的agent或者说websitebuilder就是网页构建器但实际上其实对于AI来说做一个好看的网页没有那么难真正难的是如何让这个网页它的内容言而有物那这样其实Manus他可以同时先完成deepresearch然后再基于获得的research去做出一个网页然后与此同时这个网页还有真正的实际的后台有数据库用户如果这个用户把他网页分享到互联网上有更多别人在用它这个网页的话Manus还能再继续在一个session内帮你去分析这个网页的流量甚至能帮你做出一个slide做出一个PPT再给你发邮件发给你的潜在的投资人所以其实Manus能够做到的是所有的垂直场景之后再多加一步且能产生一个内部的网络效应所以我觉得这是通用所带来的很重要的一个点它的边界会在哪里我觉得它的边界其实取决于几个不同的维度首先刚才讲到就是agent这个系统中它分为三个元素用户环境和模型其实三个东西都有边界首先我先不说用户用户边界最有趣的第一点是环境环境我觉得是agent最重要的一个东西因为环境里头其实决定了agent跟外界所能接触的边界比如现在Manus选择了一个最为通用的环境就是一台虚拟机一台Ubuntu系统但这个话我们现在在做很多的投入我们有一个内部的虚拟化团队这个可能有些朋友误区就是好像Manus给每一个用户分配了一台电脑其实不是的哪一个Manus绘画背后是一个独立的一次性的沙盒所以其实我们的Sandboxscaling是非常大的甚至有时候我们内部开玩笑说Manus其实是一款个人云计算产品因为你真的是让不会编程的人也能去操作云计算并享受云计算带来的算力并用在日常生活中但这块其实会有很多的边界要解决比如说如何scale的更多的沙盒其实我们最近也不是最近几个月前我们推出一个功能叫wideresearch它不是深度研究而是广域研究比如说你在别的AI中去尝试完成这样的任务比如说帮我去找一找YC过去一批中所有AI营销公司的CEO并把他的email找到发给我你发现你给manus之外的任何AI他们都会失败因为既受限于contextwindow也受限于模型本身的一些懒惰这些问题可能待会聊到他们可能在找比如10个15个CEO之后质量会急剧下降然后模型会放弃但是因为我们能够去不断scaleout就是不仅是scaleup而scaleout这样的话Manus其实能说这个任务很难我可能要找10多个我现在能启动10多个sandbox然后去并行去完成这件事最后再进行汇总所以其实我们在这个虚拟化这个边界其实扩宽这是第一层同时我们也在不断地去增加能够使用的虚拟机的形态比如一开始我们只是有一个基于Linux内核的一个虚拟机但是我们就没有选择像用Docker这样的一种就container就容器技术因为容器技术它其实基于Linuxkernel的叫Cgroup的技术我们认为如果你选择这条路它确实更简单但是它会绑定于Linux系统而很多其实专业的软件只在Windows生态里有所以其实我们又选择了比较中的一条路就是我们其实基于Firecracker它一个轻量级但是是全虚拟化去做所以现在Manas其实同时还能用Windows所以这块也是我们在不断推的一个点解与此同时就是除了functioncalling这一种形式就是模型跟外界沟通可能常见的方式可能叫工具调用但实际上如果你给了模型一个完整的虚拟机的话其实虚拟机内的预装软件也是很有趣的一件事就好比如果你的windows系统自带了很多专业软件的话其实你的可选的范围你的动作空间又会变得更广所以实际上我们还自己你可以说我们在维护一个专门为agent设计的Linux发行版本里头内部有很多只有Manus才知道怎么用的一些工具来完成一些事情这是我们在环境这方面在探索的东西在模型方面其实这时候也可以讲一讲其实我们虽然不自己去模型但我们一直在作为无形的大手在干预着这个事这个很好玩就因为当你有足够的影响力之后其实你的一些需求其实是能够影响模型的发展的这也是我们最近获得非常大正反馈的一件事就是因为manus的token消耗量巨大所以我们自然是几乎所有模型厂商的头几名的客户所以我们跟比如跟googledemand都有很深的合作你们token消耗量有多大这个数据我可能不太好透露但可以讲的一点就是我们在各个模型厂商基本应该都是top2到top5的消耗量全球万万的你们怎么cover这个成本这就是为什么要做一款能够赚钱的产品用户的钱变成了token的消耗量这个你们现在就可以cover吗我们现在几乎能cover而且这个在优化的曲线其实非常快其实今年三月发布的时候我们确实是负的利润现在我们很快就要打平甚至打正了这么快就打正了是的这我觉得就是技术演进带来一点同时你也不能就是被动的接受你一定要去影响模型厂商的决策这就回到我刚才要讲的这个事这个脱光消耗量大概是XBOT的多少倍这个chipout你看怎么算我可以给你一个这样一个对比就因为以前我们做过monica大家在做chipout你一定会进行一个估价估价就是你得基于inputtoken跟outputtoken的成本去计算这两个差很多的因为对于transformer结构来说你的input其实是prefilling这是可以定型计算的它是一个computebound但是你在输出token它是decoding这是是这个bandwidth去bound它的定价是不一样的一般来说你的outputtoken会比inputtoken贵很多所以在插报进行这个价格的估算一般按3比1就是3是input1是output但其实在manus这样的agent中input跟output的比例是10比1到10比1根据你的tasktype去对比所以其实你可以想象一下output的长度如果差不多的话那input的长度就是你能估出来的一个所以你可以说是一个几十倍甚至上百倍的一个通用消耗量的差距而且我们其实一直比较贯彻的一点就是我们不会为了成本或者速度去缩减token的消耗量我们一定是以质量为先的所以甚至我们以消耗更多的token为荣涛哥有一个梦想就是他想造一个7×24小时烧token的机器对所以就是我们讲就是消耗很多token之后你会获得很大的影响力同时因为就包括我在那团队其实很多人以前都是做过模型的对就是我们知道这个东西该怎么改进但我们自己不弄我们把这个东西能不能外包出去了就比如说我们跟googledemand有很深的合作我们就可以直接提需求不仅提需求我们会帮他们构建evaluation甚至包括一些功能比如说我记得是两个月前吧那个Gemini新出了一个叫做可控的parallelfunctioncalling那一个定义和这proposal和它的实现schema是我写的所以就是我们能够让它去帮我们实现一些东西这里其实有很多要去探索的东西比如说我刚才提到了一嘴就是我认为现在大部分的模型仍然是为插报去做的alignment这是一个很有趣的一个观察大家知道其实从GPT-3到InstructGPT它发生了一个很大的变化不是在基座而是在于你的后训练是怎么去让决定这个模型的输出的风格或者说形态的比如说如果你用最早的GP3的API你问他说北京天气如何他其实不是回答你而是他在尝试补全甚至复读比如你问他北京天气怎么样他会说东京天气怎么样纽约天气怎么样他其实在模仿你的这样一个pattern但不再回答你而InstructGP和后来ChartGP他其实通过后训练所实现的是让模型知道我应该去回答这个问题但这里你看存在插报的会存在一个天然的问题叫做无论用户的问题有多么的复杂他都会倾向于在一轮回答中回答完毕但这个其实跟agent的一个基础假设是不一样的agent基础假设其实就是顺语的那篇paperreact我每次都跟别人讲都是这个我觉得这个抽象非常好就是agent做的事情就是在一个一个循环中基于用户的输入或者来自环境的一个观察叫做observation去在你的动作空间中选择最有可能的下一个action去选择下一个动作所以很明显对于agent来说接到用户的一个复杂输入之后它正确的做法不是急于在一轮内回答全部而是很有耐心的逐步尝试且基于上一步的观测去调整自己的方案去预测下一步所以如果你仔细去想的话其实agent的攻框跟chatbot是不align的而这里头会带来很多细节问题比如说很多现在的模型会有一个耐心问题对就是为什么会说模型比如回答问题尤其你强行用chart模型完成长链路的longhorizon的这个agent任务之后你发现模型干的事的质量越来越低越来越低越来越低一定程度上来说就是缺乏这样一个真正在现实的agenttrajectory就是agent轨迹中进行训练的过程或者说它的datamixture就是它的训练用的这个数据混合中是有agent这样的task但实际上它被dominate它的datamixture其实还是为chipout而设计的数据模型的学习能力是极强的你数据的distribution其实会影响模型的一个风格就比如说模型在输出到一定长度或者说看见它的输入的token长度到某一范围之内它会感受到一种无形的叫contextpressure就是上下文压力它会影响你输出下一个token为EOS的概率EOS就是endofsequencetoken就是模型当它认为该输出token的时候其实整个这个任务就结束了其实模型是能感觉到这种压力的所以这块其实是一个很不好的事情它让我们用拆爆的模型为拆爆设计的模型在agent任务工作的时候它会非常的着急一个常见的现象就是你会发现他到后面开始疯狂用玻璃碰就写那个很总结是一个关键点一个关键点一个关键点写短写短对这是一个很常见的事另外一点就是这些模型它其实没有为现代contextengineering做过一些专门的训练我举个例子就刚才我提了一嘴说二三年初我就一直到处忽悠longcontext但我现在有新的想法我现在有一个暴论我觉得20k以上的context就不重要了为什么因为比起更长的context我觉得更重要的应该是让模型具备compassionawareness就是说对压缩这件事的意识对压缩这件事的意识对这个怎么解释就是如果你让你的context你的上下文长度无限单调递增的话即使有kvcache存在它是能让你的延迟和成本较低但其实它仍然是即使你有一些efficienttension你也是一个增长的过程但这是不值得的其实更重要的应该是什么让模型知道说我现在context已经很长了我看我能不能把我一些context中的信息去offload就是把它外化到比如文件系统中就像我有一部分记忆就像人一样我这个东西不用脑子里一直装着人的记忆其实挺差的就是我的工作内存很差但是我会知道这个事我可以整理成一个文档放在我的notion里头我下次我知道我该什么时候去拿回来或者说我知道我过去做了很多的事情但是其实有一段东西它不重要它只是一个过程这时候我可以进行一个压缩叫做compassion或者叫compression就是说我把我中间的一段历史变成一个很紧凑的表达但是模型要能够明白说这个东西不是凭空消失了它是被压缩了而让模型意识到被压缩这件事是需要专门训练的这个是为插爆训练的模型其实没有很好的一个训练过的点另外其实还有刚才讲到的就是像Cloud3.5v2的时候它还没有很强的这个reasoning能力但reasoning这个词是非常大的一个最怎么说最表面的reasoning现象可能是像OC类这种reasoningmodel就是说当用户问一个问题之后它在输出最终答案之前会有很长的这个internal的longCOT就是内部的长思维链但这个东西你如果盲目的用于agent的话你会发现一些问题比如说你会发现它的instructionfollowing能力就是它遵循指令的能力其实下降的另外一点就是它其实出现幻觉和幻觉攻击调用的概率是提升的所以如果你直接把一个为了就是解决比如说竞赛编程或者数学而设计的reasoningmodel平移到agent场景下之后你会发现其实效果是下降的那这时候我们应该去改变这块的训练的模式比如说你可能更关注一种叫interleavedthinking就是交错式思考刚才讲的就是按照顺序的react来说就是你获得一个observation之后你不要立即着急去预测下一个action而是在这块进行一个中间但是且相对较为短暂的reasoning去想想我之前做了这些事情那下一步我该做什么我该做这个是类似这样的一个结构而不是说像比如说你让O系列模型去解决一个数学体那样就是你用户给了一个很短的一个问题他哗一下想了几千个token全在脑内这是不对的这是会在Agent场景下产生一些负面效果的但是比较不幸的就是这个事其实可能说起来简单但是大家做的说实话都不是特别好就是目前你说模型公司做的不好做的不是特别好对这时候还有很大的改进空间应该是对所以我也很期待就是这个有接下来的进展对然后比较幸运的就是因为我们影响力会比较大所以就是我可以天天给这模型公司洗脑这个很重要然后他们也确实很积极地在改进这些事所以其实包括那针对三出来之后没很兴奋对吧他们能以非常快的节奏去把我们之前遇见的问题实实在在的变成模型而又很开心的是头部旗舰模型的成果会逐渐影响所有开源的模型大家也会跟进所以我很开心的一点就是好像全世界都在帮我们一起去模型但我们却没有自己掏出很多钱去砸进去而是说我们让用户使用了一个很好的产品用户付了我们的钱我们为用户创造了价值同时我们通过这个获得了影响力来影响别人来帮我们训练很好的模型这样它其实节省了很多我们内部的research的带宽我们可以真正去投入一些非共识或者小众的事情去做你们沟通最多的模型厂商是谁这个其实都是非常非常均匀的因为我觉得现在不同的模型厂商之间其实是比较分化的我不是说他们这个叫什么技术路线的分化应该说他们关注的点是很分化的这可能也是一个被动的选择就比如说你要讨论真正的AgenticCoding我不是说竞赛编程就是这种偏现实工程的多轮的编程确实Anthropic还是最好的包括其实Opus4.5我觉得可能很多人对它有点低估了这个我觉得是一个非常大的一眼见所以就是Anthropic他们在Coding方面是非常领先的然后像Gemini很明显它的多模态领域尤其多模态的理解就多模态输入方面是非常强的是一个断层级别的强而且Google又有一些比较独有的资源比如说通过Gemini可能是你唯一的能够使用到Google的索引的方式与此同时如果你想让agent具备比如视频理解能力尤其是YouTube的视频的理解的能力的话你一定要选择Gemini而OpenAI的话它在reasoning或者说这种偏纯推理方面的reasoning投入非常大的它是有比较强的一个领先而有时候你要刷榜的话其实OpenAI的模型是一个很好的选择然后其实别的这些像什么Grok还有一些开模型都各有特色所以我觉得现在对我们做应用的人来说真是很幸福的一个时间点谁对你们的反馈改进的最多我觉得看效率吧其实目前其实头部的几家我感觉像Google跟就DeepMind跟Therapy其实大家的响应都会非常快当然就是因为我们不同的场景会使用不同的模型所以大家就是在解决的问题的效率去客观程度上来说也受限于这个问题的难度对你教会了他们他们可以反过来抄你们的产品但是你们没有那么快能抄他们的模型怎么办呢你们的壁垒是什么对我觉得就是快首先有一点就是你会发现比如说一些模型公司他们偶尔会发布一些researchblog我们读到这些blog的时候心里也是又开心又无语因为基本就是我们之前在讲的这个东西比如他们直接写成了一个blog出来比如说什么thinkingtool也是我们上线一个月之后他们写了一篇blog像最近那个就是什么用代码方式调MCP什么progressively什么declosure这些东西也是我们都一直在就在的东西但我觉得这个是没有关系的因为这个就是一个进合关系而对我们来说真正优势是什么有两点第一点因为我们对于不同的场景使用不同的模型所以没有关系我们永远能够为用户提升提供所有人中最好的一个体验这是第一点第二点是什么就是他们的速度一旦是垂直整合其实你一定是没有我们快的因为产品方面的迭代还是太快了他们成分化的你们成综合的对是的所以刚好反过来了这很有意思这个很反视觉是的如果都直觉的事我觉得也轮不到我们做为什么会这样为什么会一个应用公司开始做一个综合的事情而有模型公司变成垂直整合他们越走越越窄我觉得这就是这个公司一开始的根是什么其实我觉得我们可以拿欧派作为一个案例吧就是我刚刚一直在讲我非常尊重欧派它是一个真正怎么说呢很尊重bottomup的这一个模式的人有很多朋友在openai就是他是真的能够通过一小群人的一个创新逐渐逐渐往上走变成一个产品但实际上我认为这就是我刚才讲那个叫买模型彩票这件事你的实现的方式是基于一个突破来做一个场景但是对于我们来说我们是所有外部的创新对我们都是一种养料都是一种供给我们就不用做选择我们不用买这个模型大乐头对就作为应用公司来说其实跟模型公司相比我觉得还有另外一个优势就是大家常常觉得就好像智能的提升好像不需要用户这个至少从今年年初比如DeepSeekR1出来之前其实DeepSeek也没有很多的用户对吧但是你其实通过比如说ROVR这些方式你其实能获得一些提升但我觉得对于agent这种特别长链路跟环境墙相关的场景下其实用户是非常关键的但是用户的使用轨迹以及feedback是留存于应用层而不是流动到模型层的所以其实现在应用公司有非常独特的数据飞轮这就是为什么像Windsurf跟Cursor他们可以以一个较低的成本在一个预训链基座之上去开发出一个基本是frontierlevel但是成本很低且专门适配自己的模型所以我觉得这是未来可能半年的一个很重要的变化大家会看见更多的应用层公司在利用自己的数据飞轮变成以模型的形式来体现出产品可以持续迭代这件事你们的用户画像是什么样的我们用户画像是这样就是我刚才讲了一个最笼统的定义叫做prosumer那可以切几个比较常见的化线来讲比如说第一类我们叫做在互联网公司或者技术公司里有但不是程序员的人比如说广业来说的就是白领或者说远程工作者第二类是我们叫做freelancer或者soloentrepreneur美国其实有很多那种独立自己去自负盈亏你可能在做外包你可能在做自己有一个很小的一个生意这些人他们是一类用户然后第三类比较大的用户就是所谓的金融和consulting就咨询行业的这些人我觉得他们都有一个比较大的共性就是有比较强的自驱力且与此同时他们的任务是高价值的这个是很好玩的然后我们发现其实做agent就很有意思的一点就是他不是在做工具至少对于我们来说如果你做这种通用的agent的话不是在做工具你不是在做工具你其实在做一个类似于人的东西如果你做的是一个垂直agent你可能还是在做一种新的工具但是如果你在做一个通用agent你其实在做一个人做一个垂直工具比如说汽车公司就做的是司机像loveart就做的是设计师对但是它其实是设计师用的一个工具而nana作为一个通用agent我甚至可以用loveart因为manus的抽象层级是什么我们在设计说让agent能使用哪些工具或者你跟外部交互的边界是什么时候我们一直是这样一个类比就是说我是一个人一个普普通通的人我能做很多事是因为我有一个电脑我跟电脑之间的interface就是界面是什么我的右手能够用鼠标我的左手能够用键盘我眼睛能看见屏幕上的内容我的耳朵能听见它的声音没了就是一个远程工作者用这样简单的标准的接口其实就能完成几乎无穷无尽的种类的任务所以最近我们也看到一个比较新奇的结果就是scaleAI最近发布了一个新的一个benchmark叫RLI叫RemoteLaborIndex叫远程劳动力指标这个Benchmark理由当然Manus又是Sota肯定第一名然后我们战胜了像CloudGemini这些竞争对手但为什么我们非常看重这个Benchmark因为它的评判标准是非常有意思的它的评判标准说这个AI系统它完成的工作能否让一个现实的客户愿意为之付款且无法区分是人类还是一个AI去完成的然后这个当然就虽然我们现在是sota但实际上我们完成率只有2.5%所以其实离10%还有很远的一个距离但这块其实这个benchmark我们看中的原因就是它完美契合了我们想象的这一点就是对于通用agent的衡量指标就是它能完成多少远程工作者能够完成的事因为这个解读空间就很大我现在可能虽然只有2.5%在Benchmark上但是那是不是说我们也许能够去让全世界2.5%的GDP获得加速所以这是一个很好的一个梦想而且大家都知道就是进展仍然是存在虽然很多人说的进展速度好像变慢了但实际上我觉得Evaluation是最重要的事因为它能指引我们去的方向还是即使Test也是方向所以我觉得也许到了26年我们乐观一点可能2.5我们能刷到这个2030对吧那这样其实就能占相当大的一个经济生产的一个规模你们现在数据飞轮是什么样的数据分类是这样就是可以跟chatbot相比我觉得有讲几个非常好玩的点就是如果你在用chatbot的话当AI输出了你不满意的东西的时候你的第一反应可能有两种第一种是简单点那个重试键retry它就重新再输出一个你就相对再roll一次看会不会好一点或者说你就直接去改你输入的那个原始的property但是我们发现在agent的场景下用户他会这样就是他会教这个agent我举个例子比如说我经常让Manus帮我去筛简历然后他shatter这个标准跟我想要的不太一样我就跟Manus说你这不对我喜欢的这种你要注意下次是不是给我excel或者怎么样其实我一直在教agent这是教这是第一种第二种是什么就是如果有一些任务即使不涉及我的个人偏好但agent很有可能就是做不对这时候我会去fix他我会帮他修比如我跟Manus说你这个不对我已经帮你把这个文件改成了正确的格式而获得这两个数据其实是非常困难的以前在拆报的时代而当你有很大的用户量之后其实你能够进行一件事就是你可以说大一点叫做基于collectivefeedback做到一种在线学习当然我很不喜欢在线学习这个字待会说但是它其实能达到的一点就是我们即使不碰模型其实也能够获得一种叫做self-evolving的一个能力当然它是parameterfree就是不涉及参数化但是有更多的用户使用之后我们能够将更多的通用的公用的这个failurepattern就是失败模式以及用户共识性的东西变成系统原生的一部分就变成用整体上来说用的人越多我的失败率越低我完成同样任务的轮次开销越小这是第一种数据飞轮第二种是什么第二种就是说我们仍然会拿用户最朴素的反馈就是打一星到五星作为一个指导因为这个东西能回到什么就是我们刚才讲的evaluation很重要但实际上agent的自动化evaluation我认为现在还是非常就期待改善的因为即使你有一些这个自动化的ultraverifiable的benchmark比如我们一开始就会很关注GAIA、SWIBENCH这些东西但实际上我们发现真的上线之后我们的在这方面表现好的架构和模型其实用户的真实评分不一定高因为用户关注点跟你这些理想化的跟出来还挺不一样的举例子比如说用户更关注的是你做下这个size你的长宽比是否超过了这个16比9你这个网站是否是属于比较易用且好看的刚讲16比9你还能可以自动verify对吧但是什么叫网站好用可易且易用这东西你很难通过一个完全自动的rewardmodel去实现所以我们非常依赖于用户给的直接的反馈且有一个固定的团队就做evaluation而且是主观evaluation所以这块是真正能够通过用户的反馈来指导我们迭代的一个方式这是多少人的团队我们是这样就是我们有一个专门的evaluation团队evaluation团队现在不到10个人但是他们会同时负责这个系统的搭建我们内部有很完善的evaluation体系以及自动化且同时我们从产品团队会有一些比较junior的同事其实专门就是负责主观evaluation所以是技术和产品团队一个交集加起来大概有10多个人加上不断轮转的很多实习生你们现在核心关注的几个指标会是什么呢我觉得有几个第一个就是说我们从interface就还是刚才讲的这个界面角度来说接口层面来说你可以抽象成几个不同的维度首先我一直在说codingcoding一定是非常重要的一点虽然Manus不是一个codingagent但其实coding是Manus的一个灵魂所以我们当然对SweepInch还是非常关注的但SweepInch就快被刷爆了然后这是编程是一个维度第二点就是雖然没有直接进行computeruse就说我们不是通过GUI去完成很多事但实际上我们用了很多的browser的use所以这块我们也会很关注这种GUI的理解能力这是一个维度但是这也就是所谓的多模态输入的一部分第三类是什么就是广业的突靠能力突靠能力是怎么说大家非常关注但实际上到了Manus这个复杂度并不多因为Manus的复杂度非常高它有多种不同的actionspace它不仅有原生这种functioncalling的function包括其实你在使用我们自己自定义的这版Linux发行版本的时候它其实有很多命令行工具它不是以模型原生的这种schema去存在的而是存在于系统中就让模型能够基于一些使用文档来学会使用特定软件的能力这是非常关键的所以我们从模型的原子能力的情况下我们会最关注这三点但其实还有一些非常难量化的东西就是我们刚才讲的比如美学性和对错误的自我意识这个错误自我意识其实我觉得也是很重要的就是它有低维度和高维度两种低维度一种就是说你在看很多benchmark的时候你能看见的是无论你是passiveone还是passivek你看到的其实都是模型在oneshot过程中去完成的一个状态但很多时候有的时候模型需要自我意识到这个错误该怎么修复当然这是最理想的更常见的情况是用户先发现了一个错误并指正它而如果你是经常AIcoding的时候你可能会有一个很沮丧的体验就是无论是CloudCode还是Codex你发现了一个问题你让AI修AI说太棒了我已经完美修复了这个bug其实不仅没修好还引入了另一个bug对这个指标是很难去追踪的因为它可能中间涉及真人的一个feedback这是低纬度更高维度的一种怎么说这种错误是指他做出了一个能用的东西但是他无法去很好的去把这个东西推到下一个level就是从可用到好用的这种错误我们还是愿意把它定义为一种错误因为我们觉得是能够解决的比如说Manus跟很多别的这种codingagent即使都能做网页Manus也能再往前再往前做一步就基于我们的通用能力Manus每做完一个网页他可以选择说我自己用我的浏览器去把这个网页玩一圈然后看看我再看看我数据库里的记录是否都对上了所以这个我觉得是能够去弥合这个错误的一个途径刚才有一些表达比如说模型的懒惰模型比较没有耐心模型感到压力模型比较着急还包括杨志霖以前说常文本影响智商模型的状态好像跟人还比较像这是为什么呀我觉得我们只是在用人习惯的词来描述这个我觉得模型跟人一点都不像或者说强行把模型或者agent与人与人的常用的思维体系去对齐这事是不对的你刚刚不是说你们做的是一个人吗对但是我们是做的是能完成人做的事情的一种系统但你不该与人的这个比如分工或者特化去要求模型这我举一个更具体的例子就比如说很多做agent的公司或者一些开发者他们有一种惯性思维就是说我要让我的agentmultiagent系统中分为设计师designer什么programmermanager这些东西就是你在给模型增加很多不同的角色我们觉得这个其实不太对因为回想一下为什么人类社会会有这个问题是因为很可惜我们每个人都不太全能所以你在一个组织架构下你必须要有这样的一个分工但其实我们在组织架构下又有多少的信息在我们通信之间损失了又多少在合作中增加了很多的摩擦实际上模型是比人更加全能的一个东西所以你应该充分利用模型的优势而不要生搬硬套人带来这套约束我是想表达的是这个意思那模型应该怎么分类Agent应该怎么分类Agent分类这个话题我觉得你只能从输入和输出角度来看你觉得不用分类我觉得不用分类所以你们做的是通用agent不是我想说输出的意思是什么就是通用agent是把更多输入的责任交给了用户对然后你做垂直agent其实在输入这侧你会做很多比我们要多的事情就比如说如果你要做一个垂直领域你输入的数据可能就来自于一个用户不太可能自主产生的或者说自主提供的一个过程比如他一定得输入就结合到某一个已经在运行的业务系统来获得这个输入同时它的输出也不是以一个标准化的形式去给出的可能它是无缝就传递给了另外一个系统中所以我觉得它一定输出跟通用agent有不同它决定了哪一个是哪一种verticalagent但实际上中间的技术方案我相信会是趋同的你们为什么做通用agent而不是做一个agentos我觉得首先作为一个有职业素养的程序员我们会尽量回避OS这个词为什么这是一个圣杯我不配这是第一点然后第二点就是我们觉得OS这个东西其实你如果严格定义来说它是一个中间层当然你也可以说agent是很多东西的中间层但实际上我认为现在agent还没有到这一步就是用户的文件用户的软件其实不在你这这是一个客观的现象对吧所以在你没有获得这些东西之前你不要称自己为一个一个OS谁适合做这个会有这个生态位吗我觉得是这样比如我们跟微软有很深的合作前一阵子Ignite大会让大家看到Manus跟Windows都会有直接的合作像比如说你以后在WindowsUnion菜单里就可以用Manus我认为不是说有谁做了一款开天辟地的AgentOS而是现在所有的操作系统都会逐渐具备Agentic能力而且很开心的一点就是我们发现现有的操作系统厂商在以一个相当开放的心态在做这件事比如说接下来大家可以关注那个MicrosoftAgent365对你也可以看到Manus也在里面对所以我觉得这个东西就像我们之前做浏览器一样我更相信的不是突然出现了一个全新的Agenticbrowser而是所有的browser都在变的Agentic你觉得Agent最后的生态会是什么样一个格局Agent最后的生态是吧我觉得是这样就是可能垂直领域的Agent最后应该是一个百花齐放的一个状态当然也许还是2B方面会多一些2B的垂直agent的会多一些为什么我指的是海外市场OK对因为首先有一点就是目前因为我们现在只做海外我们觉得可能尤其我不敢说海外这么大词就说美国市场吧美国市场我感觉现在大部分创业者都在想一件事就是我要做一家给另外一家创业公司使用的产品并卖给另外一家公司就是我觉得很多美国创业者已经失去了做2C的勇气和心气你說美國華人創業者還是美國的創業者甚至華人好一點的華人還有夢像我們就比較勇的這種我們還敢做這個事為什麼為什麼喪失了這種不過去十年美國toobig確實更好一些對我覺得其實與其說喪失應該說他們這邊的環境更形成了這樣一種正反饋就他們的退出機制非常好很成熟賣公司嗎對你可以賣公司或者說你自己做2B你有一個穩定的收入你自己獨立上市獨立發展都沒有問題所以這是他們這種成功的路徑決定了美國資本市場的一個傾向對吧所以在美國這種項目跳出來做2C那確實是一個很異類的一個東西當然這也就會有人願意下大注對吧谁愿意下大注下了什么大注就像我们现在就获得了一些压制我只能这么说吧但像国内的话我觉得上一代创业者就是我这代创业者我们在这个移动方向时代其实很多人都是做2C的而且获得了很多人的正反馈也更勇一些所以我觉得这确实是两边的环境和持续的反馈带来的一个结果所以你觉得没有垂直2C的agent的生态位吗我觉得一定会有但是这块其实会比较微妙我们团队有另外一个同学他之前是做一款剪辑软件然后后来也是被通讯收购了然后他其实给我说了一个很好玩的观点就是说做垂直吐息的应用很难的一种模式是什么就是比如说你要给剪辑师做一款更好的剪辑agent他说这是非常非常难的因为专业的人士会对这有极高的要求这个用户会有一种从风险控制的角度来看待这个事就比如说你一个工作流很复杂你但凡有一个环节没做好那对这个专业人士来说这个东西就是零分因为它是一个惩罚关系对吧你就不能用但是你应该做一种什么样的agent呢是做一个给非剪辑师用的但是却有剪辑需求的人做的agent比如说自媒体这样的话其实你会变成一种给原本就有这个需求能做不了的人它是一个竞争力对这个我觉得是非常重要的一点这其实这句话其实影响我们很深我们现在经常跟我们的用户或者别人交流他们常说Manus虽然我们的作品通用agent他很像人但是我们从来不以替换人的思路来想这个事因为如果你要给别人一种说我要替换人的这样的一个心智的话所有人都会从一个riskcontrol的想法去想就我刚才讲的你让他一个环节不通就是不通但是其实你应该是一种提升人就enhancepeople的思路去想让你现在已经最高效的雇员或者说你是一个自屈的一个人你获得了这工具之后你能让你的产能提升那这是一个更良性且更现实的一个做法所以这个生态还会怎么样除了有通用的agent然后有垂直的2B的agent还有呢我觉得会有很多偏娱乐的agent出现当然也就是2C的广义的2C当然这个可能就是接下来看怎么走现在我也看了一些比较有趣的一些尝试比如说比如说那个我就不说具体名字他们做的可能就是给每一个人做一个虚拟的agent然后让agent以代理的形式之间进行社交我觉得这都挺好玩的但我觉得我实在是没有这方面的insight所以这种产品感觉适合OpenAI做你说OpenAI吗我觉得OpenAI适合做所有产品你觉得OpenAI会抢夺你们的生态位吗? 我觉得一定是会有竞争的但是我们现在观察到的现象是什么? 首先就是在ChargePTAgent出来之前我们可能要经常回答的一个问题就是OpenAI做了你们怎么办? 他们做了他们做了对但是很明显效果就不如Manas为什么呢? 这我刚才讲的就是我们其实是能用市面上所有最好的选择而OpenAI它仍然是在它的领域有所专长这是第一点第二点是什么其实跟他们的一个用户性质有关XGPTAgent仍然是XGPT的一部分XGPT我觉得它是一个打透了的产品就是XBOT的战争已经结束了所有的用户都在使用XGPT但实际上有Agent需求的人客观来说是少一个量级的对所以我们其实一直是在自上而下去做就是我们一开始触达的用户其实你想麦德斯在美国是怎么活起来的其实都是一开始像什么这个PatrickCollinson然后JackDorsey就这些硅谷精英们他们发现这个东西真的好用能给自己提效所以一直都是在服务一个相对比拆GBT单价更高的用户群其实对于那种比如说快速的问答或者一些低价任务包括我自己我也是不用manus我用XGBT的所以我觉得这是一个分层的一个市场我们会长期专注为真正有高价值需求的人提供他能找到的最好的AI而不是跟XGBT去抢夺一个就是最广的底层的这个用户群所以Xbot和agent的用户不完全是一拨人它是不完全重合的它不完全重合它包括你们对他们包括我们但是实际上我们一定要去满足的就是那些有最高质量需求的用户就是他这些人肯定用过XGBT但是他们仍然会选择Manus是这样的一群人其实是XGBT没有把这个部分的用户需求满足好是的是的或者就是说我们得保证我们永远能提供比XGBT的agent更好的体验那这是现阶段未来呢未来他们会赶上来吗那我们也会赶上这个就我常说就是小公司怎么跟大厂竞争就赶紧成为大厂你们现在距离大厂还有多远还算远但是再做了再做再做长期来看理想状态的Manus应该是什么样的理想状态其实我想回到刚才我们谈了一个问题但没说完就是说边界是什么这三件事刚才讲到其实有三个系统系统有三个元素一个是模型一个是环境一个是用户其实我们觉得接下来我们更关注的我不敢说未来形态因为对于创业公司来说我们就聊三个月后的事都很慌你就聊接下来这三个月内我们会关注一点其实是用户其实也是一种边界也是一种瓶颈是什么就是现在无论Agent多么智能或者就是说Nanus跟拆爆相比有一个最大的变化就是它输出不简简单单是一段话是一个action是一系列action或者不同的产物但实际上它的起点到目前为止大家看到的好像还是一个prompt但实际上对于用户来说输入prompt是很闹心的一个事而且它有更多的问题是很多context没能代入进来所以我们一直在想就是如何去优化这样的一个事然后刚才提到张涛涛哥的一个梦想是做一个7×24小时24小时推理的机器所以我们接下来会比较投入的一个方向也可能代表未来一段时间的manus就是我们在做proactiveness就是主动性这个词其实我觉得是我们爱带火的不是这个词其实应该是agent这个词的本意agent的本意其实来自于agency就是能动性主动性对但是之前的话因为大家可能更关注的是一个结果的呈现但是其实现在又到了该关注context这个问题了就好比OPEC先做出了XGBT但Monica关注到了输入context这个点现在我们也把这件事要做得更好但是我们觉得不应该做成像XGBT的那个叫pulse对吧那种就是他每天给你推很多东西这个其实在占用户的时间而真正现在能够把为Linus付钱真正获得价值的用户他其实需要生产力效率提升的所以我们更关注应该是如何让agent主动去完成更多的事对这个东西现在我们内部已经有这个prototype我们自己用的很爽怎么主动完成这可能我先不方便透露太多但我可以举例一个场景就比如说我们自己每天比如面试完之后我们可能用一些第三方的SaaS服务比如像Ashby这些东西我们需要去写那个就是review就写那个评价然后当然评价我们自己评但你要写很多这个描述这些东西但其实我们在面试的过程中我们可能用的是NotionGranola进行记录那可能我们自己要干的事就是假如没有这套新的AI的话那我们就得自己去基于我昨天的这个interview的记录然后去填写这些评价但实际上有了这个proactiveness之后Manus其实可以每天早上在我醒来之前先去自己看我的notion帮我去直接把记录填到这个填到HP里头然后只让问我接受与否所以其实应该解放出来的就是用户的这层瓶颈让agent的能动性逐渐去发挥出来这我觉得是一个短期未来关注的点开始我觉得是你们想让大家能够更方便的去理解你们所以你们用了一个通用agent这个概念你觉得通用agent长期来看是最合适的描述minus的名词吗我觉得不一定甚至说不是为了让用户更好理解你知道我们那视频做的非常草台整个这个公期大概就三天是那块呢因为还自己剪的是吧自己剪的为什么那块要有一个黑屏说什么theworld'sfirstgeneralagent呢因为中间那块其实发生了一个很傻的事是當時我們那是在我們辦公室一樓度的背後一個保潔阿姨走進來了所以我們必須在這掐一個就是得得得剪一針給我一個黑屏那完了那這就只能給一個定義了然後大家一想就是Manas如果剛才一開始說的我們也沒想好這玩意到底是這個你怎麼定義它對吧它到底是為誰去服務的因為我們想的是去觀察去做達爾文就想有一個殼然後大家進來不是一个壳它是一个一个playground然后呢那好责任就到了我因为我得写那个视频的稿我想那这个我们管它叫什么对所以整个这个概念就是我拍脑袋想的是临时想的对然后就被大家采纳了所以我觉得特别对不起大家对但是我们觉得这个词其实它偏技术了因为它来自于所谓的generalpurposeagent这个概念看上去好像是为了占一个位置而设计的这个词就是为了占因为都说25年是agent元年嘛看上去你们想占那个最大的生态位然后取的这个词其實不是是因為擋住保潔阿姨講了這個詞是一個從市場角度來說我覺得不是一個很好的選擇因為對於不了解技術人來說這是什麼東西這是一個很奇怪的東西所以我們現在更想強調的一點就是說做通用的agent是因為我們的一個技術選擇就剛才我解釋了很多對吧就是你有一個更好的技術架構其實你可以讓不同的場景之間有很好的協同性並且互相增強那個網絡效應比如说我们其实新的那个ManagedCDR物理我们一直在强调websitebuilding这个能力但实际上这个功能我们只开发了不到一个月但它效果目前绝对是sota的这就是因为我们其实在一套统一的一个agent架构之上长出来的那个最后一公里对但是这个对用户来说其实我们没必要解释这么多我们未来对用户的沟通其实完全就根据科学去讲比如说你是一个企业你可能更关注就是内部工具的构建我们就跟他讲Manus是一个非常好的内部构建的一个工具同时它能帮你去把各个环节串接起来所以跟所有的垂直的产品相比我就还想强调那一点就是Manus能做所有的事做的一样甚至更好且能多做一步是这样的一个定义我觉得Agent这个词未来大家其实也不用太在意这个东西它就是一种新的东西而已那比如说大家需要一个负责设计的agent吗我觉得也许是需要的因为它要融入你特定的工作流就好比你设计领域如果没有AI你往回看也会同时存在FinalCutPro跟剪影就是这样的一个情况你觉得minus会收敛吗你说收敛是指收敛到某几个更垂直的领域不会我们会是这样就是我们会做很多的我们叫做场景就比如说现在其实我们头部机场刚才讲的批量文件处理网站生成slice生成但我们从来没有单独做过一款产品叫manuslice或者manuswebsitebuilder它仍然是在这样一个统一的agent架构之下由我们的产品团队去优化最终最后一公里的体验所以manus永远是一个不断优化头部场景且保持很强场外能力的一个系统这是一个选择对这是一个选择刻意的选择Manus这样的agent和像比如说Lafarge这种设计类的agent你觉得他们长期来看关系是什么样的我觉得是这样就是Loveart一定会越做越专业Manus可能会有一定的设计能力但是就像我刚才讲的就是Loveart是给设计师用的Manus是给有设计需求的非设计师用的同时还存在另外一种关系就是为什么我们非常强调我们现在有一个概念叫connector或者叫integration就是连接与集成其实Manus之所以它是一个通用agent它就能模仿一个人它能模仿人用各种的工具比如说自己内部我们经常拿Manus调试Manus那实际上如果你是一个设计师你其实你的工作每天也不是百分百都在设计对吧比如有的时候你需要比如说基于一个设计稿啊不就基于一个产品需求去做出一个设计那你甚至也许有一个用法就是比如说你们在用比如说Lark或者Slack来讨论一个产品你可以让Manus去帮你盯着这个Slack然后让Manus去用LoveArt去完成这个事所以Manus跟所有人我觉得都不是一个竞争的关系我们是一个网络中的节点但很多时候价值其实不是在网络节点而是在网络的边上你怎么看Cursor和CloudCode现在的关系啊我觉得这个是比较尴尬一点就是他们选择了一个最激烈的一个点嗯就是一个怎么说就AIcoding它不是一个锤语它是一个通用能力嗯但是呢我觉得Cursor这家公司非常厉害所以呢就是它一方面是启发了Manus很多另外一点就是我觉得Cursor的人才储备是不逊于这些头部公司的或者说就是头部公司中跟Cursor直接竞争的团队的实力跟Cursor是可比的这刚才我讲的一点就是创业公司跟大厂对比的方法就是成为大厂我不是说在规模上超越它因为大厂不会倾注其所有资源于你一个人打我们现在要做到的就是我们在做Nanos这件事的人这个团队比如说某些大厂想做Manus人的团队强得多这就可以了所以现在多少人?
[129:00]
我们现在有将近10,Cursor和CloudCode我觉得还有一个点就是Cursor的选择空间还是比Cloud要多一些就是CloudCode仍然是Cloud的一个延伸当然我现在还在说大家在分化Cloud在Coding方面有一些独有的优势但实际上正因为coding是主赛道所以大家追的也都非常的快比如说Gemini3出来之后大家会发现可能Gemini在agent的coding方面还没有完全追上但在比如说静态前端的美学方面会非常领先所以我觉得对于Cursor来说有点类似于我们现在一个状态就是大家都在盯着这一个方向打所以它有一定的灵活度我觉得这个战争还没有结束那你怎么看你们像比如说跟KimiKimi做了Agentic的model他们就想走clockwork这条路那你们作为一个应用型的agent公司跟他们长期关系会是什么样的然后你觉得谁能赢啊我觉得首先我们跟Kimi从来没有任何的竞争因为我们没有国内业务國外的公司呢國外的模型公司就是你們和國外你們應該也在國外的模型公司的主賽道上對不對我覺得是的是的對所以就是我認為最終一定是一個進合類關係且我不覺得我們會輸就像我們已經跟XGVT打了第一仗我們從效果上至少還是贏的你們中間慌過沒其實基本就焦慮沒我們的肯定會焦慮但焦慮不是源於這個就是我覺得Ninus整個從一開始就莫名其妙火了到後來有太多事值得我們焦慮所以其實就是競爭是一種最常態化的焦慮它不會是佔你生活中大部分的焦慮好吧你們焦慮的是什麼每個不同階段當然就不一樣了比如說我們剛才說到了24年的90月份後面每個時間焦慮是什麼24年的90月份其實在Ninus做完到發布前那段時間是沒有任何焦慮的因為很enjoy對吧很快樂而且就是我們也都就是所謂這個中燈型連續創業者就是我們去做完manus之後我們知道這東西一定會火是一個極有信心的一個狀態所以就一定會成所以就是並沒有太多的焦慮你做的過程中哪個時候覺得一定會成其實就是當我們跑完了幾個例子之後就是我們當時也就自己內部也沒想好做什麼其實當時我記得是濤哥吧跑了一个例子是找办公室然后拿着自己去找资料查地图写程序然后做出交互服务网站还提供一堆这个选项之后我们觉得这个太酷了一定能成但是后来一次次的跑不同case之后信心越来越强当时是觉得一定没问题那段時間你們辦公室的狀態是什麼樣的就很嗨啊就是當時我們是在北京的那個e-park一個共享辦公室而且很小我記得剛開始的時候對我們那個工位只有六個就是北京這邊然後對我去過那個地方對但是那個地我覺得特別棒就是他們的一樓環境特別好就是我們拍最早視頻的那個地對然後當時那個狀態是什麼就是我們都特別對不起周圍的鄰居他們就經常就聽見有一個奇怪的辦公室突然前段时间我跟涛哥跟别的同事在嚎叫我去的时候那天没人整个工区都没有人对对对所以那块就是完全不焦虑那段时间发布后就开始焦虑了说说你们发布的时候的考虑你知道外部对你们最大的几个质疑之一就是为什么要弄邀请码以及是不是过度营销好这两个问题我终于可以回答了就是我们其实很早就想去公开回应这个事但我们觉得你瞎回应也没意义我们当时内部就说你没做到一美金LR钱就不用搭理这个事现在当然我们可以回答这个问题了到了是吧早到了对所以我们想说的其实几个一个月以前应该是对然后现在的话我们就可以正式的回应这个事首先我觉得邀请码这个东西是我们为所有人淌了一条很重要的河当然我不是说创造了邀请码这个概念是这样就当时我们以前不是做Chatbot吗Chatbot我当时讲到了它的消耗量可能是Agent这个形态消耗量的几十几百分之一然后当时Nanos我们做完之后我们为什么要用邀请码这个机制且没上线前我们就决定了用这个东西是因为我们在最后决定发布之前我们跟所有的云厂商和我们的Inferenceprovider就是推理供应商聊了之后我们惊讶的发现了一个事实就是世界上能够在第二天立即到位的算力比想象中少太多了所以就是当时的情况是所有我们使用的这些云和模型厂商没法提供这个量所以当时比如我们用CloudCloud说你们千万别放开你如果放开我们会挂所以对我们来说我们唯一选择方法就是去控量那控量的方法是什么那你就只能选一个类似于邀请码这种机制所以当然确实我觉得有别的更好的做法就比如说不应该有明确的一个码这样的一个东西比如我们给定向邀请这些东西对但是我们当时其实也没有想太多我们就去把这个东西给做了但实际上我们后来就在跟所有这合作伙伴一起不断迭代这个过程中其实后来大家也意识到了原来他这个消耗的算力这个模式跟查报是不一样的就刚才讲的pre-fillingdecoding从3比1变成比如10比1所以逐渐逐渐就因为Manus的出现大家去适应AgentWorkload这样的一个工作负载然后再后来我觉得再用邀请马链我就觉得有点奇怪了就是我们已经帮大家蹚出了这样的一条路云场上也已经准备好了你还何必去这样做呢你想如果当时我们能直接放开那其实我觉得可能体验会比现在还要好因为如果充足的算力的话大家不会遇见那么多的比如说当时我还记得3月份你用这种可能就崩了对吧因为你真的没有那么多算力然后我们的Scaling也没有那么好就会崩掉如果能把这些事提前搞好那我们何必用邀请买这个机制所以你觉得当时是因为云厂上没有准备好云和模型都没有准备好就是那句话就是如果他们准备好了你们的成本是能够扛得住的吗扛得不住但是因为我们对产品极有信心我们当时一天烧几十万美金吧我们觉得没关系因为绝对就是这个产品一定能成你们当时账上多少钱当时也没太多吧是之前还有融资额反正是钱是够花的但是其实也很紧张但是我们觉得这东西一定能根本不慌就是绝对没问题实际上所以很野的对但是当时那个情况给你描述一下当时比如我们跟云厂商打电话我们说我们现在需要加到多少多少TPM上线前是吧上线前上线当天我们说我们能不能临时加这么多然后他们说没问题你们是要下个月还是下下个月要我们说今天下午要然后但这没办法所以真的就那头一段时间就是真的是他们的物理层面上去搬卡插在机柜上给我们用搬卡插到机柜上给我们用我们当时就是为什么后来跟Google的关系这么甜就真的我觉得GCP在过程中当然包括后来Azure都非常支持我们就真的就是对我们来说是雪中送炭级别的支持这就从别的比如别的项目的可用区域来把临时调资源给我们然后这才让Manus撑过了第一个月二五年初大家都没有预料到今年的Tocoin消耗量会指数级的增长对因为它的输入输出比例变了失调了这就为什么就是我说Chatbot它的消耗量其实你是可以预测的因为人参与的频率太高了就是因为你得人触发才会有下一次的行动而agent首先它会持续自我工作而且如果你按react这个模式去看的话它的context其实appendonly就是只增的状态如果你从模型视角看是每一轮迭代的时候你需要重新prefill前面所有的输入当然你会有kbcash在这但是它的输入投入量是非常大的其实每一轮会越来越大所以当时就是没有这样一款真正的agent出来之前云厂是没有准备好的这是第一点但是你说的是你们上线当天给他们打电话那这个邀请码决策是在这之前就发生了你们这个决策是怎么下来的就是我们需要一个空量的方法但是因为我们也没有更好的办法就只能选择就是用邀请码或者定前邀请但我们觉得现在可能定前邀请会是一个更好的一个做法为什么呢因为邀请码东西我们没有意识到这个东西我们知道产品一定会火但没想到会被炒这我觉得是非常不好的一点定前邀请你不能炒但是如果沒有吵的話可能烘托不出來這種氛圍但問題是我們在國內我們沒有意義就是包括那個Nanas跟Monica就我們上一款產品其實我們都一直做出海的我這個其實也是當時我們覺得非常的冤的一件事就是你想中國有這麼多的企業在響應號召進行出海無論是AI或者比如說吸音像這種做衣服對吧你其實你選擇不同的market我覺得是很正常的一件事我們其實在中國比如突然火起來其實對我們沒有一個直接的一個作用反而會讓我們就承受很大的壓力所以也是为什么Manus当时上线是选择的晚上10点多因为那是北美市场的早晨是为了北美市场选的时间对是的是的这个是邀请码对这是邀请码炒作呢炒作好这个问题要非常郑重地回答一下就是我可以直接这么说如果我们在3月份发布的时候如果没有任何付费宣传我死全家這個是我可以說到這個程度就是你想我們為什麼要宣傳有必要嗎對吧因為我們要做的是什麼我們要做的是海外的prosumer的市場對吧那我們該做的是什麼應該是去讓那些真正我們要用的用戶去用起來对吧而如果我们在国内比如说有人觉得我们买这些自媒体其实对我们来说没有任何的好处那有人就问那这些文章到底是哪来的我觉得有两点回答很重要第一点就是我们自己都觉得很酷的东西我相信大家一定会觉得很酷对他们来说这是一个内容他们值得去写第二点是什么就是我觉得可以用涛哥的一句话说这是我们多年广结善缘的结果我们都是不是第一次创业了我们这么多年一直比较积极无私去分享很多东西我们也会上比如一些播客或者经常写一些文章去跟大家分享我们一些见解其实渐渐的以前可能跟我们一起成长了很多小伙伴他也许成为了很厉害的投资人他也许成为了一个自媒体人那这时候他看见你的朋友在做一款产品的时候你是不是会很自然就哪怕出于朋友的支持应该去写一下所以我觉得大家把创业和媒体之间这些关系他想的有点太复杂了可能也许我是一个偏见我觉得好像整个这个市场好像挺单纯的就是你做出一个好的东西且刚好是你的朋友大家就会愿意帮你一下因为这是一个广结善缘的一个结果但是我覺得minus火了一天它的熱度好像迅速就降低了你覺得為什麼因為我們在國內沒有任何持續的這個就我們其實在國內是屬於一個我們可以叫滅火的這樣的一個狀態因為我們覺得如果你把我們這個東西比如過度的比如說进行一些曲解或者对我们来说没有好处我们只是一款AI产品出海的一个应用不要给我们赋予太多的这些东西所以你看我们当时在国内我们所有团队没有任何的类似于对外这种发声其实都是别人在以一个第三方的角度来阐述我们所以我们觉得在国内的热度其实降下来是好的那在海外呢在海外的话我觉得这个就是我们想要看到的就当时说有人说我们在海外做营销我拜托AndreKapasi你能买吗这些东西你不可能买到的对吧就是我们首先让我们的用户群就是最pro这些人看到这个产品的价值他们先用起来然后他们去自上而下的去影响更多人去使用Manus这是我们希望看到所以这个流程肯定没有国内那种突然火的那么快但其实也没有多少的时差基本就是当时国内好像3月5号当天晚上莫名其妙的火了但其實美國基本就在三天之後就開始自下而上就火起來了而且我們去看了這兩邊鏈路基本完全不重疊鏈路不重疊對是的就是海外火起來完全就是靠比如說AndrewKaposiPatrickCollins還有GaryTange這些人他們先用起來然後他們的影響力再去自上而下的去影響而國內可能確實是比如自媒體還有一些朋友他們就寫了很多的內容你們當時準備的邀請有多少個邀请码其实的动态的加的就是说我们跟原厂商打电话我们说现在比如能加到比如说20Mbps我们算一下好那大概能加出这么多码然后更多其实后来码就已经变成就是给朋友以外变成什么就是那种找过了我们又不好意思拒绝所以就变成了一个谁跟我们比较熟我们就给谁对所以因为在国内我们知道其实我们也不指望他在国内能比如很大规模的靠邀请码传播或者怎么样其实只是一种出于礼节性的给一下就给了這個會讓網絡上很多用戶的感受不好因為你們說你們有邀請這好像也是一種承諾但是後來這件事情就不了了之了我觉得邀请码不了了之不是不了了之是后来我们用了极快的速度大概不到一个月我们就把邀请码去掉了就可以随便用了所以我觉得这不是不了了之我觉得这是最负责任的一个做法就是我们在云场上和模型厂商的支持下终于不用邀请码了但是你们很贵贵我觉得不是我们的问题因为真的就是当时可以说一个实话因为当时的token还非常非常的贵我们其实已经是在补贴用户让他们来体验agent这个形态的产品你们当时的定价逻辑是什么拍的拍的对这个是我们觉得我们非常有问题的第一是商业化能力其实还是比较有限的第二我们的PR或者说这个marketing能力其实也是很差我们当时定价的逻辑特别简单就是拆GDP好像是20美金一个月而且我们死活想不通的为什么是20美金一个月后来当然也跟别人聊下他们觉得拆GDP好像当时也是拍脑袋拍的但是没办法人家就有一个毛在这所以当时我们想我们从20跟40开始然后就延续至今因为这东西会有一个很大的惯性就是你最好不要太随意的去调整你的价格对让用户可能会就已有用户你最真实的用户可能体感不好对所以这块我们就没有太大的一个变化定价没有什么逻辑是吧定价没有什么逻辑为什么不选择比他便宜呢因为是这样其实这个定价没太的所谓因为manus其实你无论你是给多少钱你获得的是一个credit的一个数量它是本质其实是一个按量付费的一个东西所以只是就保证一个就是基础订阅的一个价格在那就行那现在你们已经跑正了马上跑正马上跑正马上跑正因为其实是你要区分不同的tier嘛因为我们还是有很多的免费用户我们免费用户也是你可以说这是一种我们的社会责任或者怎么样就是我们希望有更多的人能够体验agent这个形态在Mindless整个就是做出来到火的这个过程中小红的决策是什么呢我觉得几乎所有的决策的最终决策人都是她比如说太多了吧这你让我如何去美举你说火的过程中还是说就是从做到火从做到货那几乎所有产品的决策最终都是它了有什么是你们之间有一些争论的然后最后谁听了谁的这其实我觉得我们之间的争论都会非常务实这种讨论就比如说一些关于比如到底要不要做一个单独channel的这些东西然后最后的结论其实都是我们赶紧做一个试试所以其实到现在为止不同用户用的NAS可能完全不一样因为我们可能海量的AVtest在跑当然最终的话我们觉得最好的决策就是你限制一下时间就是別為這個事比如一天一天一直猶豫一直猶豫得趕緊做做就好現在在市場上去找反饋對是的你覺得你們今天的生態是穩固的嗎我覺得不是穩固的就是或者對於大部分創業公司包括我們在內其實我們都沒有活著的權利你們都沒有活著的權利活著的權利是自己持續跑才能爭取來的火了之後生活發生變化沒有有啊就非常忙尤其是就是就那幾天那幾天是什麼狀態那幾天其實就是顛倒黑白因為我們其實非常理智就是國內其實罵我們也好或者這個就是稱讚我們我們都怎麼說就是沒有辦法我們也不想回應什麼東西但真正就是我們的客戶在哪裡我們要關注什麼所以那段時間真正的痛苦來自於顛倒黑白因为我们要支撑比如说这个各个时区现在Manus用户其实遍布世界各地就真的是每一个大洲上都有很多我们的用户所以那段时间我们团队没有现在这么大大家可能真的就是在不断的救火就因为今天可能这个系统挂了明天那个系统挂了所以天天就是在救火所以非常疲惫能睡几个小时那段时间那天我记得从第一周到第二周基本每天就是零散的可能加起来睡个三四个小时都是那种间断性的睡每天还是每周每天每周这就死了办公室状态更嗨了是吗还在那个小办公室然后当时是这样我们武汉有很大的一个团队这也是我们经常反思的一点我们好像跨区域协作能力蛮差的所以当时大家想那算了大家赶紧出差吧我们赶紧在我们楼上租了一个更大的办公室然后武汉同志赶紧能飞过来就飞过来大家不要在什么线上工作赶紧线下一起来来讨论方案然后那时候其实办公室氛围没有更嗨真的就是非常非常疲惫甚至当时我们那个书架上摆的更多的补剂营养品反正就是那段时间真的就是大家精神状态都很差我听说你们那段时间融资给投资人开会哦對那段時間很好玩就跟投資人pitch我們都是站著看對就是其實是這樣就是當時我們還挺感謝投資人的你知道嗎就是因為確實每天白天的時候我們看見的網上大多是一些罵我們的東西而真的就跟投資人好好講的時候得到正反饋是我們一天中最最溫暖的一個時候你知道嗎就是好吧動人還是動人怎麼看待你為什麼被罵我覺得有幾點首先一點是我最近意識到的一個事就是我覺得是最慘的一個點就是很多国内用户骂我们根本原因是你用的根本不是Manus然后借这个机会我一定要非常非常郑重地强调一下你在国区AppStore上搜到的所有Manus都是假的那都不是Manus那都是来蹭我们的人所以就是我们有一部分被骂的原因是你用的那个东西就是一个山寨品然后另外一点其实我也能理解就是因为一个产品如果是突然火的话大家天然会觉得你是一个比如什么很营销或者怎么样的一个东西但这我刚才我也回应了如果我们当时有这种行为的话我先死全家对这是一个很关键的一个点但是我其实站在用户角度我也能理解因为你好听说了有一个很新奇的一个东西但是他没有提供服务我这种大家的愤怒我也是能够我觉得这是一个gap对这是一个gap是理解的但是现在对我们来说就是我们的团队能力是有限的我们很难去说比如服务于所有的用户比如说我们甚至说为了让大家能在一起因为我们的沟通能力很差那就大家都在一起因为团队带宽有限那么先盯着有限市场去做所以这个东西我觉得不是一个就是虽然可能让一些用户没能用到但这就是我们能力所限只能先这样中国市场未来会好好做吗我觉得这个比较难就是对于我们来说我们也没有那么多的资金去进行一些怎么说就补贴性这东西就是我们之所以开始选择出海其实原因也非常非常简单就是因为大家可能海外的用户对于生产力工具的付费意愿就是更强而agent就真的是非常贵的一个东西像我们刚才讲的agent可能有点像工业生产而不是传统互联网这种编辑为零的东西所以我们就会非常慎重的去做这件事我们要先保证自己能活下去再去讨论这件事目前我们在活着的边缘那中国这部分的功能有谁提供你觉得我觉得这个功能其实还是比较充裕的吧就是在Manus出来之后在接下来几个月中我看见有大量类似于Manus的产品出现而且很多也是我们国内团队去做的所以我觉得这个挺好的但是真正的我觉得难点就是他们会跟我们预见一样的就是你到底要补贴到什么时候对你如何去把你的这个产品的商业化跑通这决定能走多远见了什么有趣的人我其实见人非常少就是因为我们现在分工是这样就是可能涛哥就张涛跟小红会去见更多的外部合作但是像我跟潘潘我们还是要保证这个产品的持续迭代所以刻意我应该去少见一些人为什么海外很多巨头都愿意见你们对我觉得几方面吧一方面是这样就是很多时候他们是同时具有云和模型业务的比如说像Google比如像Microsoft就那自然就是一个非常好的一个合作相对我们是他们非常大的客户但与此同时他们其实也在探索新的这些机会在哪? 比如说我们前一阵跟微软一块发布了新的那个Agent365这个东西那这样的话就是你能把所有的电脑从一个PC变成AIPC那我们可能是这样生态版图中的一部分然后更多的一些就是因为我们作为一个Agent整个行业的一个代表其实我们能给他们的一些东西其实是影响未来它能服务更多人的一个范式的像刚才讲到比如说我们跟DeepMind这些合作跟微软这些合作其实我们也在主动把很多我们在构建Manus过程中学到的东西以标准化的API的形式提供给更多的开发者比如前一阵GoogleCloud开发者大会上GoogleCloud的CEOThomas他直接就当着全场所有用户就所有开发者面说之前有一些只给Manus用的feature现在你们都可以用所以我觉得这个还是让我们挺有成就感的就是我们不仅做了一款很好的产品其实我们的技术也在帮助更多人更好的构建agent-1.5中間有什麽弄好嗎我觉得这有一个最大的knowhow就是通过一个新的版本号是最好的让用户理解有更新的一个方式对这个很好玩就是大家可能已经习惯了像机座模型以版本来断代就比如说GPT-3GPT-4对吧但实际上我们做agent或者做系统的时候你很多时候还是在一个feature来不断去强调说这些更新这些更新但用户的实感可能没有那么强所以Netis1.5它其实不是一个突变它很好玩它只是把我们过去一系列的东西以1.5形式打包了一下其实很多新的feature都是在过去几个月中迭代去上线的但这个过程中用户就能直接体现到好像非常不一样但说实话其实1.5发布那一刻的更新没有那么大这是我们很好玩的一个发现就是你得让用户意识到你有变化用户才能真的去感受到变化这是第一点然后第二点就是Manus1.5非常大的一个技术的演进就是我们把任务完成的速度进一步提升了而且这个是一个无损的提升就是说简单点就是MADNESS1.5能够用更快的速度完成简单的任务但在更复杂的任务上去投入更多的inferencetime的一个compute这方面也是比较大的一个差别但是放到这个平均体感上来说应该快了3到5倍你那天还发朋友圈说今天MADNESS有两件大事一个是1.5发布了另一个恐怕要老了写回忆录再说了是什么事老了写回忆录再说通用agent和chatbot未来会是什么关系因为所有的chatbot也会变成agent是这样的但是实际上这个不是能力所决定的chatbot跟agent我觉得是用户群决定的就比如说对于所有人来说他可能都有chat这个需求但并不一定所有人都需要高价值脑力劳动的任务但是我会自然的想通过它去做点啥它就变成了一个可能在AI时代最大的入口这是OpenAI的故事吧对这是OpenAI的故事但我觉得这仍然是一个传播链路的问题就是首先你在打的这个用户群你所描的那个点跟OpenAI就不一样同时我们要保证就是说对于这个用户群我们能永远提供最好的体验他们的需求跟Chatbot用户是不一样的Chatbot可能很多人其实心里知道ChatGPT也许此刻不是最好的Chatbot因为实际上大家知道Gemini3可能在某些场景下比ChatGPT还要好但是对我来说无所谓因为我只是拿它完成一些就quickandeasy的task但是对于minus要打这群人他们的质量的敏感程度极高了我们做过一些双盲测试就比如说我们抽5%的用户我们悄会用另外一个模型然后就发现那块用户的用户的满意度直接就下降了所以我们其实在服务最挑剔的一群人而他们永远要的就是此刻这一个时间点上AI能提供的最高的水平minus火了以后飘过没有什么叫飘飘过没有飘就是飘人飘了不会因为我们其实每天受到的负面反馈会比正面反馈更多那会很悲伤吗也不会因为我们都是老灯中灯中灯就其实就怎么说就有点心里憋着一口气就说为什么现在我们可以站出来说这事就还就我们之前觉得说什么也没用你还得打铁需要自身硬你觉得曼德斯未来会有多大他能服务多少用户我觉得不想用付多少用户来说而是我们还想说到底对于每个用户能为他产生多少的agentichours就是说对于一个高价值用户他可能能把manus用的用量是一个普通用户的10倍这实际每天都在发生我们经常有一个用户一个能付我们几千美金为什么因为它有不断有很多的这种高价值任务要跑所以我觉得NAS追求的不是DAU这是我们很早就想清楚的一件事而是把最有高要求的用户高价值用户的高价值task做到最好体现在的可能更多的是我们的营收而不是DAU上这个是小宏的想法吗这个我觉得就是大家align后的一个想法所以你们的公司指标是营收不是DAU不是DAU这个有趣你觉得这个创业逻辑跟互联网时代是不是不一样我觉得完全不一样原因是因为公司有Token消耗不是就是两点可能刚才我们都多少cover到了第一点就是AI其实不是一个平台变化AI是一个技术增量所以其实它怎么说以前的优势是能够惯性发挥的所以其实很多场景下是传统的强者加上AI强者横强强者更强了虽然这词听起来比较悲观但是应该说强者具有先发优势且较好地利用了这一点对这是第一点然后第二点是什么就是刚才讲到编辑程度的问题目前为止AI还是更像制造业而不是像互联网這個還挺理智的是不理智早死了所以你們沒有試圖去講一個我要做就是全球第一的通用agent或者是全球最重要的入口的这样的一个股市这是两个命题我们一定要做全球最好的通用agent这是一定要做的最好的通用agent最高质量就是在当今一刻如果你抛弃一切成本或者什么东西我们永远提供最高的质量这是第一点那如果有一个人来用低价打你们呢因为你们要那我们用更低的价格打死他那他们可以不要赢大厂就可以不要营收啊大厂就不要营销哦你说来卷是吧对啊对但这个东西其实是这样我觉得对于一些用户来说他们其实价格不是那么敏感就包括现在Manus用户其实我们也觉得Manus确实挺贵的一个产品但是我们用户问我的问题你知道是什么是说Manus现在你说我40美金一个月你能不能让我看看如果我愿意付20美金它效果能变好多少所以我觉得这个mindset是完全不一样的所以就是这种定价的优化基本不在我们的路线图里嗯你们没有想要做最重要的AI入口之一吧这是一个目标吗我觉得首先一点就是可能不存在单一的AI入口吧就好比比如说现在移动互联网的入口是什么好像确实存在一些但我觉得就是对于我们所服务这个客群就以我们自己为例我们自己一定是Manus用户我们自己手机上也有XGBT这是一个当你足够的Prosumer市场的时候这些人会自己知道什么时候用什么产品之前A16Z有一个很好玩的调查就说如果你的手机上装有某些某一个软件的话那么这个用户的手机上安装另外一个软件的概率的最大异常值是什么这个书籍可能有点绕就是说对于一般人来说可能你安装某个软件的概率是怎样但是如果一个用户他手机上先装了一个软件那突然哪个软件的安装概率突然提升你发现装了ChatGVT,Cloud,DeepSeek所有这些用户他们的最大异常值全是Manus所以Manus几乎是在跟所有这些拆炮并存的一个状态当然这其实是好的解读坏的解读就是我们觉得目前Manus其实还远远没有渗透到所有我们想服务的用户因为目前还是最业内或者相对来说比较科技圈的人充分了解了Manus但这就是我们觉得我们在Marketing方面还有很长的路要走这方面我们在学习这些产品有垄断效应吗我觉得有但是就是怎麼說就是AI產品的壟斷是你能壟斷一個類型但是這個類型可能也在不斷的產生像比如XGBT我覺得XGBT也許還真算不上壟斷因為GemLite最近勢頭也很好但你能壟斷一種心智或者一個類型的心智它能建立一個品牌它能像比如說Google這種搜索引擎這種它可能一個人統治90%市場或者百度在國內XBOX會是成為這樣的市場格局嗎我不敢說但是因為就我對搜索引擎市場可能我的认知也还在我还在做搜索那个阶段我觉得搜索引擎市场非常特殊的因为搜索引擎其实一半是在内容里头就说你的数据供给是无法因为技术的迭代而去被颠覆的所以搜索引擎是一个非常容易强者横枪的一个领域对因为你已经跟太多人产生了利益的关联包括你的广告商你的内容商但是拆爆的目前为止可能还是因为到现在拆GDP也才刚好三年对我觉得还是一个比较早的一个状态比如如果你现在只是20的谷歌的话现在一切还不好说而且好像还没有产生网络效应对AI产品的网络效应我觉得是好问题我觉得没有看到任何一个真正网络效应的AI产品这是为什么因为所谓的网络效应我觉得更多是你能有两种吧一种叫buildonsomeoneelse'swork就是说你能基于其他人的产出进一步的去贡献这是一类然后另外一类可能就是完全是由于用户关系所带来的网络效应但这些东西其实在这两个层面里AI似乎都是附加值对不对AI是附加值对附加值不知道加了它为什么就能进一步的连接人类没错或者说AI不是产生这两个要素的关键点对AI是能夠幫你提效能夠幫你完成任務能夠給你產生結果產生交付那可能新的網絡不是人和人的是AI和AI的或者人和AI的哦要這麼說的話我覺得是有的就包括我剛才一直在強調一個詞叫比如說基礎能力或原子能力的網絡效應就刚才我们讲过Manus其实增加能力是非常谨慎的但是我每次都要保证就是这个能力能跟别的能力形成组合拳用了组合拳这个词就是什么意思呢就比如说最早我们给Manus加入了一个看图的这个能力看图能力其实一开始想法很简单就只不过是说希望Manus能看一看这生成的图好不好但后来我们发现加了看图或者多媒体输入能力之后Manus开始自己学会去检查自己做的网页是否能玩得通所以就是你增加一个基础能力同时能跟你所有通用的agent这个水平别的能力之间产生交互这种叫做可能能力原子能力的网络效应这是我们已经观察到了就是你可以让你的agent能力以一个指数形式提升这是第一点然后第二点就是如果你说agent跟agent之间的网络效应的话那看怎么解读像比如说我觉得Manus的wideresearch就是我们这个广域搜索能力其实也是一种也许是agent之间网络效应就是一个agent可以调度很多别的agent他们也之间还能互相通信去共同完成一个单独的一个agent无法完成的任务然后另外当然也有些人在尝试就是说让agent比如说加入到人的协作的上下文中这我们也在做一些测试比如说manus现在能跟slack打通它能带来一个比较好的一个点就是很多时候我们的讨论是不带着AI的但实际上更多的讨论都是在人与人之间去无形中产生的这块可能就是agent跟很多人之间的网络效应但目前来看这可能还是因为偏专业吧没有大家想象中那种就是爆发式的网络效应然后如果你说就是像比如说agent之间社交的这个形态的话那我觉得这可能不像是我们这种就是做prosumer市场的人所能看到那可能更多是偏娱乐这个领域就像我刚才讲的就是让agent代替人去社交这可能也是一种网络效应如果一个公司要做某一种agent他可能希望被minus调用你对他有什么建议我觉得这个东西其实你不需要为manus做任何的优化这是我们非常坚持一点其实是这样你看现在我们觉得做agent最大的难点是什么我们可以反向来思考这个问题是因为就像自动驾驶一样自动驾驶是物理世界所有的基础设施是为人而设计的而现在赛博世界所有的这些基础设施包括网站、网页或者各种APP、API都是为人而设计的所以我们想法是我们不能指望一夜间世界就为agent做好了准备而实际上我们应该去不断的让两侧相向而行比如最简单一点就是现在大家有了MCP这个概念但实际上MCP也面临诸多的问题比如说生态不成熟很多就是开发者提供的MCP服务本身质量就参差不齐且大部分的服务其实是没有MCP的所以Manus的选择是说如果有MCP当然很好我可以用MCP但是别忘了Manus是一个通用agentManus如果一个程序员能通过API的形式去调用一个服务的话manus可以去自己学习这个API文档然后自己通过API来使用如果再不济你这个服务连API都没有那你总是给人用的吧那你大概率有个网页那manus会再一次降级通过浏览器去模拟人的方式去使用这个东西所以我觉得对于第三方的agent来说你不用为manus或者说未来的通用agent做任何的适配应该是我们去适配你们agent的网络可能会形成成什么样agent的网络我觉得这个词很大就是我知道OpenAI有一个它的L1到L5的那个图但我觉得这可能只是OpenAI的观点吧可能不算是一个非常共识的一个事我们可能还是从更务实的一个角度去出发我觉得就是如果你考虑agent有更多的proactiveness就是它的主动性的话那agent的网络可能会形成就是相当于有一部分垂直agent它其实掌握一部分数据性的差异比如说有些数据只能在某一个垂直agent那里获取那可能我觉得它的网络与其说是一个就是全联通的网络更像一个星形的就是说星形的星形就starstar对就是说它有一个调度者有点像你刚才说入口那个概念它的利用不同的agent对但是呢它可能难以形成一种完全互通的这种全联通的网络所以通用agent会成为那个入口我想是的为什么会是这种结构你觉得因为就还是刚才那一点就是如果你做的是垂直agent你再做一个工具如果你再做一个通用agent你再模拟一个人所以做垂直agent应该是为像Manus这样的公司做为agent做还是为人做我刚讲这就是两条路就是如果你想做一个给专业人士就刚讲的就是你如果想做一个剪辑agent且为现有的剪辑师去做的话那你就做的非常垂直非常专这是给人用的但是如果你想做一个为非剪辑师但有剪辑需求的人做的产品你可以考虑做一个非常简单易用的界面同时也暴露出足够多的API然后我们一起把生态给做好对不起API或MTP你说你坚信纯血派agent什么叫纯血派agent对就是agent这个词的定义其实就是一个很含糊的一事我觉得大部分时候大家会把两个概念混在一起谈一个叫做agentworkflow一个叫做agent这方面Thorpic有一个blog写的比较清晰就是说很多人说agent要追求一个稳定性的话那你可能更多的是在一个workflow的方式去做agent但在我们眼中这个不叫agent这个就是workflow而我们认为什么叫纯属的agent就是说它其实没有人为家的约束而是说完成一个任务的所有的过程和方式是由智能本身决定的这个我觉得它的天花板会非常非常的高当然你跟现在此刻来对比的话可能agentworkflow的可复现性会好一些但是我觉得这是一个可以解决的问题所以我们非常坚信就是要做纯写的由智能主导的agent而不是以规则主导的agent的workflow这才是更符合我们刚才讲的betterlesson的这一个事用通用的方法投入更大的算力去解决问题而不是加入更多的人为的知识这在你的实际工作中有做过这样类似的选择吗有的有的有的这是我们每天都要讨论的事就是可能比如舍弃过什么其实舍弃的东西非常多我举一个比较简单的例子就是说你要让一个agent做数据可视化工作对吧那么比较简单的比如产品驱动的纯产品驱动造法应该说好那我要保证所有语言下的数据可视化的效果非常非常好你不能因为有不同的语言而产生比如有字体乱码这些问题这时候他可能把这个写成一个叫sub-agentstool或者说你写很多的单独的prompt就是说当你要比如说数据可刷的时候你得注意什么东西写一大堆的guardrail你每增加一条约束其实你都在减少模型的diversity减少模型的一个一个多样性那这是我们做法是什么呢其实就刚才讲的我们只不过是加入了一条查看图片的这个能力而这样的话我们期望的是什么是智能能够通过自己查看这张图自己发现说哦我原来有字体这个字体选择的错误导致中文渲染失败而去修改这张图这样我其实解决的不是一个问题比如说他还能检查到不行我画的这个图表它其实有两个元素重叠了那其实能够去修复它所以这样的话你应该能变成一个从打鸭子那种在堵缩的漏洞变成一种你在让智能的泛化性在帮你解决更多你还未发现的一个问题所以我觉得这是纯血派agent的一个思维方式当然你做这种直接去修补这个事永远很有吸引力的而且这更符合传统软件工程和产品经理的直觉那這時候就是我要站出來的職責就是攔住所有人不要這麼幹你還說市場上關於agent的做法都是錯的展開講講没有都是错的像刚才我讲了一点就是很多人过于执着于让agent模仿人类的分工这件事我是非常不认同这一点对我就说不要把人因为生而为人的限制搬给agent你应该站在模型的角度去思考问题或者说我们在做产品的时候经常说一句话如果你真的是在做一agent你同时在做两个产品一个是给人用的一个是给agent用的而这两个东西的思维模式是不一样的但你就需要一个很好的技术架构把两者融合在一起给agent用会是什么样的对不起给模型用的给模型用的会是什么样的就这么说模型其实它的思维模式跟人是不一样的或者说它根本就不是人而人的话你是因为你有些先天的训练所以说我是一个设计师我更懂什么我是一个程序员我更懂什么但讲真大家用的模型现在其实都是一个通用的LM这块其实这个假设就是错的对吧其实你应该做的事情是减小他犯糊涂的概率而这块的话你的做法不应该是说我赋予你一个人格你怎么怎么样而你应该是通过一些contextengineering的技巧比如说可约束解码actionspace的设计这些技术来让他更好的去完成他自己分内的事但又不让他丧失全能性这我说的可能有一点空泛但是可以参考我之前发的各种文章所以把agent的人格化是一种人的自恋对是的这也是TheBitterLesson里面说的是吗TheBitterLesson里有这句话好的我给大家读一下这个那他同意了你們的組織有發生過變化嗎麥納斯出來之後有的而且我覺得這個其實不僅不該說叫變化吧就是我們也在探索一種新的可能性因為其實在此之前也沒有所謂真正的那種就是就纯粹的agent公司然后我们觉得现在我们结构的话可能有几个比较特色的点可以分享一下就是比如我们现在还是大部分都是研发但是团队的话会比以前的这种软件开发会更奇怪一点当然你传统的比如说移动端前端都在然后后端商业化这些都有但是我们会有两个很好玩的团队一个团队叫做sandboxteam其实就是负责虚拟化跟运行环境的团队他们要维护的是一套给agent使用的操作系统这刚才讲的就是负责给agent做产品的一群人然后另外还有一个我们就叫做agentteamagentteam由所谓的agent工程师他可能负责的就是说整体架构的开发然后还有一部分是evaluation就是评估团队还有一个很小的researchteam这三部分人共同组成了一个agentteam这个大概有十几二十个人我觉得这个就是AgentTeam跟SandboxTeam可能是传统意义上来说可能会被融入比如广义的后端研发当中但我们后来发现他其实比较不一样因为他在做的这个事情不是面向人的是面向模型的一个工作他们的工作主要会包括哪些我们意想不到的意想不到的我觉得对我来说当然都是意想得到的事情但是我觉得有几点吧就是好像Sandbox团队在做的事情更像是在教一个不會用電腦的人如何更好的用電腦對而這個agentteam在做的事情其實是說如何設計一套稳健但统一的架构让我们能够持续的跟上模型的进步这个其实是很有意思的一个话题就是因为模型进步的速度真的非常快可能如果你考虑到不同厂家都在迭代那基本是一个以周围更新的一个变化那agentteam它主要的工作既然是agent的框架那我们如何去保证能跟上呢所以我们自己有一套比较好玩的方法论我们叫做弱到强的衡量这是什么意思呢就是你其实整个agent中你有两个外部变量对不起不要外部变量就有两个重要的变量影响你的质量一个是模型一个是agent框架那这块你要做消融对比就ablationstudy那这块的做法是什么呢因为模型的未来的变化我们要保证每一次模型迭代我们的框架能够受益最多我们做法就是说我们先把一个当前版本的Agent框架进行锁死然后选一个同源的模型家族比如说同样你都选择Gemini或者选择Cloud你拿它的弱版本跟它强版本进行对比跑同样的Benchmark然后你不断调整你的Agent框架来让它之间的Delta最大这样的话我们能够希望当下一代模型变强的时候我的获得的增幅是最大的这块就是我们的AgentTeam跟EvalTeam要经常关注的一个点文化有变化吗文化的话我觉得有一些就是可能从Monica那款产品它是一个非常大而全的一个产品当然就是Mendacy很全但它的做法不是说在单点击破之前可能更多是觉得用户有需求我就要去做我的做法是用一个最快的路径点到点最短的一条路去实现而Mendacy其实我们会有非常多的考虑就是说你这样一条路你是能走通但你有没有跟别的原始能力产生网络效应所以现在我们做每一个新功能前都会非常非常的慎重而是要保证说每新增的一个单点的能力又不是一个单点这句话说的好绕就是每增加的一个新能力都能让系统整体获得一个收益所以是一个非常的节制的一个状态这跟以前心态很不同你们放弃过什么feature没有放弃的feature我觉得非常多比如说像很多语音相关的事我们其实都放弃了为什么语音输入当然我觉得很有用但是比如说这种语音的输出或者主动调用一些东西我们觉得首先这类东西不一定要由我们第一方来全部做完因为我们跟大家不是竞争的关系比如说我自己我会直接让manus连接我的granola跟notion我去使用这没有问题然后还有一些功能就比如说像生图跟生视频虽然我们有这个功能但我们没有非常非常的大力的去优化它因为我觉得这个东西是一定会做的很好的一个基建上面的事情我们没有特别多差异性的事我们没必要非常深入的去做然后更多的这些事情其实我们都是以一种非常开放的心态去做就是如果这个通用agent靠自己的泛化能力就能解决的话那我们没必要去专门去做这件事因为我们很可能投入不够却给用户做了一个次选这个是不好的因为别忘了我们用户是最高价值有最高要求的用户他们值得最好为什么你一直在强调你们跟所有人都不是竞争关系因为我觉得这是事实这就是我们做海外市场之后发现的很好玩的一点就是他们可能因为之前SaaS领域做的实在是太成熟了所以就是不同服务之间的互联互通既是一个技术层面的事其实也是一个你可以想涉及到branding的一个概念就比如说我们经常会跟比如像Notion跟Microsoft还有别的这些创业公司我们一起做联合的一个发布因为很多时候都是一个当我有一个能力你有个能力的时候当这条鞭连通的时候它产生的价值是非常大的而且难得作为一个通用agent我们一次性能串接多个服务像我们刚才讲到的我自己的使用场景是Notion、Granola和Ashby三个服务之间Manaspot它们都串在了一起所以我觉得与其跟每一个竞争你去做一个比不过别人的东西你为什么不让大家一起去做呢这个我觉得就是我们获得了很大的一个从Monica学到的经验就是如果你要做很多单独的feature做起来一时爽但是你要维护它并保证功能是长期有竞争力的是很累很累的那可能会导致你的团队无限膨胀所以这是一个不好的事情应该去充分利用这种别人做好的东西并产生一个synergy而不是去跟别人直接去硬碰硬你过去这大半年做最重要的几个技术决策是什么你作为首席科学家我觉得有几个第一个就是我们没有盲目的去追reasoning这条路就是刚才讲到的就是其实你按现在比较朴素意义上的reasonmodel你会导致instructionfollowing跟多靠hallucination的增加所以这个是我们当时做的比较重要一点我们用了一个比较另类的方法就有一个单独的planningstage来做的这个事然后还有一个比较大的一个点是我们对于MCP的决策是非常保守的这个其实MCP出来之后整体业界都非常的嗨然后很多人就开始去接但实际上我们当时觉得这个会严重污染你的actionspace而且会导致你的这个缓存命中率就是因为你每次你去动态发现工具和这个和卸载工具都会导致你这个缓存命中率下降而缓存命中率下降会严重影响你的成本所以当时我们也是花了一些精力我们去研究了一套就是不在原生actionspace内的MCP调用方法这个后来当然也被Anthropic写成了博客然后还有一些像我们其实整体对contextengineering做了非常多的工作而且这块我基本全都给共享出来了像比如说对于文件系统的使用什么这些东西对我觉得就是一些连续的技术方面的决策我觉得没有哪一个是最重要的一点对因为我觉得做agent其实跟虚模型很像就是你其实更重要的是做对10件小事而不是做对三个大事你有后悔的决策肯定也有比如說但我覺得後悔的可能都是更細微的一些事就因為我們調整的非常快所以很難形成真正後悔的東西對模型就是在模型決策上你有什麼後悔的決策沒有在用模型還是遜模型是有一些比如說一開始有點太盲信小模型其實參數量還是最重要的還會盲信小模型對因為當時其實有一點是這樣的一個假設就是說对待会可以换一个方法来回答这个我先说完这个吧当时的想法是agent其实能更高频的与外界进行数据和环境的反馈的获取我们当时想是不是有一种可能性就是小模型跟大模型里头一部分参数量都用在了参数化的记忆或者知识对agent来说是不是参数化知识没有那么重要而如果你小模型有足够强的工具使用能力的话知识是可以动态弥补的但后来发现怎么说实验结果是不是的但我们在反思为什么也许是这样你很难去完全分离什么是知识什么是记忆哪些是泛化能力哪些是参数化的背板后来发现这是不现实去区分的所以大参数量还是有用我听过一种说法就是说他们觉得minus只有你一个是研究员或者说你的研究工作是独立于所有人的他们觉得这种研究员的配置和管理方式或者组织方式跟不上现在全球frontierlab的竞争我觉得这个问题首先它的一个基础假设是错的不止我一个人我们是正常招researcher的另外一点就是说我觉得首先有一点是跟上所有frontierlab这件事是不成立的就是我们的目标不是说要跟上所有frontierlab在模型方面的工作我刚才一直在强调一点就是说我们跟至少现阶段跟所有frontierlab还是一个共建的关系或者用一个更公义的角度来说是我们成功的把模型训练这件事外包了出去那么这样其实就是用户给我们的钱同时服务了用户且让我们有影响力让别人帮我们去模型我们内部research团队更关注的其实是一些非共识性的东西包括其实很多contextengineering方面的工作是要做大量实验的这些东西不是一个怎么说就是纯靠工程能解决的事你前段时间在做onlinelearning这个有没有什么可以分享的是的就是首先onlinelearning这个词它现在的解读有狭义和广义的就是现在狭义上的onlinelearning大家可能会比较关注说到底能不能通过持续的改变参数而获得一些改变这是一个严格上的定义但实际上onlinelearning我发现现在大家把三件事混在了一起第一种可能就刚才讲的这是狭义的onlinelearning第二种应该是masspersonalization就是大规模个性化第三种其实不是online的learning而是更像我上一代创业做Maggie的时候我们做的应该叫continuouslearning或者叫lifelonglearning这三件事解决问题是不一样的比如说你如果要做这个masspersonalization就是大规模的个性化的话其实你并不一定非要用一个参数化的方式去做比如说你可以像我们刚才讲那种基于用户的协同的一些行为的模式来比如说甚至你以prompt的形式去动态注入一些东西通过in-contextlearning的方式让模型的行为发生改变这样其实更高效的因为如果你对每个用户即使你比如很小像那个multilayer解决方案其实你也让每个用户有一个不可复用的参数在那里头那么你的推理效率可能会变得更低虽然我看也有些解决方案像ASLORA什么PUNICA是吧还是什么东西我有点记不清了比较老的几个工作他们号称能够解决batchsize这个问题但实际上你的推理效率其实还是降低了的因为很多时候你需要规模效应才能降低成本和降低latency所以我认为就是masspersonalization就是大规模更新化你不一定要以onlinelearning或者以参数化的形式去完成这是第一点第二点就是说到底是要持续学习还是说在线学习这个我觉得是一个非常大的一个区别这个更多是看你的目标是什么如果你要建模的任务是一个理想分布随着时间而改变的情况那你是要做持续学习的比如说我很难想象哪些领域可能像金融市场也许是这样的就是说今天的正确答案不一定是明天的正确答案那我觉得你作为一个作为一个真正online的learning是很有价值的但实际上你看现在一些所谓的onlinelearning的practice其实我觉得它只能称为一个onpolicy的持续学习像比如说举例有一些codingagent的公司他们在说我能通过持续在线去收集用户的一些接受率和reject接受和拒绝率来优化一个比如说type补全的准确率但你看这一个任务其实并不会因为时间的改变而影响它的理想分布这样我觉得你其实只是一个onpolicy的数据收集并周期性的在优化你的模型这个更像我们之前就之前做Maggie时候做的这个事情但你会发现如果你的任务本身不具备这种动态性能其实你很快会让这个Benchmark去你去Sortrate它你会打透这个Benchmark所以它不是一个有持续提升空间的一个事情对所以我觉得这个东西还需要去持续去看我没有看到一个非常值得我们在Agent领域立即下注的应用你觉得Agentic的模型应该怎么选你觉得给这些模型厂商什么建议对我觉得刚才已经提了几个了第一个就是与其充分的去无限的去扩展contextwindow不如让模型学会这个compassionawareness就刚才讲的就是让模型意识到自己的上下文可能会被压缩并做出更好的一个选择更好地了解文件系统该如何去offload跟retrieve这是第一点第二点就是刚才讲的关于这个reasoning的优化的目标不要以这个比如说这种纯纲中指导的形式去做你应该去考虑到如何更好地去结合这个observation或者有个词叫TIR叫ToolIntegratedReasoning就是有工具集成的推理这个是一个非常重要的一个方向它跟这种完全靠这个RLVR去解这个竞赛编程和数学是完全不一样的一个思路第三点其实可能跟agent的工况有关就是在chatbot场景下永远是用户跟模型交替执行这样的话就是用户跟agent应是你等我我等你你等我我等你而Manus其实刚出来的时候有一个让大家都觉得非常新奇的一个体验就是说agent在持续工作的过程中用户可以随时插嘴要么是改变目标要么是补充信息甚至去终结它这个其实很多模型还没有完全掌握这样的一个交互的一个模式它可能跟用户是处于一个异步的一个空间中对这也是我觉得非常值得去做的第四点就是我觉得模型应该更关注一些errorresilience就是说对于错误的处理和恢复能力对这个东西我知道在agentcoding领域其实已经有了一些更多的关注吧因为其实如果你把agent部署在真实环境中就是错误其实是一个常态因为可能来自于比如环境的报错比如说系统一定会有问题资源受限或者你写的一个代码会报错但实际上有很多是非代码性的错误就比如说你在做一个slides或者在做一个批量文件处理的过程中你会遇见很多意料之外的事情发生而你发现有些模型它可能要么会放弃掉要么它可能会甚至陷入一种类似于死循环那个状态但最好的模型应该是它永远能找到一条别的路去尝试这个是需要专门去训练的一个事目前我比较想强调的就是这几点你的微信为什么一直叫微信小助手我觉得就是一个娱乐精神而且很早的时候就叫了这个名字当然就想看一看就是有哪些跟微信官方很像但是却仍然能被使用的ID最早想叫文件传输助手但是意料之中的不能用然后后来当时因为微博的那个官方号叫微博小秘书所以我就试试叫微信小秘书然后后来腾讯也果然禁止别人再叫这个名了然后那我觉得很好就保留了嘛这次创业跟你之前两次有什么不一样的地方我觉得首先现在创业的成本比以前还是要高不少的高多少直观感觉因为之前刚才讲的就是你如果做移动互联网的话其实你的边际成本很低但现在的话其实上来就是挺重资产的一个投入比如从曼德斯上线第一天起那基本就是几十万美金几十万美金在收对所以这是第一点然后第二点就是我觉得这是一次让我们充分的参与全球竞争的一次创业然后我们甚至经常内部开玩笑说就是有一种从CBA打到了NBA的感觉然后确实就感觉可能我们之前哪怕在做Monica的阶段经常会觉得好像我们做的还不错了然后到现在的话虽然我们就是说MADIS现在可能已经10个millionAR了但是如果你在横向看同样的这些各行各业的头部选手的话我们好像又不算什么就可能这就是一个NBA的平均水平所以就觉得还是在学习中过去一年对RAD有什么新的认识吗对RAD的新的认识对小红我覺得是比較符合預期的就剛才講到情緒依然很穩定但我覺得可能更多了解就是我覺得即使像他這樣可能比我經驗更豐富的連續創業者其實在很多時候還是依然會有很多人性的脆弱就比如說我們經常講好像我們不在意或者怎麼樣但其實有時候聽到一些東西大家心裡還是覺得挺尖銳的然後小宏可能沒有我那麼沒心沒肺他很多時候還是比較容易受到這些事的影響他会不开心对吧他会不开心甚至就是就很着急对我觉得这也就是团队在一起的好处我们可以互相分担一下痛苦虽然小红经常说一句话就是说接下来一段时间我可能很抑郁你们不用帮我但是谁会真的就放他不管的对吧他反而情绪不稳定是吧不是不稳定就是他的情绪是稳定但他很容易就是低落对他不会那种就很忽然怎样他没有我刚讲那个就是艺术家那个问题对但他也是比较容易受伤的一个更感性一点对是的其他团队其他几个成员呢我觉得你们之间是什么样的协作关系啊我觉得是这样就是大家其实在共同的话题上讨论能非常多因为刚刚讲的就是每个人其实都有很综合的经验但实际上现在的话大家因为数月有专攻嘛比如跟涛哥的合作就会非常有意思就是涛哥其实真的现在是我们觉得是他出差胜迭就是经常要去全世界各地去参加一些比如跟合作伙伴的活动这些东西所以涛哥更多是给我们带回一些比较新的方向性的内容我觉得这其实可能是做CPU这个角色的最高境界他其实是不仅是一个对内的产品的指导更多的其实是一个对对整体行业有产品洞察的输出并带回了来自交叉的观点带回了交叉观点回到给我们所以其实涛哥很多时候给我们是一些非常宏观的一些建议但是很快都能落下去比如刚才讲的wideresearch也是涛哥在飞机上就是他综合了很多不同的想法之后我们一起讨论出来的对然后像更多的像别人就marketing这边我们可能觉得我们正在有一个比较大的思想的转变之前或者过去一年中我们经常觉得madness是一个Ninus的增长是我们叫内部开发者踩着西瓜皮其实我们几乎就没有什么定向的增长的动作这可能也是我们刚才讲的让用户自发选择的一个负面作用就是说我们从没有引导过或者说我们想获取哪一类的用户完全就是什么用户用我们就服务他们但实际上如果你从一个获客和增长的角度来看的话这样好像不是非常的主动或者说不是非常的可控所以我们觉得我们接下来有一个转变可能更多由产品驱动踩西瓜皮变成一个服务我们的增长去做很多的功能性质的东西这是一个比较大的一个变化对然后像内部运营的话我觉得这一直都是贯穿始终的没有什么跟别的公司有特别不一样的点吧产品和模型谁的话语权更大产品和技术在你们公司产品跟技术我觉得是这样就是我们首先明白技术是要服务于产品的但是技术基本对很多事是有一票的否决权比如说就是刚才讲到比如说产品可能会有一些非常诱人的快操猛的做法像刚才讲到的就是一些事情你是否要放弃纯血液征这个想法而采用一种比如快速的一种fix但这种情况无论是我还是技术都会站出来直接阻止这件事发生那你们大概是产品两票就是Red和张涛然后你和潘潘是技术两票不我们非常反对投票这个概念因为我觉得投票这件事其实是在异化团队就是因为如果不同的观点的话那大家可能会为自己的观点去服务你应该看的是目标而不是就是投票的一个手段大家如果目标是一致的话那你一定能去达成一个共识但不是通过就是明确的去站队去投票所以我们几乎不会搞投票这个事你们就是讨论谁会更强势一些呢其实讨论的过程中没有人强势但我们会期待Red来做一个最终的一个拍板所以讨论的价值我觉得不是说讨论出一个结果而是说更多的人提供出更多的方案就刚才讲的Alternatives就是一件事其实如果目标是确定的话你有越多的可选方案越好不一定是就是你要想办你想出一个最高质量的要不然的话你供给大家做决策的选项都不够多现在这个公司是10人之前两公司的团队大概规模多大我以前带过最大的团队也就10个人左右第二家工资10个人是的你觉得AI时代的公司的组织方式和协作方式发生变化就是组织组织有没有变化我觉得组织的话变化其实可能没有大家想象中那么大但反而组织中多了很多的AI这其实也是我们比较在主动引导的一件事就是像我们公司有一个很优厚的一个条件就是说如果你使用任何AI产品不只是Manaso比如说你使用别的第三方AI产品我们都尽量全都报销我们非常鼓励就是程序员比如用各种coding的agent然后对于非程序员的话你有各种能提效的工具你都全都可以使用因为我觉得作为一家AI公司你首先得让员工去了解现在到底发生了什么业界的前沿是什么东西所以我们觉得与其说是整体的就组织结构变化不是发现更多的人可能让他自己有了两倍十倍的生产力的提升但他并没有还没有到一种就是AI能够替代那些岗位的一个状态你是不是不喜欢管人我非常不喜欢管人我一开始就说了这一点我觉得管人很痛苦你为什么不喜欢管人就是人的这个复杂度比AI还要高而且就是人的复杂度其实是怎么说呢会随着人数增加还是指数级增长的一个复杂网络但其实程序你写的好的话你有足够好的这个设计模式的话整体的复杂性的增长是可控的我觉得你性格很开朗你为什么不喜欢管人因为你除了觉得人复杂还有什么原因吗我觉得就是他是很占用我的带宽的因为我觉得就是我的体力其实挺差的没看出来我只是跟你聊的时候能聊的比较多但其实我体力是挺差的就是如果我一天我把更多的时间花在了就是管人或者说广义的非技术层面的事的话我每天我的有效的输出就会变得少很多而现在的话就是我认清了一件事就是与其去弥补自己或者去补强自己哪方面的能力不如把这方面能力外包出去还是自己做最擅长的事是要么不值得你觉得AI时代能帮助人更好地做做人吗我覺得一定是可以的如果用一個最極端的想法來講我們不喜歡的事都被AI所取代的話剩下的東西其實就是人自己很多時候大家對AI的恐懼有點像比如說當年紡織機被發明出來之後他們會擔心說如果有那麼多紡織集團紡織女工是不是都要下崗了但实际上确实是很多人不再做纺织女工但他们获得了全新的工作和全新的生活对吧甚至你也解放了很多东西我觉得现在就是大家对AI的这种恐惧和人的取代的核心恐惧在于你AI用的不够多我觉得就是像以前比如有了汽车你能去更远的地方在10年前你可能要学会用电脑才能找到更好的工作现在我觉得就是学会跟AI共处之后其实没有那么多的恐惧反而是给你解放了更多人的一面你对于10年后的agent或者AI的世界有什么想象我不敢想象因为我觉得我们的事业只能有三个月的事业三个月后呢三个月后我觉得首先大家在proactiveness这件事上会有很大的一个进展就是头一次可能让人跟AI交互的时长变短但是产出价值变高第二呢第二的话我觉得应该还能看见一次较大的成本降低这可能像cloudopus4.5已经给大家一点曙光你怎么看现在的大模型产品的SOTA的排名一直在变我觉得这个是一个比较意料之外的一个事情就是因为国内或者说开源的我们先不说吧就说像国外这个头三名就是OpenEye,Anthropic跟Gemini他们其实之间我一开始预期是可能有人会掉队因为当时我是用一种比较朴素的思想在想就是到底谁掌握硬件或者谁掌握scaling但目前来看可能就是因为大家还是在一个比较分化比较diverse的方向在努力但是实际上你的排名最后衡量的其实是一个综合的体验所以如果你仔细看的话他们可能其实是通过一些长板来拉出了一个平均值较高对所以我觉得这个是确实跟想象中不太一样但是这个事这么看来可能也会再持续一段时间你觉得模型的竞争什么时候可以看到终点我也没有终点模型竞争没有终点这也是为什么我不做模型产品的竞争有终点产品竞争也是没有终点的什么时候会有一个相对的稳态移动互联网可能到什么时候稳态是当真正已经用户的时间被瓜分完了之后出现了移动互联网的稳态可以这么说吗好像是对但是我觉得现在AI的有限资源是什么AI目前至少我们努力的方向是不占用用户的时间而为用户创造价值所以这一个约束条件消失了那什么时候会达到稳态呢那是因为你们做的相对还是傍人体校的还是工具类的产品对吧当然你不想说你是个工具不或者说不是因为是工具类而是因为Natus或者说Agent它其实是在减少与用户直接交互的时间但在持续后台创造价值所以就是说人的跟产品交互的时长不是一个有限的约束条件像之前比如云流互联网时代无论你做哪一个类型的产品你都绕不过你本质上在跟抖音竞争因为抖音吃了很多用户的时长但现在我觉得AI是不一样的但AI时代肯定会出现AI时代的抖音就AI时代让大家更好的娱乐产品对但是我就说你娱乐时间你可以多花在这个AI的问题上没有问题但实际上因为你能调度很多异步的agent大家都在跟你不交互的前提下给你提供价值你也会为它付费所以我就说它不会因为用户的总注意力时长而产生一个瓶颈导致稳态所以我现在还没有想出来就是AI时代到底什么是产生稳态的那一个约束条件你觉得今天在这个AI的浪潮的哪一个时间段特别像你过去创业哪个时间点我觉得有点像2018年2018年就是因为你刚才的一个约束条件说更像我上次AI创业的时候的那个阶段就是现在大家可能看到了像当年Transformer出来之后的那一阵疯狂然后Bert给大家带来了第一批应用的落地但实际上现在也暴露出了当前范式的一些你不能说增长乏力吧就scaling肯定还是有用的但是大家一直在期待一个下一次的节约性的变化但是2019年的GPT-3可能是我心中的那一个节约的一个点你觉得scalinglow停止了吗我觉得没有停止因为scalinglow你要看狭义的scalinglow其实不是大家想的那么复杂你关注的只是loss曲线我觉得这个东西肯定还是能降的广义的呢? 广义的大家就经常觉得说我固定就是比较投入多大的算力算力基本等于你这个模型参数成立一个token训练的token量嘛大家就期待说我加多少倍之后能解锁多少新的场景这个东西我觉得是很难保证的因为你不一定就说你模型在翻多少倍之后就以前没被发现的能力就涌现出来但实际上现在我们觉得即使模型能力没有解锁全新的使用场景现有很多的场景你的质量其实也是不够的但是其实对于用户来说质量往往可能更重要这样的话你做产品的团队能把这事进一步去深挖所以就是agent我觉得当前很大的问题不是说有哪些需求没被满足是它的完成质量还需要提升这个costscaling一定是有用的那明年agent会爆发agent已经爆发了已经爆发了agent已经爆发了只不过就是我觉得大家可能没看到那种就是想象中那种就是一片勃勃生机就可能冒出很多东西为什么呢我觉得就是agent现在处于了一个状态就是我刚才讲的就是场景大家都在挖但其实每一个场景可能都还差一口质量的就差一口气这一口气可能是质量决定是完成度决定是模型能力决定的吗我觉得很多方面既有模型能力也有你这个环境的适配你的context如何获取以及整个这个东西是需要一个就是整个ecosystem去共同去进步的像我刚才讲的你在使用agent过程中很多时候是一些人为的制约比如说你被cloudflare就是那个人机验证给拦住了或者说有些网站他就是不想让这个agent来访问所以这块需要很多的一些非技术的场合因素去合作但是这块目前也看见很多很积极的进展像比如我们最近stripe就在做agent的支付这些东西如果能有支付在其中的话其实很多东西会变得更顺畅一点所以206年agent会进一步爆发我觉得一定是的在你眼里的agent公司除了你们还有谁做的比较好我觉得做agent的公司非常多像比如说你如果看褚裕的话像Sierra,Lagora然后Coding那就更多了嘛Coding我觉得目前几家像Replit然后包括Loveable,CloudCode我觉得Coding领域真是强者如莲还有Cognition他们也都很强然后更多的我觉得C端的agent目前看起来不够多因为真正目前做C端的agent可能还都跟我们一样是做提效的而提效他们还是褚裕的对所以刚才只是举几个例子吧2026年的agent市场会有什么变化吗? 更多C端呢? 我觉得不一定是更多C端的我觉得应该是渗透到更大的人群对就是目前来说agent还是一个怎么说呢对很多用户来说也许还是一个buzzword还没有那么多人真正用起来但目前比如说Ninus1.5之后我们收到很多用户的反馈我让我觉得最开心的一个就是说他觉得这个版本越过了生产力工具这一条门槛就因为之前大家会觉得agent是帮我提效但它不是我的主要生产要素但现在很多一些很多用户真的就在拿Nanus1.5来作为它的工作的主力应用来帮它产生收入这我觉得就是形成一个更健康的一个飞轮接下来我觉得会有更多的应用迈过这条坎我刚刚听你讲我觉得非常乐观你心里的隐忧是什么对于Nanus我觉得我心里对Nanus最大的隐忧其实是失去特色这是最大的一点但是这是从外看而从内看的话我其实最害怕点是manus变得复杂这个其实是怎么说是一种要克服很强的吸引力的一件事因为你在产品增长的过程中有一个很便捷的方式是做更多的功能但是我还是就刚才很相信给他们那句话就是你每增加的一个东西都在稀释所有别的东西所以我希望Manus能一直保持这样一个克制走下去但是你又不能因为保持克制而影响了持续的增长所以我觉得对外和对内最大的隐忧就是这两点你觉得Manus会死于竞争吗死于和大厂的竞争我觉得不会或者说其实死于竞争的时候你其实产品已经到了一种非常好的状态像大家比如经常说我担心Cursor会不会怎么样我担心Lagora对不起我担心这个Winsor会不会断供拜托你能考虑被断供你产品已经是一个非常好的一个状态了对所以我觉得Manus更大的可能性不是因为竞争而输掉而是因为但是你也可以說是競爭吧就是當你失去了獨有的價值之後用戶這好像也算是競爭了那我回答是對那是有可能因為競爭而死掉你怎麼看待海外那幾家模型廠你说那个OK,我觉得其实也不止这几家了像OPENAI的话我刚才已经comment的比较多就是很尊重他们的文化但是接下来他们也是产品会很重的一部分那就不知道他们能如何去调节这两方面吧就是大家他们也知道就买模型乐透这件事是不靠谱的但是那你又如何尊重就是一个researcher的研究自由所以我觉得这是他们要搞清楚的一个点当然也许他们可能就会分化成两个完全目标不同的公司也是有可能的Antarctic我觉得他接下来他最近不是刚拿了两笔很大的融资吗我觉得他们可能接下来需要多在算力方面有一些投入因为这几家目前他们可能在这方面建设稍微落后一点对但另一方面他们可能在开发者的社区中的一个影响力是非常强的因为你会看到其实包括MCP还有Cloudscale这些事都是Antarctic在带节奏所以它其实是有一个开发者社区内的根基的所以它能一定要以这种形式去做一些怎么说呢它独有的事情而且我觉得它的优化目标跟OpenAI也很不一样Anthropic它其实我觉得它关注点叫做高经济价值人物其实跟Manus的关注点比较相像就到底哪些东西能够产生足够的经济价值它就去优化什么而不是以一个比如说我要加强reasoning这样的一个比较researchtopic去作为引导这是Anthropic的特点然后Gemini的话我觉得它现在是一个非常好的一个状态一方面就是他们在pre-training方面不知道解决了什么问题让大家看见很大希望Gemini3我觉得最大的一个给大家带来的正向信号就是强有力的证明了pre-training还是可以继续的然后另外一点就是他们在多模态和数据方面的积累这是Google本身就非常强的一点而且Google的话它除了自己的模型方面的话它其实自己的索引就包括Google搜索引擎这是他们跟别人相比持久的一个一個差異這個東西別人是難以通過技術去追上來的所以我覺得Google可能在信息方面和多媒體方面會持續的領先然後XAI的話我覺得它是另外一個很好玩的一個狀態我覺得Elon他已經十足的意識到Chatbot這場戰爭已經結束了他可能更賭的一個東西是PixelinPixelout他覺得現在我們看見的所有的軟件或者是文本你其實都是以像素的形式呈現在用戶眼前的那麼他應該按他的第一性原理思考他應該是直接去生成一切他不僅是這個GenderofAI他認為就是一切我們所看到的東西任何模態都應該統一成PixelinPixelout當然也許會有音頻之類的東西而且XAI可能在Infra方面的投入也是非常有特色的他們會非常相信自己要把Infra做出一套比較有差異化的方案來然後Meta的話我覺得最近楊樂坤走了也許是個積極信號他們可能會投入到一些更樸素且有快速成效的工作中來你怎麼看楊樂坤楊樂坤當然這業界態度是值得尊敬的但我覺得就是他在一家商業機構內做這樣的一個角色自有其痛苦之處對然後我覺得他能找到一個他的自由的空間去做下去挺好的但同時也給meta解放了很多的思想負擔你怎麼看田園棟体验动物我觉得它首先它之前的研究方向我觉得非常有意思就是LatentReasoningLatentReasoning这个东西它那篇报告已经叫Coconut我觉得它解决了非常本质的一个问题就是现在大家很多人在做ROVR嘛但ROVR我记得最近应该是上交和清华吧一个团队最近一篇工作讲到就是ROVR其实本质上来说是增加模型在PASA1下的稳定性就是说你可以通过LVR的方式让模型在一次推理过程中达到正确答案的概率更高但实际上你模型本身能否解答一个问题还是在于其基座本身的质量就比如说你让一个非reasoning模型对不起非经过LVR的模型通过多次采样的话其实你大概率那条正确的轨迹是能够被采样出来的那这其实暴露了一个问题就是你通过LVR这种方式去做的话其实你只是在用一个接近于搜索的方式去解决这个问题但由于你是在文本空间的tokenspace去进行这个采样去进行reasoning但你这个过程就已经有了sampling这一步就是你基于logics之后你要进行一次随机采样预测一个token然后再继续走下去但是田一栋的一个研究方向就是latentreasoning我觉得这个是非常好的因为你没有进行这一次sample其实你可以某种意义上来说叫没有塌缩你其实可以在一个近乎于平行的维度内去同时考虑多种可能性然后这样的话我相信他的reasoning效率是更高的就虽然现在LVR你可能能做到就是说我passat1消耗的总的能源或者总的成本小于我让机座模型进行passat64但实际上你在用户视角下的latency还是高了很多而这个就像这个latentreasoning的话我觉得能解决这一个问题而且它其实一定程度上也实现longtoshort的分化所以我觉得田园栋的这个方向很好他之前有很多工作我都觉得非常有意思像我记得那个AttentionSync他们streamingOM的那篇paper也是袁栋做的我觉得很有意思我不知道他今天会做什么很期待他和杨乐坤是一个研究bats吗他们研究bats有什么不一样吗我觉得不一样我觉得田园栋的研究方向更加务实不敢妄议不敢妄议你觉得Matt他为什么在这波AI他有很好的人为什么在这波AI里做的不好嗯比较落后这个问题我觉得太大了吧这其实还中间还涉及很多人事上的事包括其实拉玛你知道团队已经换了好几拨人了对所以我觉得有很多场外因素吧open的人才流失你觉得会对open有影响吗我觉得会有一些吧包括像ChargePTAgent他们现在可能我听说接下来可能会看一看图币方向的机会同时我记得ChargePTAgent团队也走了几位主心骨对但是我觉得ChargePT这家对不起OPEC这家公司我觉得它只要这个Budweb这个创新文化还在的话我觉得仍然是最有可能诞生新凡市的公司之一它会成为新的社交网络替代Meta吗我觉得这个比较难吧这个当然说不准因为这个产品大家都在探索你怎麼看ThinkingMachinesLab還有伊利安那家公司一亮这家公司我觉得目前太神秘了我不敢说什么就是ThinkingMachineLabs的话我最近也刚用上他们那个TinkerAPI我觉得这个挺有意思我不确定这是不是他最后的一个产品但我觉得他的那个抽象层级其实非常好像比如之前有一些像那个就第三方的服务包括一些模型厂商会提供只有类似那个RFT或者SFT的那个接口但实际上你对一个Researcher来说他的约束有点太多了而这个ThinkingMachineLabs我记得他的Tinker应该就是抽象为了四组关键API然后它基本上很多你自己需要做的实验其实都能搞定当然我觉得TinkerAPI目前有个问题就是我觉得成本有点高你可能自己搭Megatron可能还稍微便宜一点但我觉得随着他们逐渐优化应该会好起来它可能会非常适合这种中小规模研究团队去用的一个产品同时他们也比较仰仗的一点就是开源模型能持续进步对这方面我觉得千万团队做的就非常好因为就是对于做研究来说有同源同家族模型或者同源模型的不同参数版本是非常重要的这方面千万提供的光谱一直是最全的所以我觉得就是DinkyMachine的成败者看千万你怎么看MiraMiraMoratti我没有跟她直接交流过但是从都认识人的口中对她评价都非常非常高明显她的号召力也很好你对于这些硅谷的AI的各个舰队的一把手在你内心有没有他抢入的一个排名其实这几个舰队真正的一把手我觉得他们性质非常不一样像可能真正的技术一把手只有D-Mine对吧像Dario当然也是如果你让我从纯粹的狭义的技术角度来说我肯定觉得迪曼丹威斯应该是我最佩服的一位第二位有没有第二位的话当然伊丽亚也是同样优秀但是大家可能都在期待伊丽亚交出的新作业是什么对剩下一些我觉得他们都是更复合的人才你难以用单一维度去评价国内呢國內的話我想想國內現在還在牌桌上的這話說的得罪人國內的話國內就不平了如壓的前段時間楊志玲和姚順宇都來過我博客他們的觀點你有什麼認同和不認同的首先順宇的觀點我一般都比較認同尤其他有那句暴論叫以前都是小公司抄大廠現在大廠抄小公司互相抄對雖然我覺得前半句本來也不一定是這樣本來就是互相抄但最近確實大公司抄小廠的事更多了對然後還有他之前順宇那個文章寫的下半場這個事我覺得下半場這個概念很好現在感覺很多人都在沿用這個概念我覺得他的觀察我都非常同意然后杨志霖那个我也听完了我觉得杨志霖他有一个很简短的观点我是非常同意的就是在这个登山的过程中只要问题能够被定义问题一定能解决这个其实也是我们很多时候做任何事的信心的一个根本来源对不认同的呢不认同的我觉得顺宇那期所有观点我全都认同然后袁世凌那期的话我觉得其实我觉得他的观点也比较保守所以没有什么特别明显的但有一点我觉得他提到一嘴是说如果不逊模型的话做agent是逆向工程这点我是完全不同意的因为对我们来说不仅不是逆向工程反而是在给别人带节奏他是垂直整合吗你们是逆向工程吗我们不是逆向工程他们是整合对他的观点是对他们整合进模型里我觉得这个东西其实如果你从一个严格定义来说你是无法整合进模型的因为模型无法internalize环境你怎么看世界模型不敢评论不懂不懂对不懂对你们多莫泰做怎么样多模态的话其实是这样就是多模态我们更在意的是多模态的输入而不是多模态的输出多模态输入的话其实作为agent场景下其实有一个很重要的观察就是现在其实很多开源的多模态模型你如果是简单的就是interleave图文输入的话其实大家处理都比较好像VQA任务这些东西但实际上你在agent场景中有一类情况是多模态输入作为tool的result我举个例子比如说你让浏览器看一个页面那你可能会把浏览器的截图返回或者你让用一个工具去读一图片图片是以trueresult去返回这个东西其实在训练的过程中我觉得可能目前的重视程度还不够这块的质量会有些下降的你还买英伟达吗目前没有了目前没有了对目前不炒股了你那年见老黄他跟你说什么了我问了他一个灵魂问题我就说接下来一年你觉得什么事会让你感到意外老黄说什么事都不会意外所以我觉得这其实就有点像杨志霖之前说的那个就是只要有问题存在问题一定能解决我觉得这个就是整体AI圈的乐观观点的代表最近有很多人开始讨论AIbubble你怎么看我觉得AIbubble一定是客观存在的但不是说因为AI是bubble所以这波AI就没用我觉得就是你是会有一些比如过渡建设或者怎么样这种东西但我觉得这都是在可接受的范围内我们人类历史上干的比这个疯狂的事多得多你对Mynas最乐观的预期和最悲观的预期都是分别是什么我觉得悲观预期就是下个月死掉这个是所有创业公司一样的悲观预期就是我刚才说的我们没有权利活着我们是在努力的获得一个活着的权利而最好的一个预期就是我们希望让所有的有高价值工作的白领都能获得一个7×24小时不断推理的AI伙伴如果麦特斯下个月死了你会去干嘛我会歇一会太累了你现在工作时长是多长时间我现在每天大概十点半到公司晚上干到几点就完全看情况了比如说几点一般来说一般来说我们大家基本办公室人大家都会待到大概十点半往后其实这也是为什么我们选了一个在一家帽里头的一个wework因为在帽里头空调会一直开到十点10点以后还没有空调了对10点以后没有空调所以大家待多久主要看在没空调情况下能待多久为什么选WeWork在那边办公室因为就是我们觉得团队在在不断的扩大这个过程中如果提前选择一个办公室一方面前期投入比较大且不灵活嘛WeWork就像云计算一样可以动态扩容新加坡的生活怎么样便利吗新加坡我觉得便利度其实还是挺好的它其实跟国内我觉得是中国团队在新加坡可以非常快的适应没有一个非常本质的一个区别是不是有点无聊对而且我认为这对创业公司来说是一个很大的加分项你建议公司第一天去新加坡吗我觉得这个东西其实看你的目标用户是什么就是我们去新加坡的原因其实也讲过就是有两点第一个前提就是我们团队其实可能因为管理能力比较差我们之前在国内比如北京和武汉两地的时候我们都会觉得沟通成本很高我们首先有一个希望是大家能在一个地方办公但另外一方面就是我们既然要服务全球市场我们其实要做很多的compliance就是合规方面的工作比如说像现在Medicine是SOC2的type1type2然后ISO2701还有像GDPR全都是我们全都通过了但这块你就需要就是你既然要服务哪个市场你就需要选择一个合适的总部所以我觉得这都是一个很正常的一个选择对于如果你要做全球市场的话你可以早点考虑这个问题但如果你是主要做国内市场那肯定有问题你怎么看别人说你跑路了我觉得跑路这个词就不对因为我们其实一直就有新加坡这个食品而且我们一直就做的是一个全球的一个市场所以你既然你的客户在哪你都要去哪就好比像Shimu跟Shiyin他们也没有我们那个业务这个是中国出版企业大家都会做这件事只不过可能因为我们是AI公司大家可能获得了一些老外的关注最后几个快问快答好一个全球范围内你喜欢的食物Macandcheese垃圾食品一个全球范围内你喜欢的地点飞机一个少有人知道但必须知道的知识点可以是一个冷知识海带不是动物是谁不知道我周围人都不知道难道你知道吗因为海鲜过敏我经常跟大家解释海带不是动物据所有读过的书推荐两本必读书我其实平时读书特别少我现在读线条小狗的画册你心目中影响AI进程的几篇论文第一個講的就是我剛才說的那個VirtualAppEngine的那款我忘了它叫什麼了然後我們叫影響AI進程論文也太少了吧大家肯定都會說AttentionIsAllYouNeed但我不想說這個話我覺得是FlyntT5那邊基於你當下的認知一個關鍵的重要的Fact是什麼AI接下來的進步需要用戶的參與好了今天的节目就是这样这里是商业访谈录是一档由语言及世界工作室出品的深度访谈节目你可以到公众号关注我们的工作室获取更多的信息我们的公众号是语言及世界我们希望和你一起从这里探索新的世界