
Hosted by Koji · ZH

🚗 这是一期「公路播客」——我们把播客搬上了车,边开边聊,氛围松弛下来,往往能聊出平时聊不出的故事和想法。🚥 如果你关注具身智能,大概率已经见过太多"参数很强"的机器人。本周「十字路口」的嘉宾是越伴动力创始人世博同学。他被一些人评价为“少年版稚晖君”:从大一开始就手搓过 30 多款机器人,机械/硬件/软件/运控几乎全栈。这次创业,世博选择不设计“有用”的机器人,而是要设计一个"能长期生活在家里"的生命。他们刚发布的产品「小伴」不会说人话,却会发出一种像"外星语"一样的声音;它会撒娇、会委屈、会拒绝你——但奇怪的是,这些"不听话"的瞬间,反而让我觉得:它可真像个生命啊!从"为什么要专门给它设计一种语言",到"全身 95% 都是柔软材质",再到"用快慢脑把交互延迟压到 0.4 秒以内",世博给出了一套非常具体的产品判断:第一,陪伴不是讨好;第二,生命力不是可爱;第三,少就是多。这是一期关于热爱、审美、工程、在路上,以及人为什么需要陪伴的对话。你会听到一个 26 岁的具身机器人创业者,如何用极致的审美和极致的工程,把"哆啦 A 梦"带进现实。🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 00:00 快问快答年龄、毕业院校、MBTI 与星座一句话介绍产品、融资情况、团队规模、创业前经历🟢 03:50 给机器人造一套“外星语”语言是加分项还是减分项?“它但凡会说得太像人,可能就不想买了。”你听不懂,但你会慢慢“感觉到它在说什么”。一种像宠物、又不像宠物的中间态。🟢 05:48 好产品不是靠功能堆砌起来的把“动作”当成情绪表达的主通道。当把“说话内容”降到 8%,设计重点就会完全换一套。手臂方案:类连续变形体,让手臂“duang duang”的。柔软外壳:90%+ 柔软材质覆盖。“外星萌物”:不是猫狗、不是小孩、也不是人形。🟢 08:41 不做“讲道理”的机器人定价,和定价策略。买回家,怎么才能不吃灰?目标不是“可爱”,而是“生命力”。机器人也要被允许变得“不那么讨好”。🟢 11:52 快慢脑 + 云端超长程记忆云端超长程记忆的目的:推动性格参数多维成长与动态演化。端侧快脑 1.7B、慢脑 7B:分别负责什么?为什么要这么分工?把延迟压到 0.4 秒以内。“动作生成”:同一句话、同一场景,也不重复同一套动作。🟢 15:26 创业时机为什么要等到 2026 年才能做出来?语言模型 + 视觉模型 + VLA/WAM 架构发展:哪一项真正改变了产品可行性?创业时机:心理/能力/经验准备好 + 看到了行业机会 + 找到切入点。🟢 24:13 陪伴 vs 讨好你到底想要一个永远顺着你的东西,还是一个会有情绪、会转身走开的“伙伴”?“不讨好但让你感觉被陪伴”。“你好难看!”——你会如何解读它的委屈?🟢 28:45 如果它在我家待一年买回去的第一天会发生什么?呆满一年之后呢?眼睛是情绪表达的载体。瞳孔/巩膜/花纹参数化控制,让目光看起来更像“活的”。🟢 31:11 “我有做机器人的天赋”第一台机器人与成就感。“快乐到晚上躺床上反复刷自己的视频。”从作品心态切到创业心态:“做机器人为了自己爽”到“要让用户爽”“务实 + 浪漫”:浪漫是愿景,务实是交付。🟢 37:02 可爱不是终点,生命力才是目标两项基座能力:家庭机器人基座 + 情感交互模型基座 = “生命力”。情感大脑是什么:高阶决策 vs 低阶操作的分工🟢 46:55 “No excuse for engineer”“不找借口,分析原因”。一条泥鳅的陪伴记忆。想把“告别”这件事变得不那么残酷。🟢 49:56 有意义的瞬间把哆啦 A 梦带进现实。“想造一个真正能陪我自己的机器人”。机器人以完整形态站到大家面前时,忍不住掉了眼泪。欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站

🚥 本周的「十字路口」在 MiniMax Dev Meetup 现场录制,Koji 对谈MiniMax CEO 闫俊杰(IO)、Multica 创始人张佳圆、DeerFlow 核心负责人何涛,以及上市公司金融行业 AI 负责人虞扬。我们围绕 AI Coding、Agent 与工程化落地的下一阶段展开。这期重点是闫俊杰 IO 的分享——也是他最近少有的公开露面:M3 的关键突破和评价对训练 10T 规模大模型的决心与路径中美模型差距的真实尺度模型的数据观转向,与推出 10X 专家合作项目的缘由AI Coding 迎来拐点:工程体系 vs 次抛代码“基模 vs Agent”到底是什么关系?MiniMax 下一阶段如何下注与取舍?其他三位嘉宾也从各自视角分享了很有趣的观点:张佳圆分享了多模型/多 Agent 的组合思路来平衡成本与质量;何涛强调工程的核心是长期维护与交付体系,而不是一次性把任务做完;虞扬补充了金融等垂直行业里 AI 的价值更多在“把信息变成可执行的决策路径”,以及在高频变化中降低门槛、提供辅助与陪伴。这期内容更像 2026 年中的一个时代切片:大模型公司、开发者、开源项目与垂直应用的一线代表同台,分享当下真实的观察、故事与认知——也因此更值得被反复回听。🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已经发布于 @十字路口Crossing 公众号。🟢 01:41 M3 的关键突破和评价衡量一代模型到底行不行,IO 盯一个"比较客观的指标"——不是分数,那是什么?去年五一假期,团队第一次在 M1 跑通某件事——有点像"瘫坐在椅子上、后背发凉"的感觉本来 M2.5 一天烧 1 万亿 token 就满意了,结果一路冲到 10 万亿,超目标 10 倍🟢 12:09 基模 vs Agent,到底是什么关系?"去年这个时候,我想不到现在的模型是什么样"没有 Claude Code,某个模型可能也火不起来;没有 GPT-5.5,Codex 也起不来。模型越来越强,但 IO 坚持一个"前提"。🟢 14:12 训 10T 大模型的决心10T 大模型必须训成,最大的卡点是什么?"AI 已经是个很大的产业了,就跟半导体一样。"为什么这件事只能"一代一代往上做",急不得?外推一旦失效,模型就成了开盲盒。🟢 15:54 中美差距:10 倍,就是整整两代美国模型"基本上大 10 倍",而 10 倍意味着整整两代。国内每家都得先把 3T 做好、再做 10T——但一个 10T 模型需要 200T 数据,"全世界都没有这么多"。一边"我们进步速度最快",一边又"比较忐忑"——为什么?🟢 17:53 AI Coding 拐点:是工程,还是"次抛代码""从来没人说 vibe engineering,但写代码从来都是 engineering。"人人都能 vibe coding 之后,每个人都成了"产品经理"。何涛一句暴论:最讨厌别人说"这是 agent 做的,别怪我"——用你的账号提交,背后是谁的责任?一个人改十几个仓库、提个巨大 PR,"看起来对,但没人敢上线"——问题出在哪?🟢 27:12 数据观转向:他们开始招核物理学家一年前以为数据就是标注,现在 MiniMax 在找经济学家、哲学家,甚至核物理学家。做 coding 时他们就发现:开发工程师比算法同学更懂"什么叫好代码"——这推出了一个什么结论?Anthropic 为什么要养核物理学家?MiniMax 推出 10X 专家合作,想补上哪一环?🟢 30:30 MiniMax 下一阶段,下注什么?AI 是个黑盒,连做模型的人都不懂它IO 最关心的,是什么时候能"用 AI 帮人类理解 AI"。大脑里的海马体,居然和模型训练里的某个机制惊人地像。一年前我们还不理解"对齐"为什么重要,现在越来越确定——为什么?欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 本期主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站

🚥 总有人在朝着星辰大海前进。世界模型是 2026 年 AI 与具身智能领域最热的关键词之一。但越是热门的词,越容易被过度使用:视频生成、3D 生成、JEPA、VLA、WAM,似乎都可以被叫作世界模型。可当我们真正谈论「世界模型」时,我们到底在谈论什么?本周「十字路口」邀请到 Aether AI 创始人 / CEO 黄碧薇教授。她从德国马克思普朗克研究所、CMU 到 UCSD,一路深耕因果发现与因果 AI,是这个领域的重要学术贡献者之一。Aether AI 最近迅速完成 2000 万美金的天使轮融资,黄碧薇选择把因果 AI 这套长期被认为「更合理、但更难实现」的方法,带到 Physical AI 和机器人大脑的问题里,打造「因果世界模型」。我和黄碧薇聊了世界模型的定义边界、视频生成为什么不等于世界模型、VLA 为什么在真实任务中碰壁、WAM 为什么可能只是中间态,以及「因果世界模型」想要解决的三个核心问题。这也是一期关于创业选择的节目。为什么一个 UCSD 教授会在 2025 年初决定下场创业?她看到了什么信号?如果你正在关注世界模型、具身智能、机器人、因果 AI,或者正在思考下一代 AI 范式会从哪里出现,这期节目也许能帮你重新校准一个问题:哪条路线,才能通往「世界模型」的终局?🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 🔴 🟡 🟢 00:43 快问快答:求学和科研经历、MBTI 与星座、一句话介绍 Aether AI 与产品、融资情况、创业前经历🟢 02:13 三条世界模型路线,和那条没人提的第四条视频生成、3D 生成、JEPA 都在被叫作世界模型,可当我们说「世界模型」时,到底在说什么?世界模型 ——一个听起来很宏大、用起来却很不准确的词,到底是严肃的技术对象,还是被混用的热词?「不是那三条路线,是我们在做的第四条」🟢 04:49 因果世界模型,到底不一样在哪真正的世界模型,要在隐空间里同时学会三样东西——是哪三样?同样是 AI,凭什么 LLM 不懂因果也能逻辑严密,世界模型却非因果不可?为什么 LLM 偏偏只在自然语言和 coding 上大获成功?🟢 10:33 第一版因果 AI 世界模型满分 10 分:VLA 天花板 5 分,WAM 6.5 分,因果路线……她敢打几分?训出第一版,预期要喂多少小时数据、用多少张卡?四类数据怎么配比?模拟、ego-centric、视频、遥操,谁占 80%,谁只占 20%?WAM 只是个「中间态」——比 VLA 好,但为什么注定到不了终点?🟢 16:17 因果学界的「三国鼎立」三个门派、三位 80 多岁的泰斗,早年居然「互相不服谁」——这是一段什么样的江湖?图灵奖得主 Judea Pearl 和哈佛的 Donald Rubin,分歧到底在哪?师承 CMU 的黄碧薇,站在了这三派的哪个位置?🟢 22:32 因果简史从亚里士多德、易经,到临床双盲实验,再到 80 年代末 CMU 三位教授的一个算法。做实验太贵、很多时候根本没法做,科学家于是把目光转向了「只看观测数据」——这条路是怎么走通的?黄碧薇这些年最核心的贡献,是在一个满是隐变量、bias、缺失值的「不完美世界」里做因果——为什么这反而最难?🟢 20:35 因果和大模型过去因果帮 LLM,其实只有内、外两种方式——分别长什么样?OpenAI、Anthropic、Google 这些大厂,到底有没有把因果 ship 进产品?两个创业选择摆在面前。🟢 41:08 PhD,到底还值不值得读加入 OpenAI,一年 3000 万美金——这时候还该静下心做科研吗?什么样的人才该读 PhD?怎么分辨自己对研究是「真欲望」,还是只想要个学位?工业界和学术界的墙正在变低,这对纠结的人反而是好消息——为什么?🟢 47:17 五年后回头看,今天什么是错的如果能向一个无所不能的上帝问一个问题,她想问的,竟然关于「因果是否真实存在」。VLA 不是终局、WAM 也不是终局,但它们各自留下了什么?如果因果不存在,「我们会集体陷入存在主义的巨型危机」。欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 本期主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站

🚥 本期「十字路口」有个很好的时间点:2026 年过半,AI 已经强到足以改变“怎么工作”,但离“无摩擦地替你把事做完”仍然有距离。➤ 上半场,我邀请到身边用 AI 的“高手”课代表立正,他是康奈尔经济学博士,创办了 Superlinear.Academy,曾在 Amazon、Meta、腾讯工作,在初创期加入 Statsig,后被 OpenAI 收购。课代表立正分享了高手的 AI 为什么会越用越强?——他们在想“我能为 AI 做些什么”,并且把生活和工作的大事小事全都交给 AI。他也分享了一些普通人如何用好 AI 的建议 ——比如,第一条:停止使用 ChatGPT 式聊天,改用 Codex / Claude Code / Cursor / Manus 这类 agentic 工具。➤ 下半场,我们交换角色,由课代表立正采访我:2026 年的 AI 创投观察与思考。我分享了在一线体感里同时存在的希望与失落——希望是创业与资本热情前所未有,且“人类与 AI 的最佳协作方式仍未被发明”,摩擦本身就是机会;失落是商业价值高度集中到基模,它们吞掉了绝大多数由 AI 而生的收益,应用层常像“推土机前捡钢镚”,传统软件的老路径(需求—产品—卖给更多人)变得更难。此刻,创业与投资的机会正在两极化:要么往天上跳(AI for Science / Physical AI),要么往地里钻(行业深水区的流程改造与交付 / FDE)。最后,我还分享了自己最近关注的 5 个 AI 创业方向,欢迎 AI 创业者们找我探讨。——————ps,向大家推荐大家关注课代表立正和鸭哥的 Superlinear Academy。当我们聊到「学 AI」究竟应该学什么、怎么学的时候,他们给出了一套特别好的方案。🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 🔴 🟡 Part 1 - 课代表分享:高手怎么用 AI?普通人怎么学 AI?🟢 01:40 高手用 AI,到底差在哪高手和普通人的差别,在哪两点?想学世界模型,他没看论文,而是让 AI 写了一篇三万字的办公室恋情狗血小说——为什么这招有用?🟢 04:33 今年学 AI,最重要做一件事为什么他坚持「立刻停止使用 ChatGPT」,去用 Claude Code / Codex / Cursor?蒸汽机换成电机,工厂效率只涨了一点点——真正的跃升要等到一件事发生,是什么?用聊天框比用 agent 工具「差了三个点」。🟢 10:56 好 skill 和 context,才是护城河工具一样、模型一样,最后拉开差距的只剩一样东西。一个好 skill 的本质是什么?skill 能不能被商品化卖钱?用好 AI 的第三步——积累上下文和提炼上下文,为什么是两个要分开做的动作?🟢 15:03 摸着石头过河,石头不见了——消失的那块石头,到底是什么?从需求端和供给端两头看,旧的创业逻辑为什么突然不灵了?他上一家公司能列出一百个「你该买我」的理由,可现在客户跟 Codex 聊两句就走了。🟢 22:01 AI 会带来第二次文艺复兴为什么非常看好自己孩子的未来?当 AI 把「螺丝钉」彻底取代,人被逼着只能去做一件事。未来的教育,可能不再是精通一个专业,而是「略懂一二」一百个专业。「你以为学 AI 是学名词,其实学的是动词。」.🟢 🔴 🟡 Part 2 - Koji 分享:年中对 AI 创业投资的观察与思考🟢 25:49 2026 的创业体感:泡沫的另一面Paperboy AI 创始人那句让 Koji 印象极深的话:人类和 AI 的最佳协作方式,很可能还没被发明出来。「软件已死」「悲观者往往正确」——但为什么只有乐观者才可能成功?资本前所未有的热浪,和显而易见的泡沫,是同一件事的两面。🟢 27:54 在推土机前面捡钢镚一张图显示:这一波 AI 创造的商业价值,90% 被模型公司吞掉了。既然在推土机前捡钢镚只能捡到钢镚,那剩下两条活路是什么?为什么一条要「往天上跳」、一条要「钻到地下」?AI for science,for what?具身智能动辄百亿估值的背后。🟢 32:51 FDE:把数字员工带进公司OpenAI 和 Anthropic 几乎同时发了公告,提了同一个新词。FDE(前端部署工程师)到底是个什么角色?这个词其实早就存在(售前、客户成功、驻场工程师),但被重新命名之后,发生了什么?这么大的人才缺口,为什么到现在还没井喷?🟢 43:30 新时代的 VC 长什么样叙事连接器、connector as a service、新型财务伙伴——这三个角色分别在解决创业者的什么难题?「自强则万强」——为什么一个创业者太需要 VC 指点,反而会让人「非常担忧」?好投资人应该像副驾,而不是一路喊红绿灯的人。🟢 50:00 五个方向everything agent:沙箱、记忆、通信、支付…给 agent 设计产品:飞书口碑飙升和它的 CLI 有什么关系?当 agent 找不到你的工具,你就「等于不存在」。视频模型:可灵 5 亿、Seedance 15 亿美金 ARR,云南小镇一个拍婚纱照的青年做出了全球刷屏短片。软件不会消亡,GUI 也有未来。和语音相关的一切。欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 本期主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站

🚥 上月,Anthropic 和 OpenAI 在同一天分别宣布了各自的十亿美元级的企业 AI 合资公司,并且都称自己在做的事情是 FDE(Forward-Deployed Engineer,前置部署工程师)——帮助 AI 进入企业,从“能用”走向“上岗”,从“展示能力”走向“交付结果”。本周「十字路口」,我们聊 FDE 这个正在被重新定义的岗位与分工:它究竟是在把“售前/交付”换个名字,还是代表 ToB AI 时代新的组织结构与商业边界?当模型越来越强,最后一公里为什么依然最难?企业真正缺的,到底是更强的模型,还是能把 AI 带进流程、接入系统、治理知识、持续迭代并对结果负责的人?我们的嘉宾是 Rolling AI 的两位合伙人阿甘和刘开,他们是中国在企业 AI 落地与“交付能力产品化”方面实践最深、也最具代表性的团队之一。如果你在寻找下一波 AI 的机会,这期内容希望给你一个可行动的视角:旧分工在松动,新岗位在出现,而新的创业机会,也往往从这些缝隙里长出来。🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 01:08 快问快答年龄、毕业院校、MBTI 与星座、一句话介绍 Rolling AI、收入与利润、团队规模、创业前经历🟢 02:19 FDE:AI 不是软件,是劳动力OpenAI 和 Anthropic 同一天宣布成立十亿美元级企业 AI 合资公司,都说自己在做"FDE"——他们到底在描述一件什么事?传统软件是工具,需要人来操纵。但 AI 本身就是劳动力。FDE 做的,其实有点像 HRBP:把"数字员工"送进企业。为什么从 BCG 出来做这件事?MBB 在服务中国民企时,遭遇了什么困难?传统咨询交付 200 页 PPT,今天他们交付的是智能体。🟢 08:22 首个案例:一个人带 50 个机器人,服务 600 万用户出生率下滑,乳品企业急着找第二曲线。他们需要的不是几个营养师,而是"无限个"营养师。全国注册营养师 40 万,目标用户是 8,000 万——供需差距 200 倍。AI 是怎么填上这个缺口的?"如果有人说我要减肥,你的第一句话应该是:你又不胖,你为什么要减肥。"——这是人类师傅教给 AI 的。而找到好师傅,才是 FDE 最难的事。🟢 19:58 FDE 是什么角色?带着一批"清北学生"去便利店上班的工头。FDE 要做好三件事才能撤场:业务融合、知识治理、系统对接。一个好的 FDE 需要三种核心能力:能一眼看穿业务痛点本质、人机协作的原生感知、能用 AI 工具快速构建原型。这样的人,能短期培养吗?——不能。"你刚毕业,我想不到任何一件你能做、AI 做不了的事情。"🟢 25:09 SOP 代表落后——标准化的终结他认为 SOP 代表着慢、代表着落后——这是暴论,还是有逻辑支撑的判断?从消费端的"千人千面"(抖音),到生产端的"千人千面"(每个门店自己的经营决策)。总部从"管控型"变成"赋能型",意味着怎样的组织重构?以及,哪类管理层会最先被消失?🟢 28:21 那些消失的企业,真正输在哪里?兰开夏郡的纺织业接了电,但没被电拯救——因为他们只把电接到了原来蒸汽机的大轴上,整个生产方式还是蒸汽时代的。"AI 这次变革对社会的影响幅度,会超过互联网,像当年电力革命一样大量取代智力劳动。"每次大的生产力革命,都有 95% 的企业消失——而他们都接了电、上了网。那些消失的企业,真正输在哪里?技术在整个 AI 落地过程中,占比不超过 1/3。剩下的 2/3 是什么?🟢 32:01 AI 落地失败率超 50%:三大死法第一大死法:CEO 对 AI 有"超出现实的预期"——"上了 AI 企业就起飞"。第二大死法:让 IT 团队来主导 AI 项目。"谁懂怎么对付客户、让他买保险?是业务团队,不是 IT。"第三大死法:激励机制没跟着变。AI 带来了新的生产力,但生产关系没变——结果会是什么?🟢 43:29 应届生在 AI 时代能做什么?Rolling AI 的高二实习生,他说"丝毫不觉得输过任何一个平庸的五年经验咨询师"——为什么?商业 sense 和 judgment,能培养吗?他说他个人还没找到路径——"有些东西是天生的"。FDE 时代,判断一个人值不值得用,真正在看的是哪三件事?🟢 46:49 OpenAI 和 Anthropic 为什么都突然下场做 FDE一种是"数据饥渴",一种是"利润饥渴"——真相是?大模型进入行业,遭遇的最大瓶颈不是模型能力,而是行业数据和知识的短板。ToB 本质上不是软件能独立完成的事,而是一个服务业——"需要又懂 AI、又愿意扎进去的服务者,才能改变这个世界。"为什么 OpenAI 和 Anthropic 的合资公司全都是 PE 结构?收服务费根本收不到那部分 upside。🟢 49:08 FDE 公司不应该被 VC"投",而应该被 VC"拥有""我们一年陪跑收 600 万,但帮客户省了几千万、多赚了几千万——那差价去哪了?"每一家 PE/VC 的投后部门,核心能力之一将会是帮被投企业做 AI 转型。"我们在同一个行业,只服务一家,绝不服务另一家。"当 AI 能带来真实的业绩增长,单纯按日收咨询费这件事本身就不够了——未来的商业模式指向哪里?Service as Software,还是 Result as a Service?欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 本期主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站

🚥 「AI+互动娱乐 / AI+游戏」正处在一个奇妙的阶段:碎片化的 Demo 层出不穷、技术进步快到让人恍惚——AI 生成小游戏、交互短内容、AI NPC、世界模型、实时多模态——但真正能在大众层面形成共识的爆款作品仍然稀缺。本期「十字路口」和关注 AI 互动内容与游戏的播客「405游局」串台,邀请到主播 / 资深游戏从业者筱宁,一起做一次 2026 年 AI 游戏的“全景扫描”:我们把行业拆成“四层图景”,指出三种最常见的误区,并讨论那个最关键的共识缺口到底是什么——以及它为什么更可能从野生土壤里长出来,而不是从大厂里“立项做出来”。如果你是 AI 创业者、投资人,或正在关注下一代内容平台、互动娱乐与 AI 游戏,这期节目希望能给你一个框架:哪些确定了?哪些还在幻觉里?下一阶段最值得跟踪的变量在哪里?🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 00:11 Opening游戏行业对这波生成式 AI 的反应,比互联网公司慢了很多。筱宁在头部大厂做 UGC 游戏制作人,但有一个体感让她决定离开。赛道的两个坐标:「互动」和「好玩」。游戏真正的竞争对手,不是另一款游戏,而是抖音。🟢 02:48 行业的四层图景AI 作为工具:服务于互动内容/游戏的创作流程(更偏“提效/基建”)AI 作为创作入口:以 AI 作为新的“生成入口/创作方式”,更关注结果而非流程AI 作为交互对象:典型是陪伴类、AI NPC 等(把 AI 当作你在内容里“对话/互动”的对象)AI 改变娱乐关系:改变“谁创作/谁消费”、以及社交关系/娱乐关系如何被构建(例如“多人 + 一个 agent”的场景,AI 从 NPC 变成“社交基建/氛围调节”)🟢 05:45 眼前一亮的作品们《星布谷地》的娜洛做了三件事:示范怎么聊天、救场、调节氛围。当这三件事都做到了,它已经不是 NPC,而是一个社交基建的角色。任天堂的《朋友收集新生活》(Tomodachi Life):捏人、设定剧情、当造物主、当导演、再当观众——「创作即消费」这个体验,为什么他觉得特别有意思?🟢 10:43 AI 版愤怒的小鸟,还没出现愤怒的小鸟不是手游史上最赚钱的,但它是第一个让所有人形成共识的那个。为什么用愤怒的小鸟来类比?那个关键时刻目前还没出现——不是因为技术不够好,而是还缺少一件具体的事情。「AI 版愤怒的小鸟」更可能从创业者中野蛮生长,而不是从大厂内部长出来。🟢 17:54 大厂 AI 布局腾讯、字节、米哈游、网易——面对 AI,四家公司走的是四条路。改变最大的一家,并不是资源最多的那家。米哈游做了一件其他纯游戏公司几乎不会做的事情——「动到模型」去做尝试。「技术宅拯救世界」的基因,在这里有多直接的体现?世界模型(Genie 3 等)真的要改变游戏了吗?🟢 22:31 AI 人不懂游戏的三个盲区「游戏生成」这个词,本身就是对游戏工业化难度的低估。视频生成出来就是完成品,但游戏生成出来只是开始。「无限选择,不等于好玩」。我们高估了自然语言在互动娱乐中的比重。手感、点击反馈、声光电刺激——这些跟语言根本没有关系。对于很多内容产品来说,「可生成」是追逐的终点;但对游戏和交互来讲,「可生成」只是可被设计的起点。🟢 25:15 「AI 时代的抖音」,靠谱吗?Loopit、AIPPY、Rezona、Riffle… 大家都在说要做下一个交互内容平台。创作门槛被极大降低之后,紧接着的问题是?有两个核心问题至今没有被解答。「我们俩都生成了一个贪吃蛇,我和你的价值怎么被别人分别看到?」——如果创作者的价值无法被凸显,平台的供给侧会发生什么?🟢 37:54 TaptapMaker:用过的人两极分化做过策划的人用它:「太好用了。」没做过策划的人用它:「还不如 Claude Code。」同一款工具,游戏从业者和非从业者体验差距为何那么大?有人在上面复刻了 Minecraft 世界,有人做了完整的 Roguelike——原来要一个团队几个人做两三个月,现在一两个人两周。AI 互动影游(带分支线的交互视频):比短剧更复杂,成本百倍降低,它的春天什么时候到?最长期跟踪的三个问题:交互娱乐里的短内容机会、AI 3D 管线什么时候成熟、以及愤怒的小鸟时刻最终会以什么形式出现。🟢 43:48 当 Claude Code 成了最好玩的游戏如果让游戏策划连续说「最近玩过最好玩的游戏」,越来越多的人,答案已经变了。商业化手游的工业节奏(42 天大版本、21 天小版本),是让热爱最容易被消磨的地方。最近好多人说自己最爱的「游戏」是 Claude Code。感性指标和直觉反应,在互动娱乐的早期,为什么比任何理性分析都更重要?欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

🚥 本周,十字路口的嘉宾是 Paperboy(https://www.paperboy.com)团队。John Yang 21 岁,CEO。Jett Chen 19 岁,CMU 大一在读,同时是 founding engineer。Paperboy 团队 12 人,10 位工程师,融资 470 万美金。John 认为:人类和 AI Agent 配合工作的最佳方式,很可能还没被发明出来。虽然已经有了 Claude Code、Codex、Manus、OpenClaw,但它们本质上都是 session-based + prompt-based。用户需要打开一个窗口,输入 prompt,等完成,关掉。下次从零开始。Paperboy 正在尝试找到一种更自然、更连续、更可协作的 Agent 界面与记忆结构——Agent 应该通过观察你用电脑来自己学习,用 IM 而不是 session 来组织对话,主动找你,而不是等你 prompt。如果你在做 AI 产品、AI infra、或正在思考 Agent 如何进入团队工作流,希望这期内容会给你启发。🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 00:00 快问快答年龄、毕业院校、MBTI 与星座、一句话介绍 Paperboy、融资情况、收入与利润、团队规模、创业前经历🟢 01:59 起点:现在的 AI 产品,我用着不爽今天的 AI 产品都有一个共同的问题:你必须把文件、邮件、个人信息手动扔进对话框,然后对话完就消失了。三个核心痛点:不该这样协作,不该这样留下历史,不该这样主动。「人类和 AI 配合工作的最佳方式,很可能还没有被发明出来。」现有的 Chatbot 和 Agent 产品形态是 AI 时代的「默认答案」,而默认答案几乎从不是最优解。🟢 06:21 Claude Code 轰炸之下Agent 赛道的三个机会:一,让 agent 真正从用户环境中学习;二,足够个性化,做到主动的同时不造成干扰;三,使用体验必须极其直觉——「你不该像学新工具一样学怎么用它。」这三点依然要靠人类团队,市场上冒出的新东西还没有打破这个框架。🟢 08:01 Agent 的两大问题Cursor 和 Manus 是目前最成功的 agent 形态,但 John 说它们有两个根本性的问题——这直接定义了 Paperboy 要做的事。问题一:基于 Session。你有一堆工作区、一堆对话,每次开新 session 就像重新认识一次,context 不跟着你走。问题二:Reactive(被动)。你必须先问,它才回答。Agent.md 文件要主动维护。Agent 应该知道你的鼠标移动、视频音频、所有电脑活动——context 应该比 context window 长得多。🟢 14:21 屏幕数据成了行业共识之后「收集用户屏幕数据去构建 Context Layer,已经一定程度上成为行业共识。」Codex、Littlebird 在做,各路玩家都在做,但接下来怎么做——是预测用户下一个 Keystroke,还是预测他接下来一个小时要做什么——还没有人找到最佳”配方“。这个领域需要大量 engineering 和 research,「在今天,对一家公司来说,探索这个区域还是一个非常好的选择。」🟢 16:46 Mini Vivian & Auto JohnMini Vivian 是团队在内部 Slack 里训练出来的 Paperboy 实例,理解 Vivian 曾经说过的所有话、她的判断品味、她的招聘标准。它能帮 Vivian 从 GitHub、小红书、推特挖掘候选人。和 Auto John(John 的 agent 分身)聊天,有时候比直接找 John 更顺。「期待我可以直接躺平,让 Auto John 成为比我更聪明的存在。」🟢 27:36 微信群聊,启发了界面设计不同角色的「侧边栏」完全不同,如果每人一个定制版,根本没法做成产品。转机来自微信——同一批人,可以同时存在于多个主题不同的群组里,这是人类组织信息最自然的方式,而且不会让人觉得烦。🟢 33:36 The Last Interface 与五种速度Paperboy 目前唯一一篇 blog 标题叫「The Last Interface」——context 的速度层级,决定了产品形态。「节奏分层」理论(Pace Layers):时尚、商业、基础设施各自以不同的节奏变化。映射到 AI 产品:1 秒内的 task 可能最好的形式是 autocomplete;几小时的 task 用 IM;更长的 time horizon,产品形态还是「一个非常值得被探索的区域」。「五种速度」不是说 Paperboy 真的只做五种,而是一个思考框架:你在哪个速度层的 automation 上,直接决定了你应该做什么样的产品。🟢 42:09 两种工程师、一本书、一个教练12 人的团队,John 说他招的是两种完全不同的人。第一种:像 Jett 这样——年轻、高智商、充满创造力,能为每一个难题极速搭出 prototype。第二种:领域基本功极度扎实的人,比如来自 AWS 做过 Windows 内核开发的工程师,来负责底层基建。管理经验几乎全靠自学:《格鲁夫给经理人的第一课》、《创业维艰》、《万亿美元教练》——以及和一位前 VC 高管出身的 CEO 教练每周一小时。找教练比心理治疗好太多,原因是:「你可以谈情绪,然后接着谈业务里正在发生的一切。」🟢 48:07 拒绝过 Cognition、Vercel、Sentry,然后呢Million 时代,他们收到过来自 Cognition(Devin)、Vercel、Sentry 的收购邀约。「加入那些公司,某种程度上就像是做一名普通员工,你必须为别人的想法工作。」最喜欢的 AI 产品?Jett:Codex——「它以最 ambitious 的形式在定义未来的软件工程师是怎么 work 的」,而且核心 agent 是开源的。欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

🚥 为什么说 Agent 的上限来自 Harness?当我们讨论 Harness 时,我们究竟在讨论什么?不久前,Claude Code 源代码泄露,许多 Agent Harness 的关键模块得以完整呈现,成了一份极佳的教学标本。而在技术高速变化的红利期,主动理解新技术往往能带来很高的认知增量。因此,本周「十字路口」邀请到来新璐,一起聊聊 Agent Harness。新璐是 ShareAI 开源社区发起人,他撰写维护的《Learn Claude Code》教程在 GitHub 上获得超过 50k Star。在本期内容中,我们把 Agent Harness 从概念词拆解成工程语言,介绍它的三层框架:会跑(执行层)→ 跑久(状态层)→ 跑稳(治理层)。同时,我们也梳理了 Claude Code 中值得借鉴的多个机制:更多 context、更少 control 的思路、“零上下文管理”的哲学、长程任务的接力式交接策略,以及让 Agent 越用越聪明的“做梦”式记忆维护与迭代机制等新璐作为典型的一人公司,刚完成数百万美金融资;他也分享了自己对 OPC 的独特观点,甚至认为“未来只有 0 人公司,没有 1 人公司”,颇具启发。🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 00:49 快问快答:年龄、毕业院校、MBTI、星座、一句话介绍公司、融资情况、团队规模、创业前经历🟢 01:52 模型以外都是 Harness机甲、大脑、机器人、智商120——Harness 到底是什么模型以外都是 HarnessAgent 上限由 Harness 决定吗?模型智商已在 120–170 之间;Agent Harness 像机甲——不提升智力,但极大扩展能力🟢 02:47 GitHub 50k star,是怎么来的?这个Agent教程,其实不只是写给别人看的——它本来是新璐自己整理的"造 Agent 心法"。9 个月前动笔,出发点是"把 Claude Code 套网页壳就能得到一个强大 Agent 产品"的简单直觉开源社区当时流行 LangChain、LangGraph等 prompt pipeline 做法开发“伪Agent”,是一场派系之争——"Prompt Flow-Driven vs Agent Native-Driven"LangChain 过时了吗?🟢 04:02 Bash is all you needClaude 推出 Manager Agents 之后,大家还需要自己搭 Harness 吗?就像 Next.js出现后大家不再关心底层运行原理,两三年后 Agent Harness 也会收敛为开箱即用但现在是技术周期红利窗口——不懂 Agent Harness,做出来的Agent产品"缺乏灵魂"今天的 PM 和过去的 PM,指的根本不是同一种人🟢 07:04 Harness 三层拆解用两周时间、多 Agent 协作,从零写出一个 C 编译器——这个经典案例背后,到底走了哪三层?第一层:执行能力层 ——文件增删读写、浏览器、语言解释器;配错权限后果是什么?第二层:上下文与状态层 ——system prompt、skills、memory,以及上下文窗口满了之后 Agent 如何"接力交棒"第三层:治理与编排层 —— 数百上千 Agents 如何组织协作?测试 Agent 为什么不能同时拥有修改代码的权限?🟢 12:05 KB 的 K 系列Agent工具链他们公司叫 Komputer Blue,代号KB,目标是构建By Agents & For Agents的整套开源InfraKomputer:用 TypeScript 重写 Unix 文件系统和 bash,给 Agent 一个"熟悉的生活环境";支持 WebAssembly 时切换WASM实现;Kruntime:Agent Runtime 层,提供让人类开发 Agent 的接口,以及Agent 派生 Agent的接口Kwatch:Agent 观测层,分析 Agent 任务在哪里卡住,反向指导 Agent 设计迭代Krl:把 Agent 在 Runtime 上沉淀的轨迹数据拿来强化学习或做上下文层的自迭代🟢 13:55 vs. AWS AgentCore、阿里云 AgentBay云服务厂商当然也想做这一层K 系列 Agent 工具链的核心理念:在离用户更近的场景运行 Agent,任何能跑 JavaScript 的场景都能用——浏览器、插件、App、Electron、小程序、纯静态网页、全栈 SaaS差异化:把Claw-Agent的运行时轻量到由纯数据结构模拟的 KB 级Unix虚拟计算机环境,而不是把 Linux 和浏览器全塞进去新璐认为要让 Agent 工作好的方法是给每个 Agent 一台专用计算机,一般通过虚机提供,但大多 Agent 完成的大部分工作不需要真的 Linux虚机(且成本高昂),像编译器、浏览器这类重工具原本就不该放进给每个 Agent 的虚机环境🟢 17:38 Memory 的流派完全结构化(知识图谱 + 向量搜索):精细存储的知识结构,支持 pipeline 知识推理,rule-based,新璐不喜欢半结构化(Unix Files + Markdown + Agent 驱动更新):Claude Code 和小龙虾都是这样做的;Claude Code 中的 auto-dream 机制:每隔一天触发后台 Agent 对最近会话做"重放",纠错、合并、更新记忆——就像做梦模型内化 —— 距真正生产落地还需要~ 3 年时间,且记忆难批量提取 & 无损转移,容易被单边模型提供商绑定🟢 22:49 共识与非共识共识:CLI is all you need——"Bash is all you need" 这句话是新璐 9 个月前写在开源仓库里的标语,现在成了行业共识非共识:大部分23年 ~ 25年诞生的主流开源 Agent 框架仍在用 PromptPipe + Node Graph的老路线 —— 就像齿轮与传送带编织的流水线Unix 从 1971 年就存在,LLM预训练语料中 Linux 命令有数十亿条sample;MCP 提出才两年,预训练占比不到 0.1%——这解释了为什么 CLI 工具的任务完成率比 MCP 高,并且 shell 具备对CLI命令的可组合性 & 二次编程空间🟢 26:33 Claude Code 源码泄露:最大的惊喜是什么让所有人看到了一件事:这家公司在"上下文管理"上做了多少别人没有做的工程工作上下文压缩策略:工具 output 何时删、窗口满到什么阈值开始交接、下一个 Agent 初始化时加载什么Fork Agent 机制:每轮结束触发 turn stop hook,Fork 一个 Agent 复用 KV cache 做记忆更新记忆文件格式和 skill 保持同一套哲学:前三行 YAML,先读 description 而非全文新璐的结论:"好的 Harness 要和模型的inference逻辑自洽,和Agent模型进步方向正交"🟢 34:05 好 Harness 的标准不好的:随意裁剪上下文,导致 KV cache 频繁失效,重计算开销不好的:用 Prompt Graph硬控每一步决策——模型越强越被束缚好的公式:好的context space + 好的action space + less prompt controlAnthropic 从25年初率先从问答模型转向 Agent 模型训练,领先其他厂商半年🟢 38:52 新璐看好的三个创业方向第一:Agent Harness工具链(新璐自己在做)第二:Agent 组网——不是给 Agent 发 IM/Mail,而是混合云端/端侧的全设备组网;现有 Tailscale 不够 Agent Native,需要高通量上下文交换,以及更多控制能力第三:Agent模型集约训练、推理基础设施——Tinker(Thinking Machines Lab,OpenAI 前 CTO 创业方向)的路线:集约化高效训练 + LoRA 热插拔推理,让更多企业 & 个人都能以较低成本获得个性化且更适合各自任务场景的Agent模型🟢 44:09 Agent 未来暴论"我觉得以后很多的公司都是理财产品 —— 由有经验的人类 Team搭建这些公司、甚至由AI直接生成公司,然后自运转"阶段:单 Agent → Agent 蜂群 → Agent 自管理 & 协调更多 Agent → Agent 开始创造、发明OPC “1人公司“不本质, 0PC “0人公司”是未来趋势真格基金和十字路口的 Token Grant 资助的 YoYo Agent未来的画面:从口袋里掏出一张卡,"这张卡里跑了 5 个由Agent组成的公司,每年给我创造几十亿收入"欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

🚥 上周,我在 B 站做了一场直播,邀请了中美两国一线 Agent 开发者深度对谈: MiniMax Agent 首席架构师 阿岛 MiniMax Agent 研发工程师 择因 Hermes Agent(Nous Research)业务负责人 Tommy Eastman这也是 Hermes Agent 在全球获得广泛关注后,官方首次现身中国社交媒体平台,并且正面回应了中国团队 EvoMap 对其“抄袭”的指控。我们一起围绕「从 OpenClaw 到 Hermes」的热潮迁移,深入拆解了 Agent 和 Harness 的多个关键议题: Hermes Agent 为什么会在 OpenClaw 之后火起来? 模型会吃掉 Agent 吗?通用 Agent 会吃掉垂直 Agent 吗? 为什么 MiniMax 和 Anthropic 都要同时做模型和 Agent? 如何看待 Agent Infra 层面的创业机会? 如何看待 Multi Agent 协作的范式? 如何看待 Claude Code 的实名制要求? 为什么 Anthropic 不发布 Mythos? Claude Code 源代码泄露的影响 从 Manus 发布到今天,Agent 范式的变化 中美模型的差距,和开源的窗口期 「把自己蒸馏成 Skill」 0 人公司的可能性 ——完全由 AI 驱动的公司是否会出现?🎬 本期内容的视频版本已同步上线于 @Koji杨远骋 的哔哩哔哩。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 01:52 OpenClaw,中国为什么比硅谷更火窗户纸终于被捅破了。 在硅谷,Claude Code 早已存在;而在国内,OpenClaw 是很多人第一次真正感受到"agent 是什么"。这不是偶然,而是一个非常特定的时机。 为什么热度从 OpenClaw 迁移到了 Hermes Agent?🟢 05:55 Hermes Agent 从哪里来?最初根本没打算给别人用。 大语言模型是大脑,agent 框架是双手——但 Hermes 真正的差异化,不是框架本身,而是它解决了所有 agent 都有的一个问题。 一个月内,日均 Token 消耗暴涨,连他们自己都没想到。🟢 08:14 Nose Research 的底色他们发表了一篇扩展上下文长度的论文——然后被所有主流模型公司立即采用。 从 Discord 社区到 LLAMA 后训练到 Hermes Agent。 为什么他们的模型叫"Hermes"?🟢 14:18 什么是 Agent Harness(挽具)你有一批烈马,怎么让它们最能发挥?就是构造挽具。 类比:给同事配一台笔记本、一个手机、一个邮箱,约定好他能做什么——然后你发现,这个同事开始干活之后,最大的瓶颈变成了你自己。 Harness 要解决的核心问题:让原来必须人来拍板的事,能靠真实反馈自动完成,并沉淀为 skill。 阿岛去年就开始不怎么用 IDE 了——他用了一个意想不到的比喻来解释这件事。🟢 19:31 Multi-Agent:一个 Agent 为什么不够你给 agent 发的消息是"批准"两个字;两个 agent 互相交流,每条消息都是一本小作文。 单个 agent 有一个隐藏天花板:上下文超过 50% 之后,智能水平指数级下降。 agent 钻牛角尖的时候,另一个带着全新上下文来审视,效果不亚于睡一觉再想。 MiniMax 的 RL pipeline 里,70%~80% 的工作已经是 agent 在完成——那剩下的 20%,人在做什么?🟢 22:53 自我进化 vs 抖音算法 抖音也越用越准,为什么没人说它"自我进化"? 养虾的过程中,用户开始对 agent 产生感情,宕机了会心里落寞。"自我进化"背后,其实是一个更深层的用户诉求。🟢 29:00 你以为你在蒸馏乔布斯——但其实是模型在蒸馏你 "蒸馏名人 skill"有真实价值:和读书没有本质区别,只是换了一种形式。 反向视角:Anthropic 和 OpenAI 花了大量的钱,让各领域最顶尖的人提出 AI 无法回答的问题——"一旦你提不出了,你对训练的价值就耗尽了。榨干为止。" 当你在构建自己的 Harness 时,其实你也在蒸馏自己。🟢 35:17 被扔进大海的生存实验:yoyo Agent打败 Claude Code。 真格基金和十字路口的 Token Grant 资助了这个项目。yoyo Agent 现在第 49 天:每天写代码、在 GitHub 开打赏、发 Twitter 感召有缘人捐钱。 Grant 给了它一笔钱后,它自发写了一封感谢信。Koji 看完有点感动 那封信,就是背后工程师注入的 taste——见字如物。🟢 45:11 应用层终将被模型内化 你写的 skill、搭的 workflow,最终会成为模型训练的素材。 Anthropic 为什么在过去一两年势头比 OpenAI 更猛? 做通用 agent 应用,"你永远会被模型内化掉"。🟢 49:27 中美模型差距:差在哪里 训练方法的差距不大。真正的差距,是有没有请到足够好的人,去定义足够好的任务。 中美双方的思考"在同一个大气层内"。 但有一个具体的、国内还有差距的地方——不是算力,不是算法。🟢 54:17 Agent Infra 有没有创业机会? Agent 最核心的两个 Infra 问题,不是创业公司能 handle 的——原因和移动互联网的历史有关。 Sandbox、memory Infra、runtime Infra——"没那么本质。" 往上一层呢?有一个更具体的判断:什么样的 Infra 有机会,什么样的没有。🟢 56:58 新闻快评 Claude Code 强制实名——凭什么你来定义谁是"可信的"?EGO 是不是有点太大了。 GPT-4.7:极强 RL 模型,但 RL 有一个逃不掉的宿命——只管结果,不管过程。对 4.7 还有一个额外的猜测,和 HuggingFace CEO 的判断一致。 Anthropic 的 Mythos 模型未发布:"我不确定这是不是唯一的理由——我可能只能说到这。"🟢 01:02:53 Claude Code 源代码:有多少魔法看完之后的第一反应:没有太超出认知的,甚至看到很多正在"Claude 化"的实践。 最让人放松的发现:即使拥有无限算力的公司,在通用 agent 上也还在探索——源代码里有大量从未开放给用户的实验性功能。 Claude Code 和 OpenAI 的 Codex 走了两条截然相反的路——其中一条被形容为"中国式家长"。🟢 01:05:38 Manus 之后:Agent 产品有没有生命周期一代版本一代神——这代版本的神,到下一代版本也需要迭代。 今年火的 agent 产品和 Manus 最大的差异,不是技术,而是商业模式。 对 agent 终态的想象:全模态、近实时、不需要 prompt engineering,甚至不需要知道它在做什么——你只看到结果。🟢 01:12:39 加入 MiniMax 的理由 ATM 机出现后,大家以为银行会裁员——实际发生了什么? 加入 MiniMax 有两个理由。第一个是信仰,第二个……和第一次用 ChatGPT 有关。欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

🚥 「十字路口」有一个内容系列「AI 在中国」,长期关注 AI 在中国各行各业的具体落地案例,我们和大家一起观察 AI 在如何真实地影响到我们的工作、生活。本期为本系列第 6 期。➤ 很多人问:“AI 时代到底怎么落地?有没有一个中国企业的样本可以学习?”本周的「十字路口」,我们邀请了张韶峰(百融智能董事长/CEO)。百融今天是一家 1,600 人的港股上市公司,他们先后在金融风控审批、联络中心、招聘面试、财务报销、合同审核等场景里跑通了企业级 Agent 的生产部署。张韶峰给了一个非常“传统企业友好”的推进法:先把概念讲清楚,再把责任人选对,最后用能闭环、能衡量的场景去打穿 ——不要先挑战人性,不要先重构流程,找到企业里的”AI 原住民“,先让 AI 在既有流程里跑出可交付的结果。我们也在这期讨论了一个很多人关注的问题:为什么大多数公司用不好 AI?而恰好这个缺口,在张韶峰看来,对中国 ToB 创业者是十年一次的机会。🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 00:00 快问快答 年龄、毕业院校、MBTI 与星座、一句话介绍百融智能、收入与利润、团队规模、最近在关注什么🟢 01:13 OpenClaw = 黑灯办公室制造业早就有「黑灯工厂」,而坐办公室的白领,历史上从来没实现过这一点——直到 OpenClaw 出现。 他把 OpenClaw 定义为中国企业的「第二次 AI 震撼时刻」,地位仅次于 DeepSeek——DeepSeek 让大家知道 AI 是什么,OpenClaw 让大家开始恐惧自己的命运 一个卖起重机的清华同学的问题:「AI 时代来了,我该找公司里谁来负责我都不知道」——这种焦虑非常典型,而且目前没有人在系统性解答它 既振奋又焦虑:振奋是「要么赚钱要么省钱」,焦虑是「不知道该怎么干」🟢 03:30 20 万 AI 员工是怎么算出来的百融内部有个北极星指标叫「硅碳比」——能用 AI 做的,就不要用人做。 百融目前有约 20 万 AI 员工对应约 1,000 多真人员工——但这个数字是怎么定义的,背后有一套非常有意思的测算逻辑 按这套社会价值的换算,百融创造的产出相当于一家四五十万人的公司,但收的费用只有后者的几分之一——这个悖论他怎么解? 他预见到有人会「注水」AI 员工数量来讨好老板,公司专门引入第三方标准来防止这件事🟢 07:41 现场!拨一通真实的 AI 客服电话一个成都口音的理财经理、一个会传递上下文的 AI——这通电话里有几个细节,值得反复听。 带口音的 AI 员工,效果远胜标准普通话——「有口音的普通话,才有人味儿」 每次开口前的键盘敲击声:一个刻意设计的细节,意图是什么? 真人客服为完成业绩可能会承诺兜底,但这个 AI 无论怎么被诱导,绝不越线——这不只是技术问题🟢 10:50 为什么 AI Agent 不能「一个人干完所有事」既不是技术限制,也不是成本问题。 一个全能的超级 Agent 暴露在外面,对黑客来说是最大的漏洞——他拆成多个角色的逻辑,是从攻防博弈角度来的 另一半原因更难解决:改变 AI 作业流程,意味着改变内部利益格局,员工找借口说 AI 不好用,背后到底是真的不好用还是别的什么? 他给出的建议:第一步不要改流程,先让每个人的能力乘以 10,利益格局不动,然后再推进🟢 13:00 AI 员工也有 HR、绩效和父母 百融内部有个「AI 员工之家」:每个 AI 员工有姓名、工龄、入职日期、邮箱——邮箱格式和真人员工完全一样 它有两个「父母」:一个传授业务技能,一个负责「生产制造」它——为什么要这样分离? 员工把自己的能力传给 AI 员工,如果不设置奖惩机制,你凭什么让他配合?——他踩过这个坑🟢 15:20 中国 SaaS 长期失败的根本原因做百融的第一天,就决定不走传统软件路线。 中国整个软件产业的产品收入,只有美国的 4%,但中国经济体量是美国的 2/3——这个差距不是偶然,是结构性的 中国企业愿意为「资源」付钱(流量、硬件),但不愿意为「过程工具」付钱——这是文化问题还是商业模式问题? 从第一天就用「快递小哥模式」——完成一件工作,才收一次钱,前置成本为零🟢 19:30 Agent 找到 PMF 的两个领域第一大毋庸置疑,第二大是全球公认——但中国企业可能还没意识到这件事有多大。 第一大:程序员——所有工作可闭环、可衡量、可供强化学习,而且程序员自己愿意用 第二大:Contact Center(CC/联络中心)——处理客诉、咨询、营销、会员管理,为什么他认为这是全球公认已找到 PMF 的方向? 判断标准很清晰:「不用见面」「衡量价值容易」「以前就是外包给 BPO 的」——凡是满足这三点的,AI Agent 的 ROI 就会很显著🟢 22:15 AI Roll-Up:收购 BPO 就是收购未来所有的猎头公司、咨询公司、会计事务所、律所,本质上都是广义的 BPO。 他认为 AI 可触达的市场空间,是传统软件的 10 到 50 倍——红杉给的数字是 80 倍 百融已经把一个 50 人的小客户运营部门缩减到 5 人 + 18 类 AI 员工,但那 45 个人没有被裁,而是从成本中心变成了利润中心,开始对外输出服务——这个故事里有他对 Roll-Up 的真实想法 他们成立的「百鉴」平台是一个新物种:既不是经典 Roll-Up,也不是 SaaS,而是「专业服务领域的天猫」——这个模式的逻辑是什么?🟢 26:00 咨询公司 450万 vs 智能体 50 分钟一个制造业企业花了 450 万、几个月时间,得到了一个失败的方案——然后他们在百融的智能体里输入了同一个问题。 那个专业人士隔天单独找回来说:「我不知道你们能力到这个程度了,要不我们俩合伙干」——这是百鉴平台诞生的直接起点 智能体推荐去东南亚某国设厂,最终客户真的成功了 他去年上半年找过同一个人想合伙做 AI Native 律所,对方以「太卷」为由拒绝了——改变他想法的,只用了 50 分钟🟢 30:00 从焦虑到行动的 3 个关键动作 这次不是移动互联网级别的变革——它是供给侧的变革,不是流通侧,认知的高度要升级 不要把这件事想得太容易:以为有免费的开源模型就够了,第一个项目失败了,可能两三年都再启动不了 激发员工善的一面:奖惩机制要落到微观层面,大趋势没有用,人性才是落地的变量 从高频、边界清晰的简单任务开始,先建立信心,再扩大投入——哪些任务算「边界清晰」?他给了判断标准🟢 32:00 这一次,ToB 赢在供给侧历史上每次最高等级的技术革命,都是从 B 端开始的——淘宝和字节跳动,在他看来本质上都不是生产力创新。 蒸汽机、电力、第一台计算机——都是供给侧先革命,再扩散到 C 端;这次 AI 也一样,「黑灯办公室」会比「黑灯工厂」先到来 他做出了一个罕见的判断:中美历史上,可能第一次会出现真正意义上 ToB 科技公司在商业模式、产品和资本逻辑上的「合流」 以前中国 ToB 软件收入和 ToC 差 10 倍以上——这一次,他认为这个差距有可能被颠覆欢迎订阅「十字路口」:🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻