十字路口Crossing

11 年，110 亿美金，然后呢？｜对话 Airwallex 吴恺：AI 时代，下一站 1000 亿

🚥 我很爱听创业故事——成功的、失败的、峰回路转的、还没有答案的，我总能从中听出几分共鸣与启发。上半年，「十字路口」邀请了很多新一代 AI 创业者，他们分享的多是从 0 到 1、踌躇满志的出发故事。但接下来一段时间，我想邀请更多已经翻越山丘的创业者，听他们讲讲一路走来的经历。➤ 本周「十字路口」的嘉宾，就是上个月刚完成新一轮融资、估值来到 110 亿美金的 Airwallex 空中云汇的首席营收官（CRO）吴恺。他和我们分享了这家由华人创办、从墨尔本起家的公司如何用 11 年时间从 0 成长到 110 亿美金估值的几个关键抉择：拒绝 Stripe 收购、咬牙亏损四年先铺全球网络、坚持在全球各地用当地人做管理者等等。这几个关键抉择很打动我，因为它们本质上都在追问每一位创业者可能都会遇到的同一个问题：当「钱」与「愿景」、「赌注」与「风险」同时摆在面前时，你会怎么选？如果你也在做一件短期看不到回报、但相信长期的事，这期会给你一点具体的力量。故事以外，我们当然也聊了很多 AI。在进入百亿美金俱乐部之后，Airwallex 的优势叠加上了时代机遇：**AI 正在把全球金融推向一个「关键拐点」。**因此，本期播客，我们重点讨了 AI 正在如何改变科技金融行业：Airwallex 正在支持大模型公司：Kimi、MiniMax、智谱、DeepSeek 等。多模型切换、阶梯费率、高峰低谷双倍定价、实时动态计费等新需求，如何倒逼金融基础设施升级？过去需要 10 个金融 SaaS 才能完成的费控、会计、收入确认、对账、计费等流程，未来会被一个 Agent 入口取代吗？ChatGPT Finance 发布后，「金融超级智能入口」的竞争格局将如何演进？Airwallex 连续发布的 Kai、AgentOS、T:0、Airi 等 AI 金融产品，分别是什么？Airwallex 连续收购 Leapfin、OpenPay，并持续推进更多收购。其积极布局背后的核心，究竟是为了获取哪些关键资产？🎬 我们的视频播客将同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 00:42 快问快答：年龄、毕业院校、MBTI 与星座、一句话介绍 Airwallex，以及 CRO 的职责🟢 02:10 服务 Kimi、MiniMax、智谱、DeepSeek大模型公司的需求有何不同？为什么这件事不是模型公司自己算？🟢 05:02 一杯咖啡，如何变成全球支付网络一笔汇款不论大小都可能收取 20–50 美金，创始人的姓名还曾因为与制裁名单同音而让汇款反复被卡。同一时期已经有 Wise、Revolut 等玩家看到机会，Airwallex 后来靠什么走出不同的路径？🟢 09:24 亏四年，先把全球网络铺出来如果只做东南亚，也许早就盈利了；Airwallex 从 Day One 选择的却是先覆盖全球。很多区域支付网络最终卖给了 Visa、PayPal 等巨头，他们为何不卖？🟢 13:12 投资人觉得这个“全球银行”愿景疯了只做资金转移太底层，能直接使用的企业有限；那么 Airwallex 的战略决定是？多条产品线可以同时铺，但每一条都要砍到最小可用——判断“垂直还是全栈”的第一性原理，是什么？直到 2021 年，成立第六年，Airwallex 才真正等来全球银行产品的 PMF。🟢 22:55 财务自动化，从工程团队变成一个运营人员过去只有中大型企业值得搭工程团队做财务自动化，AI 正在把这件事变成中小企业也用得起的能力。Airwallex 的 AI 助手 Kai 内置在 Airwallex WebApp 中，可以分析财务政策、优化流动资金、搭建费用工作流，也能直接排查付款为什么没有到账。AgentOS 则通过 CLI、API 和 MCP，把底层金融能力开放给企业自己的 Agent。Kai 上线约一个月后，他们看到了一个什么样的早期信号？🟢 27:14 SaaS vs Agent为什么 10 个财务 SaaS，会合并成一个 Agent 入口？原来 5 个财务人员使用 10 套软件，未来呢？单点 SaaS 的数据彼此割裂，到了 AI 时代反而会成为致命弱点：没有跨流程数据，它们的 AI 就会更“笨”。T:0 想让公司从第零天就拥有迷你 CFO，Airi 则从一键结账走向面向消费者和 Agent 的智能钱包。🟢 32:17 数据、人才、流量：金融入口的三张牌Airwallex 收购 Leapfin 和 OpenPay，看中的是什么？ChatGPT Finance 想连接金融平台，平台却必须权衡：是借它的巨大流量服务更多客户，还是保住自己的数据与入口？当模型越来越像通用商品，金融超级入口最终会长在哪一层？🟢 37:23 拒绝 Stripe 收购，也拒绝过早赚钱B 轮时，Stripe 曾想收购 Airwallex；真正困难的不是执行，而是在钱和愿景同时摆在面前时做选择。2018 年公司收入几乎为零，吴恺却做出了一份通往十几亿美金收入的财务模型，当时有投资人直言“绝不可能”。六年后回看，实际增长曲线与那份预测只差了约一个半季度。如何做到的？当市场足够大、公司已经就位，剩下的问题是什么？🟢 39:31 13 亿美金 ARR 之后，争夺金融超级入口Airwallex 的 ARR 约 13 亿美金、年增速约 74%，行业毛利约七成；按约 8 倍 P/S 计算，吴恺认为 110 亿美金估值并不高。74% 的年增速来自哪里？除了 Airwallex，还有哪些公司拿到了成为“金融超级智能入口”的入场券？🟢 43:07 全球化，选对本地人全球化最难的是什么？踩过最大的坑是什么？如何选择优先进入哪些国家/市场？亚洲 vs 欧美的不同流量策略是什么？🟢 49:18 从 110 亿到 1000 亿Airwallex 目前拥有 20 多万客户，下一道台阶是达到 100 万客户规模。产品也要从帮助财务人员完成操作，继续走向能够主动提升效率的 Intelligent Finance。如何成长为一家估值 1000 亿美金的公司？欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

快一点！再快一点！快到世界能实时生成｜和生数科技张金涛聊：Vidu S1、推理加速、实时交互视频

2w ago00:41:01Tap to summarize

🚥 没人喜欢等待。模型越强，推理加速就越重要。这一期，我们聊「推理加速」。本周「十字路口」的嘉宾是生数科技的张金涛。月初，他带队发布了 Vidu S1——一个实时交互视频模型：上传一张照片，无论是人物、动漫角色，还是一只宠物，都能变成一个可以和你实时视频通话的 AI 角色。Vidu S1 很快，快到生成速度超过播放速度，并且支持无限时长。这是怎么做到的？金涛在播客中分享了自己这几年一条清晰的技术主线：从 SageAttention（GitHub 3.5K 星标）、TurboDiffusion（GitHub 3.6K 星标），到 TurboServe——一整套系统级方案，为 S1 实时交互提供底层支撑。此外，金涛也分享了他对整个 AI「推理加速」领域的观察和判断。其实这期有意思的，不只是技术。金涛今年 26 岁，还是清华在读博士。真正把他带进「推理加速」的，是一个很朴素的判断——当大家都默认 FlashAttention 已经把 Attention 算子做到极致时，他却发现：显卡上明明还有更快的计算单元没被用起来 ——「这么明显的收益，为什么没人做？」所以这期节目，你也可以把它当成一份「年轻研究者样本」来听：在变化极快的 AI 领域，怎么找到自己的方向、怎么判断什么才是「最正确的事」，又怎么把它一路做到最前沿。🎬 我们的视频播客将同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 01:40 快问快答：年龄、毕业院校、MBTI 与星座、Vidu S1，以及在生数科技负责的工作🟢 02:48 硬件上明明有更快的计算单元“为什么没有人做？这是很明显的一个收益。”当大家认为 FlashAttention 已接近极致，张金涛发现 GPU 上仍有更快的计算单元没有用于 Attention。语言模型早期的 Attention 更受显存传输限制，视频生成模型却严重受计算速度限制。SageAttention 要同时解决底层 GPU Kernel 编程和低比特计算的精度损失，最终成为即插即用的加速方案。🟢 06:15 从 SageAttention 到 Vidu S1：三层加速算子层：让 Attention、线性层等计算尽可能逼近硬件上限。模型层：通过步数蒸馏和稀疏 Attention，把 Diffusion 去噪从约 50 步降到 4 步。部署层：解决多卡并行、通信与计算重叠、用户请求调度。SageAttention 后来成为事实上的行业标准；TurboDiffusion 推进模型加速，TurboServe 负责流式视频的集群部署。🟢 11:24 Vidu S1 不只是快“生成速度需要大于播放速度，它才能做到实时生成。”普通视频模型等待很久生成一段成片，流式模型则要根据用户输入逐帧生成。Vidu S1 实现 540P、25–42 FPS，并能在消费级显卡上运行。比速度更难的是无限时长：生成一两个小时后，画面仍不能漂移或崩坏，还要持续正确回应用户。实时交互是第一目标，当前阶段可以适度牺牲画质，但不能牺牲速度。🟢 15:21 “未来我们的视觉娱乐信号，会被 AI 生成的内容充斥掉。”电影和短视频是预先生成的离线内容，聊天、恋爱、游戏和日常生活则充满实时视觉互动。离线视频可以共享播放，实时视频需要为每个人生成不同内容。张金涛判断，实时交互视觉娱乐的需求会比离线内容更大，而且这条路径已经势不可挡。🟢 17:30 一只狗和一个游戏搭子用户已经开始上传宠物图片与它聊天，也有人让二次元角色实时观看游戏画面、陪自己玩游戏。Vidu S1 能理解输入的视频流；把电脑屏幕传给它，它也可以成为看懂 Coding、微信和 Notion 的“程序员鼓励师”。🟢 20:05 推理加速不只是算子算子加速之外，还要用稀疏 Attention、MoE 和蒸馏减少模型本身的计算量。流式 Diffusion 会引入 KV Cache，还要处理用户随时进入、退出，以及多机多卡的集群调度。TurboServe 对应的正是 Serving 层：把计算图、通信与请求调度组合成真正可部署的系统。🟢 24:39 推理加速的未来，属于更底层和更上层“推理加速的未来，还是属于更底层和更上层。”中间的算子层会随着编程工具进步逐渐收敛；更底层是面向通用或特定模型设计芯片，更上层是用算法直接减少计算。像 Taalas 这样针对特定模型做硬件设计，本质是在通用性与极致效率之间取舍。真正有壁垒的加速需要软硬件 Co-Design：只懂算法，很难判断方案在真实硬件上是否有效。🟢 28:28 中国视频模型的领先原因Transformer 之后，模型结构逐渐收敛，差距更多来自数据量、数据质量、偏好对齐和数据是否容易学习。低质量数据不只是没用，还会污染模型；高质量解释能让模型更快学会关键概念。中国的短视频、直播与电商生态既产生真实需求，也沉淀了更丰富的视频数据；张金涛认为中国视频模型公司目前领先美国。🟢 33:10 世界领先，是把每个环节都做对“知道世界上最正确、最领先的方法是什么，然后把它正确实现出来。”朱军让他理解，GPT-3 的成功不是靠某个神秘技巧，而是把每个环节都推到极致。两行有问题的代码就足以让实验失败；负责人必须能判断方案是否正确、实现是否到位。带团队还要看见每个人真正想要的是工资、Credit 还是成就感，再从第一性原理协调不同部门。🟢 37:54 一行代码，速度快一倍“视频生成得跟之前像素级一模一样，但端到端推理速度快了一倍多。”在清华安静的楼里，他一个线程一个线程地排查底层问题，终于让 SageAttention 跑通。把 Vidu 里的 FlashAttention 换成 SageAttention 只需改一行代码，输出保持像素级一致，端到端速度却提升一倍多。他立刻把结果发给陈建飞和朱军；后来又带队负责 Vidu 推理与 S1，把这段经历形容得“像在创业”。这段最快乐的科研时光，也来自朱军给出的方向、资源和自由氛围。欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

AI4S 需要狂人与野心家｜对话英灵殿 Odin："如果神存在，我怎能容忍自己不是神？"【公路播客】

3w ago01:01:39Tap to summarize

🚗 这是一期「公路播客」——我们把播客搬上了车，边开边聊。一路上的风景和松弛，让这场对话聊出了很多平时聊不到的东西。🚥 本周「十字路口」的嘉宾，履历"离经叛道"到有点不像真的。他是英灵殿创始人 Odin。高中辍学、在家自学考上浙大；本科修了药学和物理两个学位；两度从硕士项目离开；又申请进了 David Baker 实验室——然后 Baker 很快拿了诺贝尔化学奖，而他选择了离开，投身 AI for Science 的创业，短时间内融资数千万美元。他给自己起名 Odin（北欧神主），给公司起名"英灵殿"（战士英灵集结、迎战诸神黄昏的地方）。他说："如果神存在，那我又如何能容忍自己不成为一个神？所以神是不存在的——如果你能创造万物，你就是神。"一路上，他抛出了一连串金句：谈创业动机："创业本质上是我对世界的一种不满。"谈离开诺奖实验室："对于我来讲，它是一副玉做的枷锁，很好看，但它限制我变得伟大。"谈世界观："世界不是草台班子，它是一个随机游走的粒子——你要做的不是撞对方向，而是尽快收敛到下一个碰撞点。"谈融资与诱惑："你在融资的过程中，很容易被异化——你到底是面向 VC 的创业，还是面向市场的创业，还是面向自己的创业？"我们还聊到了他想做的"全模态分子世界模型"和"通用科学人工智能"，本质是想造一台"新时代科学发现的蒸汽机"，把人类的科学进程压缩上百年；也聊了佛法、姜文、《禅与摩托车维修艺术》，和他挂在嘴边的那句——"两眼一睁就是干。"这是一期关于野心、初心、反叛，以及一个年轻人在 AI 时代押注「分子世界模型」的对话。你会听到一个研习佛法、头戴头巾的 00 后创始人，如何一边谈"修习戒定慧、熄灭贪嗔痴"，一边野心勃勃投身 AI for Science 创业的故事。🎬 我们的视频播客将同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 00:28 快问快答：年龄、毕业院校、MBTI 与星座、一句话介绍英灵殿、融资情况、团队规模、创业前经历🟢 02:26 一个「将错就错」的名字世界模型火之前，他们就叫「”分子世界“模型」。为什么几乎所有人都只做蛋白、只做单一模态，而他偏要做全模态？他说：不是别人做不了，而是别人有「惯性」。五年前学物理时的一个直觉——生物里的氢键、疏水、范德华，都只是电磁力的泰勒展开——这跟统一所有分子设计有什么关系？五年前学物理时的一个直觉——生物里的氢键、疏水、范德华，本质上可以归结于电磁相互作用力的泰勒展开——这跟统一所有分子设计有什么关系？「如果你能模拟并设计每一种模态的分子，从某种程度上讲，你就是在创造，你就是神」🟢 08:00 一个本科生，8 个靶点，梭哈一轮以前一个靶点配一个博士生，现在一个本科生带着做，8 连就解决了。ODesign：「哥几个再有钱，就能把它做成产业」？8 个靶点直接梭哈，每一轮都出 sub 纳摩尔级别的活性分子——AI 到底帮到了科学的哪一步？「它最后不是取代人类，而是把人类从繁杂的工程化问题里解放出来，去 focus 那些更哲学、更基本的问题。」🟢 09:41 「科学通用人工智能」每天起床先吃四个鸡蛋。佛陀教我三件事：「等待、斋戒、思考」——创业者为什么把日常过成了修行？有一天你去医院抽血，多花 20 块，就能筛查阿尔兹海默症早衰——背后是什么样的模型能力？这件事为什么「只有 2026 年才能做」？——答案跟技术拐点无关。🟢 13:18 大家都在各自的领域「等风来」AlphaFold、diffusion、宋飏那篇 SDE……哪一阵风，真正把 AI for Science 吹了起来？药物管线看起来最赚钱，他为什么短期内坚决不做？「从一开始做管线，实际上容易变成药企的敌人，而不是朋友。」30 人的团队，为什么 Day one 就配齐了 COO、行政、HR、甚至出纳？一个反直觉的组队顺序。平台和管线看似二元对立，他却说它们「有机统一」——怎么讲？🟢 21:23 我赌 Baker 会拿诺奖，然后我走了待在一个刚拿诺奖的 lab 里，势头正好、资源涌来，他偏偏选择离开。去之前就笃定 Baker 能拿诺奖，「这个信念哪来的？」——直觉，梭哈。在西雅图雷尼尔雪山的阳台上，他想明白了一件事：那些美好的 title，是「用玉做成的枷锁，很好看，但它在限制你变得伟大」。「平生不修善果，只爱杀人放火」——他为什么用这句话形容当时的自己？🟢 24:58 像朱元璋造反，回沛县喊兄弟1 月开始一个个打电话，靠什么把散落各处的博士生重新召集起来？靠 title？靠钱？他说更多的是「信念、愿力，和历史上的 reputation」。想象那件「真正伟大」的事：让本科生做出 professor 级别的科学发现，「新时代科学发现的蒸汽机」——这个类比从珍妮纺纱机讲起。🟢 27:50 一切都是好事「这是好事」是不是他的口头禅？他说自己早就抛弃了好与坏的二元对立。「有好坏的是你自己的心」——境随心转，到底是精神胜利法，还是别的什么？高三辍学，保留学籍在家自学，每天骑 10 公里去图书馆，山西的冬天不戴手套——他怎么一路考上浙大？「我没有好的学习方法，我只是每天学 16 个小时而已。」🟢 31:58 「拿诺奖秘诀」他从 Baker 身上学到的「拿诺奖秘诀」，简单到有点离谱。「你决定就好」：什么时候放权，什么时候拍板？「做所有中国投资人都投得起的好企业」硬科技的一号位「基本上只有一次机会」——大部分 research talent 都想等到三四十岁「一击必杀」，他为什么等不及？🟢 37:25 创业就是修道，一直在做减法融资的过程里，「你很容易被异化」。面向 VC 创业、面向市场创业、面向自己创业——你选哪个？他坦白自己也动摇过。VC 今天爱听什么故事？拼装世界模型、拼装 agent、再拼接 robotics、抗衰老……为什么这些都是「异化」？投资人一路追问他的模型架构，他却说这事没那么重要：「架构是无常之物」——那什么才是彼岸？一波 PhD、教授集体下海，他怎么看这轮热潮？「现在是战国时代，5 年后会有一个秦国大一统。」🟢 48:18 为什么给自己起名叫「Odin」Odin、英灵殿、诸神黄昏——一整套北欧神话命名背后，藏着一个不小的野心。「如果神存在，我如何能容忍自己不成为神？如果你能创造所有分子，那你就是神。」从蛋白，到 RNA、DNA，再到修改基因——「重编程整个生命」这条路，理论上能走到哪一步？从无机物里创造出意识、创造出生命——伦理问题他怎么看？他说那还太远，制药只是「副产物」。🟢 1:01:00 「何为祖师西来意？」「你变得很有钱、很成功之后，还记不记得起一开始的初衷？」头巾戴了这么多年，最初是为了嬉皮士文化，最后理由变得极其简单。「在路上，比到达目的地更重要」——一个创业者，为什么把初心看得比什么都重？欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

Agent 元年第 500 天：什么在消失，什么在诞生——为什么我们不该再投资 GUI 思维的软件？

Jul 100:52:04Tap to summarize

🚥 这是一期真格基金「此话当真」与「十字路口」的串台播客。去年，十字路口的开年对谈播客提到 2025 年是 Agent 元年，现在距离那期播客过去了 500 天。差不多在第 100 天的时候 Manus 爆火，Claude 3.5 Sonnet 提供了 Agent 的基础；在第 300 天左右，Claude Code 刷屏。到此时，第 500 天左右，Agent 领域的突破和新概念仍在不断井喷。这期播客，我们用一条主线尝试把过去 500 天的变化串起来：GUI 退场 → Headless 上位 → CLI 复兴 → Skills 封装 → Agentic Economy 萌芽。我们试图探讨：在 Agent 元年的第 500 天，什么在消失，什么在诞生？消失的可能不是 GUI 本身，而是“人必须在流程里当传送带”的前提；诞生的也不只是新产品形态，而是一整套新的分工与定价方式：Headless 工作流、CLI 复兴、Skills 封装、以及正在成型的 Agentic Economy。本期嘉宾：钟天杰(真格基金投资总监)、归藏(AI 开发者)如果你想在概念爆炸中找到清晰结构，这期内容或许能提供一种梳理视角，帮你把这些变化串联起来。🎬 我们的视频播客将同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 开场：Agent 走过 500 天00:18 Agent 元年至今 500 天，发生了什么？03:39 一句话总结 500 天：上下文管理越来越重要04:04 不变的是新概念被祛魅，不变的是模型能力持续进步🟢 关键词一：Headless（无头软件）04:31 软件没有界面了，只剩数据库与工具06:40 GUI 是人类认知缺陷的补丁09:52 做产品不应优先想界面，而是用户真正需要什么10:47 Notion、飞书与 Google Suite：老软件如何面对 AI 入口12:17 Gmail 通过 Codex 授权，Agent 绕开 GUI 直接访问15:56 大量公司主动推出 MCP/CLI，是投资人视角的重要趋势16:37 作为 PM 最重要的是定义问题，不要去解上个时代已解决的问题🟢 关键词二：CLI18:36 CLI 的核心：命令行执行、纯文本、与 AI 天然契合19:47 AI 解决了 CLI 最大障碍：人类根本记不住成千上万条命令20:54 微信、小红书、美团等垄断性软件至今没有推出 CLI21:17 开放 CLI 防守两难，背后需要极大决心与勇气23:59 如果工具能通过 Agent 更好地找到用户，就应该开放 CLI25:07 最希望哪一款产品开放 CLI？26:25 年轻人开始在抖音上聊天，DAU 1 个亿🟢 关键词三：Skill27:38 归藏的 PPT Skill29:23 让 Claude Code 拷问你的 grill-me30:59 Skill 会自我沉淀，把你的品味提炼成可复用的结果32:13 Skill 是长期存在还是过渡？模型能力增强会逐渐消化一部分34:25 谁最有可能成为中国的 Claude Code？35:56 小红书 Skill 商店与 Skill 的商业价值39:29 CLI/Skill/MCP 各自适用不同的能力场景🟢 关键词四：Agentic Economy（智能体经济）39:45 To Agent 基础设施：沙箱、记忆系统、支付40:59 现在仍是大基建时代，Token 变得更智能更便宜是主旋律42:18 Token 价格会浮动，受能源、电力、模型水平影响🟢 关键词五：OpenClaw43:23 OpenClaw 100 天热度极速消退，但留下了什么？43:58 最大意义是塑造共识，帮大众完成对 Agent 的认知转变44:31 证明了 IM 形态的价值，用户需要在熟悉界面里与 AI 对话🟢 关键词六：Token Grant45:18 为 AI 开发者提供 5 万元算力支持45:45 Code Pilot 已有 6000 GitHub 星标，足够开放、本地化的 Agent46:42 一场数字生命实验，0 行代码进化到 10 万行代码47:27 今天创业缺的不是钱，而是 Token50:13 下一个抖音未必是新的形态，可能是 10x 产能的抖音🟢 补充说明：《你的第一个 Agent，我们为你充值》《歸藏：从 Prompt 到 Harness，上下文就是一切》《我给了他一个梦想：超越 Claude Code》🎪「真格基金」与「十字路口Crossing」共同发起「Token Grant」，将为每个入选项目提供五万人民币 Token 费用，从最早开始支持大家 build 下一代 AI 原生产品。投递入口欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

我遇到了第一个真正想买的陪伴机器人！｜对话世博：越伴动力创始人【公路播客】

Jun 2800:52:21Tap to summarize

🚗 这是一期「公路播客」——我们把播客搬上了车，边开边聊，氛围松弛下来，往往能聊出平时聊不出的故事和想法。🚥 如果你关注具身智能，大概率已经见过太多"参数很强"的机器人。本周「十字路口」的嘉宾是越伴动力创始人世博同学。他被一些人评价为“少年版稚晖君”：从大一开始就手搓过 30 多款机器人，机械/硬件/软件/运控几乎全栈。⁠这次创业，世博选择不设计“有用”的机器人，而是要设计一个"能长期生活在家里"的生命。他们刚发布的产品「小伴」不会说人话，却会发出一种像"外星语"一样的声音；它会撒娇、会委屈、会拒绝你——但奇怪的是，这些"不听话"的瞬间，反而让我觉得：它可真像个生命啊！从"为什么要专门给它设计一种语言"，到"全身 95% 都是柔软材质"，再到"用快慢脑把交互延迟压到 0.4 秒以内"，世博给出了一套非常具体的产品判断：第一，陪伴不是讨好；第二，生命力不是可爱；第三，少就是多。这是一期关于热爱、审美、工程、在路上，以及人为什么需要陪伴的对话。你会听到一个 26 岁的具身机器人创业者，如何用极致的审美和极致的工程，把"哆啦 A 梦"带进现实。🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 00:00 快问快答年龄、毕业院校、MBTI 与星座一句话介绍产品、融资情况、团队规模、创业前经历🟢 03:50 给机器人造一套“外星语”语言是加分项还是减分项？“它但凡会说得太像人，可能就不想买了。”你听不懂，但你会慢慢“感觉到它在说什么”。一种像宠物、又不像宠物的中间态。🟢 05:48 好产品不是靠功能堆砌起来的把“动作”当成情绪表达的主通道。当把“说话内容”降到 8%，设计重点就会完全换一套。手臂方案：类连续变形体，让手臂“duang duang”的。柔软外壳：90%+ 柔软材质覆盖。“外星萌物”：不是猫狗、不是小孩、也不是人形。🟢 08:41 不做“讲道理”的机器人定价，和定价策略。买回家，怎么才能不吃灰？目标不是“可爱”，而是“生命力”。机器人也要被允许变得“不那么讨好”。🟢 11:52 快慢脑 + 云端超长程记忆云端超长程记忆的目的：推动性格参数多维成长与动态演化。端侧快脑 1.7B、慢脑 7B：分别负责什么？为什么要这么分工？把延迟压到 0.4 秒以内。“动作生成”：同一句话、同一场景，也不重复同一套动作。🟢 15:26 创业时机为什么要等到 2026 年才能做出来？语言模型 + 视觉模型 + VLA/WAM 架构发展：哪一项真正改变了产品可行性？创业时机：心理/能力/经验准备好 + 看到了行业机会 + 找到切入点。🟢 24:13 陪伴 vs 讨好你到底想要一个永远顺着你的东西，还是一个会有情绪、会转身走开的“伙伴”？“不讨好但让你感觉被陪伴”。“你好难看！”——你会如何解读它的委屈？🟢 28:45 如果它在我家待一年买回去的第一天会发生什么？呆满一年之后呢？眼睛是情绪表达的载体。瞳孔/巩膜/花纹参数化控制，让目光看起来更像“活的”。🟢 31:11 “我有做机器人的天赋”第一台机器人与成就感。“快乐到晚上躺床上反复刷自己的视频。”从作品心态切到创业心态：“做机器人为了自己爽”到“要让用户爽”“务实 + 浪漫”：浪漫是愿景，务实是交付。🟢 37:02 可爱不是终点，生命力才是目标两项基座能力：家庭机器人基座 + 情感交互模型基座 = “生命力”。情感大脑是什么：高阶决策 vs 低阶操作的分工🟢 46:55 “No excuse for engineer”“不找借口，分析原因”。一条泥鳅的陪伴记忆。想把“告别”这件事变得不那么残酷。🟢 49:56 有意义的瞬间把哆啦 A 梦带进现实。“想造一个真正能陪我自己的机器人”。机器人以完整形态站到大家面前时，忍不住掉了眼泪。欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

对话 MiniMax 闫俊杰：M3、10X 计划、10T 模型、和智能的终局

Jun 2100:38:24Tap to summarize

🚥 本周的「十字路口」在 MiniMax Dev Meetup 现场录制，Koji 对谈MiniMax CEO 闫俊杰（IO）、Multica 创始人张佳圆、DeerFlow 核心负责人何涛，以及上市公司金融行业 AI 负责人虞扬。我们围绕 AI Coding、Agent 与工程化落地的下一阶段展开。这期重点是闫俊杰 IO 的分享——也是他最近少有的公开露面：M3 的关键突破和评价对训练 10T 规模大模型的决心与路径中美模型差距的真实尺度模型的数据观转向，与推出 10X 专家合作项目的缘由AI Coding 迎来拐点：工程体系 vs 次抛代码“基模 vs Agent”到底是什么关系？MiniMax 下一阶段如何下注与取舍？其他三位嘉宾也从各自视角分享了很有趣的观点：张佳圆分享了多模型/多 Agent 的组合思路来平衡成本与质量；何涛强调工程的核心是长期维护与交付体系，而不是一次性把任务做完；虞扬补充了金融等垂直行业里 AI 的价值更多在“把信息变成可执行的决策路径”，以及在高频变化中降低门槛、提供辅助与陪伴。这期内容更像 2026 年中的一个时代切片：大模型公司、开发者、开源项目与垂直应用的一线代表同台，分享当下真实的观察、故事与认知——也因此更值得被反复回听。🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已经发布于 @十字路口Crossing 公众号。🟢 01:41 M3 的关键突破和评价衡量一代模型到底行不行，IO 盯一个"比较客观的指标"——不是分数，那是什么？去年五一假期，团队第一次在 M1 跑通某件事——有点像"瘫坐在椅子上、后背发凉"的感觉本来 M2.5 一天烧 1 万亿 token 就满意了，结果一路冲到 10 万亿，超目标 10 倍🟢 12:09 基模 vs Agent，到底是什么关系？"去年这个时候，我想不到现在的模型是什么样"没有 Claude Code，某个模型可能也火不起来；没有 GPT-5.5，Codex 也起不来。模型越来越强，但 IO 坚持一个"前提"。🟢 14:12 训 10T 大模型的决心10T 大模型必须训成，最大的卡点是什么？"AI 已经是个很大的产业了，就跟半导体一样。"为什么这件事只能"一代一代往上做"，急不得？外推一旦失效，模型就成了开盲盒。🟢 15:54 中美差距：10 倍，就是整整两代美国模型"基本上大 10 倍"，而 10 倍意味着整整两代。国内每家都得先把 3T 做好、再做 10T——但一个 10T 模型需要 200T 数据，"全世界都没有这么多"。一边"我们进步速度最快"，一边又"比较忐忑"——为什么？🟢 17:53 AI Coding 拐点：是工程，还是"次抛代码""从来没人说 vibe engineering，但写代码从来都是 engineering。"人人都能 vibe coding 之后，每个人都成了"产品经理"。何涛一句暴论：最讨厌别人说"这是 agent 做的，别怪我"——用你的账号提交，背后是谁的责任？一个人改十几个仓库、提个巨大 PR，"看起来对，但没人敢上线"——问题出在哪？🟢 27:12 数据观转向：他们开始招核物理学家一年前以为数据就是标注，现在 MiniMax 在找经济学家、哲学家，甚至核物理学家。做 coding 时他们就发现：开发工程师比算法同学更懂"什么叫好代码"——这推出了一个什么结论？Anthropic 为什么要养核物理学家？MiniMax 推出 10X 专家合作，想补上哪一环？🟢 30:30 MiniMax 下一阶段，下注什么？AI 是个黑盒，连做模型的人都不懂它IO 最关心的，是什么时候能"用 AI 帮人类理解 AI"。大脑里的海马体，居然和模型训练里的某个机制惊人地像。一年前我们还不理解"对齐"为什么重要，现在越来越确定——为什么？欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  本期主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

哪条路线，才能通往「世界模型」的终局？｜对话黄碧薇：Aether AI 创始人

Jun 1800:49:39Tap to summarize

🚥 总有人在朝着星辰大海前进。世界模型是 2026 年 AI 与具身智能领域最热的关键词之一。但越是热门的词，越容易被过度使用：视频生成、3D 生成、JEPA、VLA、WAM，似乎都可以被叫作世界模型。可当我们真正谈论「世界模型」时，我们到底在谈论什么？本周「十字路口」邀请到 Aether AI 创始人 / CEO 黄碧薇教授。她从德国马克思普朗克研究所、CMU 到 UCSD，一路深耕因果发现与因果 AI，是这个领域的重要学术贡献者之一。Aether AI 最近迅速完成 2000 万美金的天使轮融资，黄碧薇选择把因果 AI 这套长期被认为「更合理、但更难实现」的方法，带到 Physical AI 和机器人大脑的问题里，打造「因果世界模型」。我和黄碧薇聊了世界模型的定义边界、视频生成为什么不等于世界模型、VLA 为什么在真实任务中碰壁、WAM 为什么可能只是中间态，以及「因果世界模型」想要解决的三个核心问题。这也是一期关于创业选择的节目。为什么一个 UCSD 教授会在 2025 年初决定下场创业？她看到了什么信号？如果你正在关注世界模型、具身智能、机器人、因果 AI，或者正在思考下一代 AI 范式会从哪里出现，这期节目也许能帮你重新校准一个问题：哪条路线，才能通往「世界模型」的终局？🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版将发布于 @十字路口Crossing 公众号。🟢 🔴 🟡 🟢 00:43 快问快答：求学和科研经历、MBTI 与星座、一句话介绍 Aether AI 与产品、融资情况、创业前经历🟢 02:13 三条世界模型路线，和那条没人提的第四条视频生成、3D 生成、JEPA 都在被叫作世界模型，可当我们说「世界模型」时，到底在说什么？世界模型 ——一个听起来很宏大、用起来却很不准确的词，到底是严肃的技术对象，还是被混用的热词？「不是那三条路线，是我们在做的第四条」🟢 04:49 因果世界模型，到底不一样在哪真正的世界模型，要在隐空间里同时学会三样东西——是哪三样？同样是 AI，凭什么 LLM 不懂因果也能逻辑严密，世界模型却非因果不可？为什么 LLM 偏偏只在自然语言和 coding 上大获成功？🟢 10:33 第一版因果 AI 世界模型满分 10 分：VLA 天花板 5 分，WAM 6.5 分，因果路线……她敢打几分？训出第一版，预期要喂多少小时数据、用多少张卡？四类数据怎么配比？模拟、ego-centric、视频、遥操，谁占 80%，谁只占 20%？WAM 只是个「中间态」——比 VLA 好，但为什么注定到不了终点？🟢 16:17 因果学界的「三国鼎立」三个门派、三位 80 多岁的泰斗，早年居然「互相不服谁」——这是一段什么样的江湖？图灵奖得主 Judea Pearl 和哈佛的 Donald Rubin，分歧到底在哪？师承 CMU 的黄碧薇，站在了这三派的哪个位置？🟢 22:32 因果简史从亚里士多德、易经，到临床双盲实验，再到 80 年代末 CMU 三位教授的一个算法。做实验太贵、很多时候根本没法做，科学家于是把目光转向了「只看观测数据」——这条路是怎么走通的？黄碧薇这些年最核心的贡献，是在一个满是隐变量、bias、缺失值的「不完美世界」里做因果——为什么这反而最难？🟢 20:35 因果和大模型过去因果帮 LLM，其实只有内、外两种方式——分别长什么样？OpenAI、Anthropic、Google 这些大厂，到底有没有把因果 ship 进产品？两个创业选择摆在面前。🟢 41:08 PhD，到底还值不值得读加入 OpenAI，一年 3000 万美金——这时候还该静下心做科研吗？什么样的人才该读 PhD？怎么分辨自己对研究是「真欲望」，还是只想要个学位？工业界和学术界的墙正在变低，这对纠结的人反而是好消息——为什么？🟢 47:17 五年后回头看，今天什么是错的如果能向一个无所不能的上帝问一个问题，她想问的，竟然关于「因果是否真实存在」。VLA 不是终局、WAM 也不是终局，但它们各自留下了什么？如果因果不存在，「我们会集体陷入存在主义的巨型危机」。欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  本期主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

高手怎么用 AI？普通人怎么学 AI？投资人如何投 AI？｜对谈课代表立正

Jun 1001:03:50Tap to summarize

🚥 本期「十字路口」有个很好的时间点：2026 年过半，AI 已经强到足以改变“怎么工作”，但离“无摩擦地替你把事做完”仍然有距离。➤ 上半场，我邀请到身边用 AI 的“高手”课代表立正，他是康奈尔经济学博士，创办了 Superlinear.Academy，曾在 Amazon、Meta、腾讯工作，在初创期加入 Statsig，后被 OpenAI 收购。课代表立正分享了高手的 AI 为什么会越用越强？——他们在想“我能为 AI 做些什么”，并且把生活和工作的大事小事全都交给 AI。他也分享了一些普通人如何用好 AI 的建议 ——比如，第一条：停止使用 ChatGPT 式聊天，改用 Codex / Claude Code / Cursor / Manus 这类 agentic 工具。➤ 下半场，我们交换角色，由课代表立正采访我：2026 年的 AI 创投观察与思考。我分享了在一线体感里同时存在的希望与失落——希望是创业与资本热情前所未有，且“人类与 AI 的最佳协作方式仍未被发明”，摩擦本身就是机会；失落是商业价值高度集中到基模，它们吞掉了绝大多数由 AI 而生的收益，应用层常像“推土机前捡钢镚”，传统软件的老路径（需求—产品—卖给更多人）变得更难。此刻，创业与投资的机会正在两极化：要么往天上跳（AI for Science / Physical AI），要么往地里钻（行业深水区的流程改造与交付 / FDE）。最后，我还分享了自己最近关注的 5 个 AI 创业方向，欢迎 AI 创业者们找我探讨。——————ps，向大家推荐大家关注课代表立正和鸭哥的 Superlinear Academy。当我们聊到「学 AI」究竟应该学什么、怎么学的时候，他们给出了一套特别好的方案。🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 🔴 🟡 Part 1 - 课代表分享：高手怎么用 AI？普通人怎么学 AI？🟢 01:40 高手用 AI，到底差在哪高手和普通人的差别，在哪两点？想学世界模型，他没看论文，而是让 AI 写了一篇三万字的办公室恋情狗血小说——为什么这招有用？🟢 04:33 今年学 AI，最重要做一件事为什么他坚持「立刻停止使用 ChatGPT」，去用 Claude Code / Codex / Cursor？蒸汽机换成电机，工厂效率只涨了一点点——真正的跃升要等到一件事发生，是什么？用聊天框比用 agent 工具「差了三个点」。🟢 10:56 好 skill 和 context，才是护城河工具一样、模型一样，最后拉开差距的只剩一样东西。一个好 skill 的本质是什么？skill 能不能被商品化卖钱？用好 AI 的第三步——积累上下文和提炼上下文，为什么是两个要分开做的动作？🟢 15:03 摸着石头过河，石头不见了——消失的那块石头，到底是什么？从需求端和供给端两头看，旧的创业逻辑为什么突然不灵了？他上一家公司能列出一百个「你该买我」的理由，可现在客户跟 Codex 聊两句就走了。🟢 22:01 AI 会带来第二次文艺复兴为什么非常看好自己孩子的未来？当 AI 把「螺丝钉」彻底取代，人被逼着只能去做一件事。未来的教育，可能不再是精通一个专业，而是「略懂一二」一百个专业。「你以为学 AI 是学名词，其实学的是动词。」.🟢 🔴 🟡 Part 2 - Koji 分享：年中对 AI 创业投资的观察与思考🟢 25:49 2026 的创业体感：泡沫的另一面Paperboy AI 创始人那句让 Koji 印象极深的话：人类和 AI 的最佳协作方式，很可能还没被发明出来。「软件已死」「悲观者往往正确」——但为什么只有乐观者才可能成功？资本前所未有的热浪，和显而易见的泡沫，是同一件事的两面。🟢 27:54 在推土机前面捡钢镚一张图显示：这一波 AI 创造的商业价值，90% 被模型公司吞掉了。既然在推土机前捡钢镚只能捡到钢镚，那剩下两条活路是什么？为什么一条要「往天上跳」、一条要「钻到地下」？AI for science，for what？具身智能动辄百亿估值的背后。🟢 32:51 FDE：把数字员工带进公司OpenAI 和 Anthropic 几乎同时发了公告，提了同一个新词。FDE（前端部署工程师）到底是个什么角色？这个词其实早就存在（售前、客户成功、驻场工程师），但被重新命名之后，发生了什么？这么大的人才缺口，为什么到现在还没井喷？🟢 43:30 新时代的 VC 长什么样叙事连接器、connector as a service、新型财务伙伴——这三个角色分别在解决创业者的什么难题？「自强则万强」——为什么一个创业者太需要 VC 指点，反而会让人「非常担忧」？好投资人应该像副驾，而不是一路喊红绿灯的人。🟢 50:00 五个方向everything agent：沙箱、记忆、通信、支付…给 agent 设计产品：飞书口碑飙升和它的 CLI 有什么关系？当 agent 找不到你的工具，你就「等于不存在」。视频模型：可灵 5 亿、Seedance 15 亿美金 ARR，云南小镇一个拍婚纱照的青年做出了全球刷屏短片。软件不会消亡，GUI 也有未来。和语音相关的一切。欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  本期主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

OpenAI 和 Anthropic 共同看好的 FDE：AI 时代的新岗位出现，旧分工松动｜对谈 Rolling AI

Jun 300:55:07Tap to summarize

🚥 上月，Anthropic 和 OpenAI 在同一天分别宣布了各自的十亿美元级的企业 AI 合资公司，并且都称自己在做的事情是 FDE（Forward-Deployed Engineer，前置部署工程师）——帮助 AI 进入企业，从“能用”走向“上岗”，从“展示能力”走向“交付结果”。本周「十字路口」，我们聊 FDE 这个正在被重新定义的岗位与分工：它究竟是在把“售前/交付”换个名字，还是代表 ToB AI 时代新的组织结构与商业边界？当模型越来越强，最后一公里为什么依然最难？企业真正缺的，到底是更强的模型，还是能把 AI 带进流程、接入系统、治理知识、持续迭代并对结果负责的人？我们的嘉宾是 Rolling AI 的两位合伙人阿甘和刘开，他们是中国在企业 AI 落地与“交付能力产品化”方面实践最深、也最具代表性的团队之一。如果你在寻找下一波 AI 的机会，这期内容希望给你一个可行动的视角：旧分工在松动，新岗位在出现，而新的创业机会，也往往从这些缝隙里长出来。🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 01:08 快问快答年龄、毕业院校、MBTI 与星座、一句话介绍 Rolling AI、收入与利润、团队规模、创业前经历🟢 02:19 FDE：AI 不是软件，是劳动力OpenAI 和 Anthropic 同一天宣布成立十亿美元级企业 AI 合资公司，都说自己在做"FDE"——他们到底在描述一件什么事？传统软件是工具，需要人来操纵。但 AI 本身就是劳动力。FDE 做的，其实有点像 HRBP：把"数字员工"送进企业。为什么从 BCG 出来做这件事？MBB 在服务中国民企时，遭遇了什么困难？传统咨询交付 200 页 PPT，今天他们交付的是智能体。🟢 08:22 首个案例：一个人带 50 个机器人，服务 600 万用户出生率下滑，乳品企业急着找第二曲线。他们需要的不是几个营养师，而是"无限个"营养师。全国注册营养师 40 万，目标用户是 8,000 万——供需差距 200 倍。AI 是怎么填上这个缺口的？"如果有人说我要减肥，你的第一句话应该是：你又不胖，你为什么要减肥。"——这是人类师傅教给 AI 的。而找到好师傅，才是 FDE 最难的事。🟢 19:58 FDE 是什么角色？带着一批"清北学生"去便利店上班的工头。FDE 要做好三件事才能撤场：业务融合、知识治理、系统对接。一个好的 FDE 需要三种核心能力：能一眼看穿业务痛点本质、人机协作的原生感知、能用 AI 工具快速构建原型。这样的人，能短期培养吗？——不能。"你刚毕业，我想不到任何一件你能做、AI 做不了的事情。"🟢 25:09 SOP 代表落后——标准化的终结他认为 SOP 代表着慢、代表着落后——这是暴论，还是有逻辑支撑的判断？从消费端的"千人千面"（抖音），到生产端的"千人千面"（每个门店自己的经营决策）。总部从"管控型"变成"赋能型"，意味着怎样的组织重构？以及，哪类管理层会最先被消失？🟢 28:21 那些消失的企业，真正输在哪里？兰开夏郡的纺织业接了电，但没被电拯救——因为他们只把电接到了原来蒸汽机的大轴上，整个生产方式还是蒸汽时代的。"AI 这次变革对社会的影响幅度，会超过互联网，像当年电力革命一样大量取代智力劳动。"每次大的生产力革命，都有 95% 的企业消失——而他们都接了电、上了网。那些消失的企业，真正输在哪里？技术在整个 AI 落地过程中，占比不超过 1/3。剩下的 2/3 是什么？🟢 32:01 AI 落地失败率超 50%：三大死法第一大死法：CEO 对 AI 有"超出现实的预期"——"上了 AI 企业就起飞"。第二大死法：让 IT 团队来主导 AI 项目。"谁懂怎么对付客户、让他买保险？是业务团队，不是 IT。"第三大死法：激励机制没跟着变。AI 带来了新的生产力，但生产关系没变——结果会是什么？🟢 43:29 应届生在 AI 时代能做什么？Rolling AI 的高二实习生，他说"丝毫不觉得输过任何一个平庸的五年经验咨询师"——为什么？商业 sense 和 judgment，能培养吗？他说他个人还没找到路径——"有些东西是天生的"。FDE 时代，判断一个人值不值得用，真正在看的是哪三件事？🟢 46:49 OpenAI 和 Anthropic 为什么都突然下场做 FDE一种是"数据饥渴"，一种是"利润饥渴"——真相是？大模型进入行业，遭遇的最大瓶颈不是模型能力，而是行业数据和知识的短板。ToB 本质上不是软件能独立完成的事，而是一个服务业——"需要又懂 AI、又愿意扎进去的服务者，才能改变这个世界。"为什么 OpenAI 和 Anthropic 的合资公司全都是 PE 结构？收服务费根本收不到那部分 upside。🟢 49:08 FDE 公司不应该被 VC"投"，而应该被 VC"拥有""我们一年陪跑收 600 万，但帮客户省了几千万、多赚了几千万——那差价去哪了？"每一家 PE/VC 的投后部门，核心能力之一将会是帮被投企业做 AI 转型。"我们在同一个行业，只服务一家，绝不服务另一家。"当 AI 能带来真实的业绩增长，单纯按日收咨询费这件事本身就不够了——未来的商业模式指向哪里？Service as Software，还是 Result as a Service？欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  本期主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站在小宇宙查看该单集文稿

Transcribe →

2026 AI 游戏全景扫描：四层图景、三大误区、一个共识缺口｜对谈 405 游局筱宁

May 2700:47:22Tap to summarize

🚥 「AI+互动娱乐 / AI+游戏」正处在一个奇妙的阶段：碎片化的 Demo 层出不穷、技术进步快到让人恍惚——AI 生成小游戏、交互短内容、AI NPC、世界模型、实时多模态——但真正能在大众层面形成共识的爆款作品仍然稀缺。本期「十字路口」和关注 AI 互动内容与游戏的播客「405游局」串台，邀请到主播 / 资深游戏从业者筱宁，一起做一次 2026 年 AI 游戏的“全景扫描”：我们把行业拆成“四层图景”，指出三种最常见的误区，并讨论那个最关键的共识缺口到底是什么——以及它为什么更可能从野生土壤里长出来，而不是从大厂里“立项做出来”。如果你是 AI 创业者、投资人，或正在关注下一代内容平台、互动娱乐与 AI 游戏，这期节目希望能给你一个框架：哪些确定了？哪些还在幻觉里？下一阶段最值得跟踪的变量在哪里？🎬 我们的视频播客已同步上线于 @Koji杨远骋的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 00:11 Opening游戏行业对这波生成式 AI 的反应，比互联网公司慢了很多。筱宁在头部大厂做 UGC 游戏制作人，但有一个体感让她决定离开。赛道的两个坐标：「互动」和「好玩」。游戏真正的竞争对手，不是另一款游戏，而是抖音。🟢 02:48 行业的四层图景AI 作为工具：服务于互动内容/游戏的创作流程（更偏“提效/基建”）⁠⁠AI 作为创作入口：以 AI 作为新的“生成入口/创作方式”，更关注结果而非流程⁠⁠AI 作为交互对象：典型是陪伴类、AI NPC 等（把 AI 当作你在内容里“对话/互动”的对象）⁠⁠AI 改变娱乐关系：改变“谁创作/谁消费”、以及社交关系/娱乐关系如何被构建（例如“多人 + 一个 agent”的场景，AI 从 NPC 变成“社交基建/氛围调节”）⁠🟢 05:45 眼前一亮的作品们《星布谷地》的娜洛做了三件事：示范怎么聊天、救场、调节氛围。当这三件事都做到了，它已经不是 NPC，而是一个社交基建的角色。任天堂的《朋友收集新生活》（Tomodachi Life）：捏人、设定剧情、当造物主、当导演、再当观众——「创作即消费」这个体验，为什么他觉得特别有意思？🟢 10:43 AI 版愤怒的小鸟，还没出现愤怒的小鸟不是手游史上最赚钱的，但它是第一个让所有人形成共识的那个。为什么用愤怒的小鸟来类比？那个关键时刻目前还没出现——不是因为技术不够好，而是还缺少一件具体的事情。「AI 版愤怒的小鸟」更可能从创业者中野蛮生长，而不是从大厂内部长出来。🟢 17:54 大厂 AI 布局腾讯、字节、米哈游、网易——面对 AI，四家公司走的是四条路。改变最大的一家，并不是资源最多的那家。米哈游做了一件其他纯游戏公司几乎不会做的事情——「动到模型」去做尝试。「技术宅拯救世界」的基因，在这里有多直接的体现？世界模型（Genie 3 等）真的要改变游戏了吗？🟢 22:31 AI 人不懂游戏的三个盲区「游戏生成」这个词，本身就是对游戏工业化难度的低估。视频生成出来就是完成品，但游戏生成出来只是开始。「无限选择，不等于好玩」。我们高估了自然语言在互动娱乐中的比重。手感、点击反馈、声光电刺激——这些跟语言根本没有关系。对于很多内容产品来说，「可生成」是追逐的终点；但对游戏和交互来讲，「可生成」只是可被设计的起点。🟢 25:15 「AI 时代的抖音」，靠谱吗？Loopit、AIPPY、Rezona、Riffle… 大家都在说要做下一个交互内容平台。创作门槛被极大降低之后，紧接着的问题是？有两个核心问题至今没有被解答。「我们俩都生成了一个贪吃蛇，我和你的价值怎么被别人分别看到？」——如果创作者的价值无法被凸显，平台的供给侧会发生什么？🟢 37:54 TaptapMaker：用过的人两极分化做过策划的人用它：「太好用了。」没做过策划的人用它：「还不如 Claude Code。」同一款工具，游戏从业者和非从业者体验差距为何那么大？有人在上面复刻了 Minecraft 世界，有人做了完整的 Roguelike——原来要一个团队几个人做两三个月，现在一两个人两周。AI 互动影游（带分支线的交互视频）：比短剧更复杂，成本百倍降低，它的春天什么时候到？最长期跟踪的三个问题：交互娱乐里的短内容机会、AI 3D 管线什么时候成熟、以及愤怒的小鸟时刻最终会以什么形式出现。🟢 43:48 当 Claude Code 成了最好玩的游戏如果让游戏策划连续说「最近玩过最好玩的游戏」，越来越多的人，答案已经变了。商业化手游的工业节奏（42 天大版本、21 天小版本），是让热爱最容易被消磨的地方。最近好多人说自己最爱的「游戏」是 Claude Code。感性指标和直觉反应，在互动娱乐的早期，为什么比任何理性分析都更重要？欢迎订阅「十字路口」：🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。AI 正在给各行各业带来改变，我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者，和他们一起，探索和拥抱新变化，新的可能性。👦🏻  主播 Koji：我创办了十字路口，发起了 AI Hacker House 这个新一代 AI 创业者的社群空间，在真格基金担任 Venture Partner（投资合伙人）。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻，Koji 的网站👧🏻 主播 Ronghui：我联合创办了十字路口，在美元 VC 工作过，也做过五年的硅谷驻站记者，关注科技发展和商业故事，欢迎大家找我聊天，和我交流。Ronghui 的即刻在小宇宙查看该单集文稿

Transcribe →

All episodes

11 年，110 亿美金，然后呢？｜对话 Airwallex 吴恺：AI 时代，下一站 1000 亿

快一点！再快一点！快到世界能实时生成｜和生数科技张金涛聊：Vidu S1、推理加速、实时交互视频

AI4S 需要狂人与野心家｜对话英灵殿 Odin："如果神存在，我怎能容忍自己不是神？"【公路播客】

Agent 元年第 500 天：什么在消失，什么在诞生——为什么我们不该再投资 GUI 思维的软件？

我遇到了第一个真正想买的陪伴机器人！｜对话世博：越伴动力创始人【公路播客】

对话 MiniMax 闫俊杰：M3、10X 计划、10T 模型、和智能的终局

哪条路线，才能通往「世界模型」的终局？｜对话黄碧薇：Aether AI 创始人

高手怎么用 AI？普通人怎么学 AI？投资人如何投 AI？｜对谈课代表立正

OpenAI 和 Anthropic 共同看好的 FDE：AI 时代的新岗位出现，旧分工松动｜对谈 Rolling AI

2026 AI 游戏全景扫描：四层图景、三大误区、一个共识缺口｜对谈 405 游局筱宁