
Loading summary
A
我应该是公司第一个离职的人第一个离职创业的人后来才继续出去创业还挺多的对公司的离职流程就是从我那个时候开始有的所以我经常跟朋友讲就是大家都应该给Manas磕一个大家都是收到Manas的庇佑AI生产系统和现在这些AI推荐系统你觉得它的本质区别是什么没有中间商赚差价现在的中间商是谁现在的中间商其实所有的互联网平台都是中间商hello大家好欢迎收听张小军商业访谈录我是小军这是一档由语言及世界工作室出品的深度访谈节目我们希望和你一起从这里探索新世界今天的嘉宾是一位创业者是1toX的联合创始人兼CEO王冠他们现在的产品是AI的视频生成器Mydio王冠是一名产品经理型的创业者我和他认识了很长时间但是他刚从Kimi离职出来创业此前他是Kimi的模型产品负责人哦对了上一个Kimi的产品经理离职创业来我们节目的是明超平除了AI时代的应用型公司要怎么做产品怎么搭组织之外呢由于我也是一名内容创作者所以我也很好奇地与他讨论了许多关于新时代的内容平台、生成系统、AI、创作者与平台权利分配的话题那205年的最后,期待我们和AI共同进步Hello,王冠,先给听众朋友们打个招呼,并且做一个简单的自我介绍Hello大家好我是王冠我是One2X的联合创始人之前一直在做AI产品经理的工作我们这个播客也是约了很长时间能不能先介绍一下One2XOKOne2X是我们把它定位是一个AI时代的产品工作室这边有两层含义一层含义是AI时代因为我们相信AI技术的发展它会带来和之前软件还有互联网完全不一样的产品体验还有商业模式对所以也意味着说未来信息商品的生产分配和供给可能会出现非常大的变化那我们希望在这样的变化里面能够以一个以产品为核心以一个工作室的方式来去探索一些好玩的产品为什么你们叫工作室不叫公司叫studio对其实工作室是一个很像实验室一样的概念它可能相比于公司它的探索性会更强并且在组织形式上面它会更以比如兴趣然后比如说产品的质量效果而非是简单的商业来去作为目标对所以它对于人的这个要求可能也会不一样比如我们会希望说工作室里面的每一个人他都是能够独当一面的每一个人他都应该是一个我们今天所谓叫超级个体但是在One2X内部可能我们来称为叫AI全站工程师相当于每一个人在公司内他都是有一个独一无二的位置他有自己加入这个组织的目标对并且把自己的兴趣和工作内容能够结合起来所以这个是我们认为他可能和传统的公司会不太一样所以我们觉得他很像一个工作室先聊聊你過去吧你是怎麼成為大模型的產品經理然後開始在AI的浪潮下創業的我其實是一個比較草根的創業者草根的意思是可能沒有那麼多很鮮明的標籤我是從大數據這個時代開始做AI產品經理的那可能是这个10年代对10年代就是国内的国内的AI其实我会把它分为三个三个大的阶段吧第一个阶段其实是以大数据和传统机器学习为核心的这个时代对那个时候可能大家都听过经典的例子叫这个沃尔玛超市里面大家要去把啤酒和尿不湿放在一起它的销量就会变好对它里面有一些数据分析的方法在里面对那其实是国内最早的那波AI那再往后其实到了CV和深度学习对那今天的预训练和大模型其实我会把它看成是第三次的这个周期那这三次周期呢我恰好都在一些比较典型的公司里面去工作过啊在大数据的时代我是在百度对我们那会做过很多比较偏底层的这种事情包括什么包括说给一个用户身上通过机器学习的方式去计算非常多维度的标签其实就是今天的userprofile它是推荐系统里面非常核心的一个模块我们当时也做了基于这种用户的这种画像来去做了比如对不同的这种用户能够去做差异化的定价和补贴这样的当时可能在行业里面比较领先这种事情對那再往後到了CV的深度學習的這個時代我先是去做就是算法的這個開放平台就是把各種算法能力API的方式能夠對外提供讓這個外界的客戶用戶開發者他們能夠低成本的去使用到一些大廠才能擁有的這個模型能力對那再往後做了开源的框架就是类似于TensorFlowPytorch是百度自有的框架也是国内比较有名的一个开源的项目叫PytorchPytorch在国内叫飞甲再往后的话其实是在矿事去做跟AI算法生产力工具相关的事情是CV那个时代了对就是怎么能够更快更低成本的去生产出一个算法也是在那个时候开始接触到我们今天叫大模型的东西但是那会没有大模型的概念那会叫预训链模型我记得是20年的时候应该是五六月份GT3出来对所以是从那个时候我开始关注到就是预训练模型这个技术对因为当时GPT-3对我的这个冲击是非常大的我之前一直在做的工作的一条主线都是去让用户更低门槛更方便的去获得某种算法能力当看到GPT-3的时候我突然意识到这种技术它似乎可以让任何一个用户用极低的门槛比如说是一个Prompt一个FieldShot它就能得到某种算法的API对因为你可以就是把GPT-3去变成一个翻译的API变成一个Summary的API对吧只要你有这个FieldShot和这个Prompt的能力对所以当时就觉得这个技术还是就是非常吸引我从那个时候开始去关注这个技术那再往後其實我是就是從曠視是加入了一個就是在國內算非常早的預訓練的startup叫蘭州科技它是之前MSRE的副院長周明舟老師出來創業的項目對從蘭州科技開始的話算是正式的接觸預訓練模型那那会的预训练它的技术是和今天不太一样的就是它的技术是非常不收敛的所以在社区里面它会出现非常多的模型会有不同的这种算法架构的探索对所以那会也没有所谓的参数量这么大训练量这么大的模型它会有很多的这种技术方向可以去选所以我们当时是从社区里面来去观察到底有哪些模型是适合我们去把它做商业化那我们做商业化的方式一方面是先去把来自于社区里面的模型去做中文的复现然后再去对它做一些轻量化的处理让它的使用成本变得更低对所以在那个时间点我们尝试了非常多的技术方向包括文本的生成然后包括文图的生成其实在SD的发展和ChatGP出来之前我们都做过相关的探索并且有一些商业化的呃这个这个承担吧嗯那呃其实ChinaGPT是一个就是很大的就我们今天去回顾它是一个很大的历史事件所以当时对整个行业包括很多的公司都带来了一些呃冲击和影响啊也是在那个时间点呃是23年的年初啊我去到了Moonshot对在ModernShops的话会更接近你说的就是模型产品经理这样的一个角色那其实主要工作也比较简单就是把模型当成是产品一样去design它那design它的什么呢design它的效果和能力并且就是尽可能要确保你design的这些效果和能力它是可以被训练出来的最終用戶是可感知的這大概是我的一個經歷以及你剛才說到的模型產品經理這樣的一個崗位我對他的理解這個很有意思因為我們之前聊過很多人他們其實都是從技術的角度來聊這個AI1.023的這個浪潮那作為一個產品經理的角度你覺得AI從1.0到3.0它的變化給你帶來的改變是什麼有沒有一些切身的體會這個很快十年十幾年是的是的从我自己的经历来讲的话今年刚刚是我接触AI的第10年对但我可能不是以1.02或者是3.0来去区分的我会以是否能够拟合就是你拟合的数据到底是结构化的还是非结构化来去做这个判断因为我会认为说就是比如说传统的机器学习那个时代包括深度学习去做CV比如说人脸这种物体检测然后这个图像分类那个时候的数据我会认为它是结构化的比如说我们去做就是CV的这种算法的时候你需要去打上非常多细腻度的这种标签这些标签它是确定性的比如说是一个矩形它的这个坐标比如说这个物体它到底属于什么类型那今天的大模型会非常不一样因为它拟合的是非结构化的数据非结构化的数据它代表着什么呢它代表的是这个数据对整个世界的表达能力会更加丰富它的表达能力也会更加的连续因为我们的世界它不是一个一个离散的点我们这个世界是非常连续的比如说语言这个东西它就是一个非常连续的东西然后一个视频一张图像它本身上也是非常连续的东西所以如果你以结构化的方式就是只能你和结构化的数据来去得到的模型它是没有办法去表达这样一个连续的世界的所以我会以是否能够你和非结构化数据来去作为这个划分的节点那当然今天我们看到的所有的技术生产类的技术它都是在去你和非结构化的数据对所以我认为这是一个很大的变化还有确实这种感受是确实我们赶上了一个很好的时代对就是它有很多的新的技术然后它会带来和之前的产品它的方法论它的思考方式很不一样的一些新的东西对因为就是因为AI这个行业它是有起伏的而且大部分的时间它对于一个产品经理来讲它是一个相当无趣的工作因为大量的AI产品经理在历史上大家做的都是中后台的事情你很难去走到前台有一个完全以AI为主体的产品可能更多时候都是去做偏中后台的数据的支持然后算法能力的提供然后可能数据的标注策略的制定可能去做这样一些事情但是今天的话我们其实是有一个站到前台的机会就是以AI的能力往前去看那么从技术的角度从模型能力的角度它能够去解决什么样的问题它能够成为一个什么样的独立的产品甚至它有可能成为一个非常这个厉害的产品对吧像Manus对像ChadGPT所以这是一个就是很大的体感的不同就是大家赶上了一个好时代或者说终于等到了一个好时代所以你是觉得在AI时代产品经理的能力是被放大了是吗还是说被缩小了因为从技术的角度来会觉得今天模型就能定义产品那你觉得产品经理的价值是变大了还是变小了我自己的观点当然是在变大为什么呢因为首先模型及产品这个概念我在挺早的自己一篇文章里面也有去提过那可能是也是国内比较早去讨论这个问题的一个文章了但是我今天的这个观点它并不是就我说这个产品经理他的能力是在被放大他并不和模型及产品这个观念产生任何的相悖为什么呢因为我们去想说模型它本质上是一个如果我们对标到人的智慧来讲它本质上是一个System1的东西因为它把大量的信息先提前的压缩进了这套系统里面所以它可以更快的更本能的来去对你的输入去进行反应对那这个时候其实产品它的角色变成了什么呢它变成了就是两个很重要的角色一个很重要的角色是说那这个system1它到底应该是什么样的对就是因为模型所有的能力来源都是它的数据它的数据分布决定了这个模型它具有什么样的效果它的效果是否好是否不达标对那这意味着说本身这件事情是值得被底赞也可以被底赞的那这个其实是产品经理一个非常重要的工作内容就是System1的这个部分它到底应该是什么样的对刚才有提到说这个模型产品经理他的这个工作内容是要保证第一你要能去设计能力第二你的这个能力它要能被实现出来让用户能够感知到这个其实就是一个对于System1来说我甚至认为它会越来越重要的一个能力而不是比如说前期跟技术更相关的那些工作部分比如说Evaluation评测这件事情我们应该是聊过很多次就是比如说我们第一次聊的时候我就跟你去讲过这个对评测的一些理解那可能那个时候它在行业里面还没有太多的这个讨论那可能直到去年下半年到今年的上半年OpenAI然后AnswerPick他们里面的这些产品负责人出来去聊说说产品应该去写这个eval然后应该去定义模型能力这个慢慢变成共识对所以所以这是第一块就是产品经理他本身就会对system1他的能力到底是什么样产生决定性的影响然后第二块其实是跟我们现在正在做的事情就会更相关了就是说当你有了一个好的system1之后那如何去把它的价值能够释放出来因为我们知道说模型所谓叫nexttokenprediction那也意味着说它最终能够实现的效果它的这个输出内容取决于前面它有哪些token这意味着说前面的token会决定后面的效果那这个token它其实是有两种产生方式的一种产生方式是通过模型自己生产就是它在完成你的任务的时候去产生更多有效的Token比如说今天的Resend模型它本质是把用户的简单的这个需求基于自己的这个理解变成一个Resend的过程来去增加有效的这个Token的数量最后来去达到一个更好的效果那这个Token它也可以是来自于模型之外的比如我们今天大家去做workflow然后去做这个agent框架然后去建各个领域的所谓的这种专库它本质上都是在模型之外来去提供更多有效的这个token或者是叫context对那这一部分它和这个模型它前面的这个模型system1能力构建就不一样了它完完全全就是一个产品问题就是不管是agent的框架还是你的workflow还是你的专业领域的这种知识的桩库它跟技术没有太大的关系就是从从这个context从这个frontengineering到今天的contextengineering它的这个概念一直在变化但是其实它在技术层面并不是一个很复杂或者说是就是有巨大挑战性的一种系统其实更多的是你对于这个业务的理解你对于这个行业的knowhow的理解如何把它变成systemone它在去生成内容的时候可以被有效理解并且在经济上面更具优势的一种context的一个输入對所以就是這兩個部分我會認為說其實今天的產品經理他的價值反而是被放大了因為不管是在SamsungOne還是在SamsungTwo他都有產品能夠發揮巨大價值並且可能是要以產品為主導的這樣的一個工作模式你剛才是不是講到你到了蘭州科技然後後來你又去了蒙上這一段經歷能不能也給大家講講对兰州其实是国内应该算最早的几个以预训链技术来作为核心的startup刚才其实有讲是在是在ChinaDB出来之前兰州科技就已经成立并且做了很多有价值的这种尝试的对但其实公司就是周老师他是非常有自己的理念的人就是他的理念是模型应该被用起来而不是应该把它变成是一个越来越大就是大家可能都没有办法去用没有办法去调的一个这样一个庞然大物啊所以兰州他一直有一个理念就是模型应该越做越小所以这个是这个是兰州的一个理念啊就是可能在ChatterGP刚出的时候大家会认为模型是不是应该之后这个越做越大了但其实今天我们也看到有越来越多的模型它在落地的时候是朝越来越小的这个方向去走对所以这个是兰州的一个情况但是它是不是应该先做大再做小而不是直接就是小的這是一個路徑的問題我們剛才其實在講的可能是最終它要被使用的時候的一個狀態所以它可能是一個終點的問題路徑先做大再做小或者是先做小再做大其实都是有的比如说小模型它可以去验证一些技术原型然后通过验证一些技术想法之后再去scale它的数据和它的参数量对那大模型它要为了更好的去商业化那在一些特定的场景里面它就必须要去做小对所以这里面我觉得它并没有谁对谁错它是个路径的问题然后从兰州到Moonshot这段经历的话确实和ChinaGPT有比较大的关系因为当ChinaGPT出来的时候第一时间大家都认为是AGI要来了可能很快就AGI了没有人能够在那个时间点去抵御说有机会能够去为AGI做一些什么事情的冲动我自己在那个时间点其实有两个选择一个选择就是在那个时间点就去创业当然我也去做了一些尝试啊因为在兰州就是在ChatterDB出来之前我们那会儿已经有GPT-3了啊它的这个接口已经很成熟包括海外有很多用GPT-3来去做出来比较成功的产品像那会儿的这个Jasper然后Copy啊包括Replica啊他们都就是都做得很好所以当时我们也在去尝试用这个GPT-3的这个能力比如去做写作的辅助去做这种写作的辅助助手比如在Notion里面可以在你写文字的时候来去给你提供一些文字的处理能力来去提供一些补全的能力这是当时我自己尝试的第一个方向然后这个方向做了没多久就是他刚刚跑通恰恰GPT就出现了当时的这个风向就变成说像Jasper像这个Covid-19这类的产品大家可能都做不下去了啊因为你在ChatterGPT里面就可以完成之前所有各种的文章的写作那我自己的话呃就是也是在思考这个事情啊就觉得说可能这个事情它就不work啊你需要去调整一下思路那去做什么呢我们就常说哎那文字它能够生成的很好那我们就去做它现在生成不了的东西比如什么呢比如说跟代码相关的啊就是就是coding就跟今天的coding不太一样就是今天的coding是另外一个层次的这个代码的生成我们当时想的是说我们去找一个比较简单的比较简单的代码的场景就是比如说帮你去画一个很好的图表就是你输入一个excel啊然后这里面有很多数据那你想去画一张很漂亮的图那怎么办呢對那這個時候我們就說大家用模型用當時的這個Codex的這個接口你輸入數據然後你去描述你想要一個什麼樣的圖表那我去幫你自動生成這樣的一個圖表當然當時的技術是不那麼成熟的裏面還是需要去做挺多的優化才能去把這個好的圖表給畫出來那這個項目這個Demo剛做了一段時間我們剛看到它能夠畫出一張圖表GPT-4就出了GPT-4它也能写代码了它能写Circle了对所以这对我们来说就是又是一次踩到了这个OpenAI的迭代路径上因为它已经能写Circle了那它一定就当时它也能画图了只不过它画的可能没有那么好但它一定会画的更好对吧那我就继续去想说既然上层它的生成能力未来我假设它什么东西都能生成出来那就意味着说我们不应该在这一层再去做任何的产品而应该是什么呢而应该我们把产品形态往下去层一层因为我们用LongChain用的很早就是应该是在20年的年底的时候我们就开始尝试去用LongChain会发现说我们觉得当时可能LongChain的路走歪了因为他把一件可能没有那么复杂的事情慢慢变成像一门变成语言一样复杂的东西他走了跟当年TensorFlow很像的路啊那这里面就存在机会我们就说哎那有没有可能是把就是今天叫Agent當時其實就叫當然其實叫Workflow就是怎麼去把模型的能力怎麼去把數據源變成一個一個的節點把這些節點能夠串聯起來對所以我們做了一個比較偏中間層的事情就是你可以去定義一個Workflow中的節點然後這個節點你可以去給它指定數據源然後每一個節點你可以去指定它的Prompt你可以把這些節點給連起來其實就很像今天的CodesDefi在做的事情那這個項目當時也是剛操完demo當時有機構也是在推這個融資的流程要商會什麼的那個plugin就出了它本身是一个非常简单的workflow但是这代表OpenAI在想同样的问题对所以就是在一在二不在三但是我已经在所谓这个大模型公司的迭代路径上连续踩了三次精准的踩到了它的迭代路径上所以我就去反思说这里面到底是什么问题对吧那最后我把它总结为说虽然之前做了这么长时间的这个AI虽然可能在下载GPU出来之前就在做虚拟模型但是我对今天的这个模型能力它到底是怎么出来的它未来会朝什么方向去发展那你做的事情到底和这个模型的能力它的关系就是你跟它的距离然后你和它的这个方向是不是match这些这些问题我完全不得而知对完全没有任何的答案那这对于一个产品来讲它是非常危险的事情相当于你是在一个非常虚无的低级上面来去构建你的各种想法对所以这是在那个时间点我这个这个放弃掉创业创业这个想法的原因就觉得还是应该去一个能够近距离观察模型能力的地方那刚好是在那个时间点就是和MoonShots内部就是有之前曠视的朋友对他们这个拉我一块去当时虽然MoonShots还不是那么有名就是当时没有六小龙的说法当时可能有其他的这个大模型公司他们的资源会更充足对他们的这个声量会更大但是就是和摩恩Sharks的这个团队接触完之后会觉得说这个应该是我能够更好的去实现刚才说的那个目标的地方你刚刚说那些产品的尝试都在上下公司尝试的是吧还是你自己尝试的是在公司内有些尝试,也有一些是在公司外和朋友去尝试的所以你一直在导致这些事情? 对你一直觉得你自己会创业是吧? 是的然后你去了悦志MBA,当时是几月份? 23年的年初,应该是三四月份吧对是跟Tim就是周星宇因为我们是矿事的同事对之前在矿事的时候也在一些业务上面是一块搭档过对所以当时是他来找我说他们做了一家新的模型公司然后看要不要一块去做一些事情然后包括就是是从他这里我去了解到了压缩的这个概念对当时当时是就是我们俩一块吃饭应该是他给我讲了差不多三个多小时这个压缩到底是怎么回事在哪吃呢就在五岛口的龙人居对一直吃到他们下班对我是完全没有听懂因为因为他讲的全都是公式压缩极智能是吗对压缩极智能他后来写了一篇很长的文章里面全都是各种数学公式他那天大概就是把那篇文章里面的东西用语言的方式跟我讲了一遍所以我完全听不懂但是我大受震撼虽然没有听懂但是大受震撼那就开始去研究这个事情就研究压缩的这个概念往下去想就找到了那个JakeRay的他有一个视频就是专门去讲他当时在OpenAI嘛就是去讲说他们怎么去理解压缩的会发现说里面有很多的观点和Tim讲的是非常非常契合的所以这个算是我开始进入到真正的这个大模型或者是就是这一波的这个AI的一个门就是你的一只脚迈进去了那再往後就是沿著壓縮這件事情包括一些工作的這個時間開始慢慢把各種各樣的信息去進行拼湊對最終形成了對就是可能今天能夠去支撐我去創業的一些底層的底層的一些思考你今天能不能給大家講一下什麼叫壓縮機制呢對這個概念其實會比較抽象因為壓縮本身上是一種算法就是你把一個文件變得更小它本身上也是一種壓縮那為什麼壓縮會產生智能其實在我之前寫的一些文章裡面它也會有提及是因為我們認為壓縮它會帶來數據之間的連續对因为压缩的对象其实是数据嘛那这些数据它原本代表的是对于某一种对象某一种对象的一种数据化的这种表达那当这种表达它经过压缩之后原本一些离散的点就是在数据分布层面它原本是离散状态的一些东西它可能会形成某种联系也就是我们所说的叫连续那这种连续它对外的展现就会是就会是某种智能或者说我们去叫它涌现泛化有各种各样的词或者是叫幻觉其实我会认为说它都是它都是压缩带来的可能一个比较直观的比较直观的例子就是不同的不同的单点的任务就是比如说ARP里面它有它原本有非常多的单点的任务翻译然后summary然后比如说补全这其实都是一个一个零散的这种任务那原本这些任务他们都是被单独训练的有自己的训练数据然后有自己的模型当应该是应该是GBT-2GBT-2的这个时候他把非常多的单点的任务它的数据统一成为了一种可以用自然语言去输入和输出的一种格式再去拿来去训练的时候大家其实会发现说不同任务之间它出现了我们刚才讲的这种连续什么意思呢一个可能不那么恰当的例子就是比如说我原本有一个中文到英文的翻译任务然后我还有一个任务叫这个中文的总结但是你看这个时候没有一个任务叫英文总结就是我现在比如说有一个训练了学习两个任务一个叫中文到英文的翻译然后另外一个叫中文的总结但是我并没有训练一个任务叫英文的总结那连续的意思就是说当我去训练这样两个看上去和英文总结没有什么关系的任务或者说它数据里面并没有这个英文总结这样的数据的时候你发现模型它学会了英文总结對那這樣看上去他就是人類定義的某種智能他好像在去應對一個新的就是之前沒有去見過的場景他能夠做得很好有方法和能力对是的是的而语言其实是一种去做压缩非常好的载体因为它对于这个世界的表达能力是足够丰富的因为有大量的事情我们都可以用语言的方式去表述出来并且语言它的训练的成本相对是会更低的比如说它相对于图片相对于视频来说它的训练成本会更低所以它就会成为今天一个非常好的这个压缩的载体所以可能我现在的向新的这个观点它不叫压缩机智能我会认为叫语言机智能跟你们的那个工作室的这个理念会非常像语言通过压缩产生智能是的然后你去了越智安面以后跟你想象的一致吗你觉得这是一家什么样的公司我会认为就是我在Moreshot呆的时间差不多一年是从23年的年初到24年的年初所以其实我没有经历他后来最辉煌的那段时间你应该是最早一波开始离职的人我应该是公司第一个离职的人第一个离职创业的人后来产品经营出去创业还挺多的对公司的离职流程就是从我那个时候开始有的之前没有离职流程啊是的是的对对就首先我会认为说他可能是我之前的工作经验里面体验最好的体验最好的一个地方因为因为两点吧第一点是大家的目标是比较纯粹和一致的啊那个时间点就叫這個搞出AGI對吧就妳有看過那個兩彈一星叫那個橫空出世那個電影就是造原子彈的那個過程這裡面有一句話叫搞出原子彈挺直腰桿子對吧我覺得當時團隊裡面很多人是叫這個搞出AGI這個挺直腰桿子對吧對所以目標是目標是非常一致和純粹的然後第二點是說和一群聰明人一塊去做事的話是非常省力的就很多時候他可能不需要去開會討論很多的問題去做所謂的對齊去做拉通而更容易出現的事情是可能对于同一个问题大家从各自的理解去主动的做了一些工作然后发现这些事情它可能在某个时间点就被拼凑起来了就是你完全可以基于自己对这件工作的理解去做它那到最后你发现说这个工作它在其他人那里是能够去连上的那就变成了一种大家可以非常自主自下而上的去产生好的创意然后这些工作也最终可以被汇集起来变成好的成果的这样的一个工作模式对所以其实那段时间那段时间我的工作我并不会觉得它累它其实是一种比较松弛的状态因为你会觉得说是在你是在为自己的某种目标去工作你可以完全的去给到自己足够的时间来去思考一些问题你做的所有的产出它大概率是会有用的对所以会是这样一种状态那你还立志对这个其实前面也讲过说我一直是在为创业区做准备的因为你可以看我的工作的历程就是这个公司的规模是逐渐变小了就是公司的成立时间是逐渐就是我加入那个公司就是距离它的那个成立时间是越来越短越来越短了对所以其实照这个趋势推演下去也一定能够推演出我一定会去自己创业这是什么推演第一次听这种推演这样一个终点对吧当然这是一个现象从这个现象其实你已经可以推演出这件事情那当然背后是有一些决策的我自己在支撑的我觉得最重要的这个支撑来自于说我想明白了一个问题这个问题就是前面提到我就是想要去了解模型底层能力要解决的那些问题就是模型能力到底是怎么出来的它未来会怎么发展你做的事情和模型的能力它的关系是什么我觉得我想明白了这三个问题有了答案并且在那个时间点会非常的相信说用这套方法是能够在模型之外其实也不能叫模型之外就是说是能够在整个大模型的技术浪潮里面去真正做出一个好的产品做出一个有生产价值的产品它是能够实现的它是有理论基础的所以就是想在这个问题之后还是没有办法按捺住自己这个创业的热情你在Moshup這一年之中你積累了哪些關於技術的認知技術與產品的認知我記得你之前跟我分享過好多比如說有效數據啊比如說範式轉移啊其实认知比较多认知比较多那这里的话我觉得有一些可能已经已经不适合今天这个时间点再去说它了对因为整个行业发展的会特别快我可能我要不就分享一下到底是什么支持我最终还是愿意在那个时间点能够出来吧就是刚才讲说有几个关键问题其实就是模型能力来自于何处对吧然后模型未来会怎么发展那你去你自己做的事情它不管是个应用还是一个模型它和基座模型或者说是最底层的未来它会越来越通用的那个模型它的关系到底是什么然后我对这些问题的答案其实都归结到了一个点这个点叫我把它称为叫这一波智能的低性原理它其实是我们做AI的就是AI这个行业有一句流传很久的大家自嘲的话叫人工智能就是有多少人工就有多少智能对相信很多人都听过这个话其实这个人工它代表的是什么它代表的是数据如果做AI业务的人大家应该都会有都会经历过这么一个场景就是当一个问题无论如何你也解决不了的时候就是算法通常会跟产品说这么一句话叫产品经理再去搞一些数据这个业务怎么都做不到想要的那个指标了就是怎么去调算法怎么去调训练的方法他都达不到这个指标了最后的解释就是再多搞一些数据为什么是产品经理搞数据为什么不是技术搞数据因为数据它本身代表的是对这个问题的一种理解尤其是当一个问题它有比较强的我们叫业务属性或者是说行业knowhow的时候这个问题它就会越来越偏向产品问题而不是技术问题就是技术可以用技术的方式去产生数据比如说用RL的方式去训练模型本质上是用一种算力来去换数据的方法但是这有一个前提就是说比如说代码或者是数学它天然就是一个很好的封闭域它是能够去自动化的客观的去验证说我的这个数据质量好坏的对但是大量的场景它是开放性的问题它有一些可能对技术来说不太好去触达的这种所谓knowhow那你就需要把它去转化成为数据OK所以对我们刚才讲到说就是有多少人工就有多少智能我认为它依然是今天的这一波AI最底层的一个逻辑不管这个模型看上去它有多么的智能它有多么的向人但是它的底层依然是由数据决定的其实就是我把它称为叫智能的一个时空观什么意思呢就是你想象成为这个智能就是一个空间然后这个空间里面它有一个边界或者我们就想象一个二维空间一个圆这个圆它有一个边界这个边界它代表的其实就是数据数据决定的那个智能的边界那这里面还有什么呢还有算法和算力对那算力是什么算力其实是你能够去逼近这个数据所代表的那个智能边界的速度就是你的算力越充分你的這個算力的利用率越高那你能夠達到那個邊界的速度就會越快你會越早的去觸達到那個邊界那算法是什麼呢算法它其實是這個圓裡面我們可以想像是一個另一個小圓就是這個圓它在逼近這個邊界的時候它其實是會凸出去一些的就是一個大圓裏面有一個小圓這個小圓它不斷地去朝大圓的邊界去靠近那就是最終它是能夠去突破這個邊界的它會畫出一個新的一個圓這新的圓取決於這個小圓它的大小就是它會畫出一個新的邊界对那这个其实就是突出界的那部分就是超出原有数据代表的那个智能边界的部分我认为它就是叫涌现的那个部分所以算法它会决定说你用已有的这个数据它到底能够产生多少的涌现所以这里面我会认为这三个要素其实数据还是更为本质的更低性的对那从数据是第一性这个结论是可以推演出很多很有意思的事情对比如可以推演什么呢可以推演出这个行业它未来会发展的这个阶段对比如在我的推演里面这个行业它就会有三个阶段然后每一个阶段它对你的数据会不同然后它也会會更利好不同的用不同方式去做產品去做業務的這種玩家比如第一個階段第一個階段我們今天去看的話它應該已經過去了第一個階段它其實就是圍繞所謂公寓數據的階段公寓數據就是互聯網數據對你有我也有它是互聯網沉澱下來的然後包括歷史的信息化進程所沉澱下來的去把它做很好的清洗整合把它训到模型里面这其实就是第一阶段大家都要去做的事情那这个阶段的数据我们刚才讲说数据决定了模型能力的那个边界嘛那它的边界其实是固定的就是大家的这个圈都是这么大那其實比的是說誰更先去到達這個終點那他一定會更適合說比如說人參密度高然後你也有足夠充分的算力並且你的決策速度很快的這樣的組織就是你的組織消耗少對吧所以你覺得在算力算法差不多的情況下然後大家又用相同的數據都能達到差不多的邊界有沒有可能是我能實現AGI你實現不了没有代就是模型的效果不会有代差OK对就是可能大家因为这些模型架构的一些差异然后因为这个数据分布的一些差异可能你在这方面在某些任务上比我好一些我在一些任务上比你好一些但是它不会存在所谓代差对所以这是第一阶段那这样说的话是不是中美其实会拉平其实现在已经是挺的了因为今天基座模型的能力它已经不是最底层的这些数据或者是算法的一个差异而是国外的模型它有一些先发的优势算力多算力多就快一方面是算力然后另外一方面是因为它更早的去提供服务所以他们其实在不同的场地里面搜集了更多的数据然后这些数据经过有效的筛选之后它又重新回到了模型里面那这件事情随着比如说国内的模型它也会有越来越多的人大家会去用起来那这些场景的数据也会回流到模型里面就是这个差距也会慢慢的抹平掉好这是公寓数据对那公寓数据完了之后大家其实就会拼所谓我有你没有的数据这个就是所谓domain的数据那domain的数据他就很利好大厂或者是一些信息化做的比较好的一些比如说传统行业他信息化做的比较好然后他未来会接受到这种技术外溢的一些人才的红利那他就可以把自己的这个domain的数据也用大模型的方式利用起来对那更不要提说天然就有业务场景然后就有产品渠道就有用户所以它可能就会进入到一个对大厂来说更擅长的一个领域对这个模型的能力也会出现一些差异它会越来越分化其实前两个阶段它都不属于产品创业的机会它不属于产品创业机会第一个阶段它会更适合机座模型然后第二个阶段它会更利好大厂那什么是适合去做应用层的这个创业的机会呢它也跟数据有关我们俩称为叫第三份数据第三份数据是一种我们俩称为叫这个产品内生的数据就简单来讲就是之前不存在的数据可能举一个不那么恰当的例子就是ChadGPT就是在没有ChadGPT这样一个产品形态之前当然就是之前用InstructGBT的这个模型就是ChatterGBT是从InstructGBT过来的那没有这个模型和ChatterGBT这样一个形态之前其实历史上没有一份数据是用通过对话的方式自然语言对话的方式去解决各种各样奇奇怪怪的问题那这份数据是因为有了ChatterGBT这样一个形态是因为背后有了一个可以去响应这种对话输入输出的一个模型然后它慢慢转起来的然后它变成了说今天我们发现越来越多的问题它都是可以通过对话的方式去解决的这边其实你要追根溯源的话其实用对话去解决各种各样的问题它就是一份来自于ChatterGBT的内生数据对所以我们会认为说ChatterGBT它是对于所有去做应用的公司来讲都是一个非常好的这个参考的样本就什么意思呢它通过去创造一份之前不存在的数据来去建立起来了自己的产品价值以及所谓的壁垒只是因为它原本是做模型的所以它天然就有自己的模型对就是他是在做产品的第一天就把模型的那个工作环节给补上了而已那对于未来要去做应用的公司其实大家也是要去参考这样的一个路径的是什么呢是说在去做产品的这个过程中可能要从第一天开始就要去设计出一份之前这个世界上不存在的数据它是通过你设计了这样的产品形态才产生的并且未来这份新的数据它是会和你自己的模型能够就是能够被驯回去那这样的话就是刚才讲的那个问题就是你做的这个事情到底和就是最底层的那个越来越通用的这个模型它的关系如何去保持一个安全距离的一种解法对TESTPT有数据飞轮吗它把数据驯回去对它的产品价值是什么有一段时间模型的能力是变化非常快的就是从敲击GPT刚出到GPT-4那段时间它的那个模型能力的变化是非常非常快的但是再往后你会发现说这个模型能力好像就是它的那个进展没有那么快了甚至有一段时间它的模型能力是出现下降的就是所谓降质就大家直观的感受是降质當然有來自於比如說他要去做成本的優化他去maybe他換了更小的這個模型當然有這種可能但是它其實也存在另外一種另外一種可能就是如果你不經篩選的去把所有的用戶數據都訓練回模型的話那我們剛才講過其實數據它是決定了模型的智能的對那也就意味著說你的就是你的這個模型的能力就會趨同於所有用戶使用所代表的那個就是那個用戶的平均智能水平對所以就回到你的這個問題就是其實輪這個詞數可據飛能它不太準確了因為數據飛輪它往往代表的是大家可能直觀理解就是這些數據它都是有用的但實際上並不是所有的數據都是有用的有一个很重要的工作我们刚才讲到模型产品经理他有一些工作内容对吧其中有一个很重要的内容他如何去决定System1他的这个能力那一种方法就是说你其实要从数据里面應該有某種機制能夠找到代表著更高智慧的那些數據而不是一股腦的把所有的這個數據都訓回去司機數據應該是取優質司機的30%5我忘了的數據然後再做訓練他不能拿所有司機的數據是的是的就比如說FSD他今天能夠用於去訓練的數據可能已經不足千分之一了但一开始肯定不是这样对它是不断地去提高它对于数据筛选的一个标准这里面不同的行业然后不同的产品形态其实它就会有不同的筛选的方法和逻辑对但是大的原则都是说你要从已有的这些数据里面去找到对智慧有增量的那个部分这有效数据需要是高质量数据不能是所有的数据是高于模型当前水平的数据就是你得让跟一个更聪明的人学才行是的是的其实聊到这里就回答了前面的那个问题就是为什么会出来是因为你推演出了未来有一个属于AI应用的那个阶段并且这些AI应用是不用像这个ChatterGift刚出来的时候大家去担心说我做一个产品然后第二天我就会被机动模型给吃掉就是你是没有这个顾虑的因为你可以通过去构造自己新的产品形态去产生一份内生数据未来长期的和机动模型去保持一个共同存在的这样一个状态对那所以就是想到这些之后就出来了对你说你在去月之暗面之前经常做产品就发现就是做在了openad延长线上就是它会被模型公司碾压你现在怎么避开它的延长线呢这其实是一个竞争的问题这其实是一个竞争的问题就首先不会存在说你能做其他人做不了的事情就永远不存在就不要说OpenAI了就是任何一个公司你都不能说它做不了你做的事情所以这里面我们会去看这么几个维度第一个维度是大家的目标的问题就是你做这件事情到底是为什么对这个目标每一个公司他即使是可能看那个产品非常像但其实大家目标一定是不同的这个目标它会影响什么它会影响说你最终在发展过程中去走的那个路径以及说这些路径它其实也会反向去影响你的目标就是它会导致你可能走出一条跟别人不一样的路到达一个不一样的终点然后第二点是说第二点是说你的这个叫位置的这个问题就是你是从一个什么样的出发点来去做这件事情什么意思呢就是比如我们刚才讲说你要去做一个应用层其实第一步是要想清楚你得到的数据是什么那往下去延伸说那这份数据因为它之前不存在所以它是需要你去设计的那所以你看如果你是从第一天开始以设计一个新的数据来作为起点和我从一个就是要去解决某一个很特定的有商业价值的问题我去设计它的那个软件功能的形态为出发点那这个位置它就是不一样的那目标和位置它又会影响什么呢它会影响说大家未来发展过程中的这个速度对它会影响速度对那当然这个速度它本身也带有组织的属性那一定是就是团队越小团队人才密度越高越早期它的速度它大概率是快的就是包括它的行动的自由度可能也是更高的对所以回到你的问题就是我们并不认为说今天我们在做的事情或者任何一家公司在做的事情大厂不会做OpenAI不会做如果他们压根都不思考这个问题那大概就说明说你想的这个方向可能是错的没有价值对所以不存在这个可能性唯一的差别在于说你去做这件事情你的出发点然后你的这个前进速度然后以及你设定的那个目标的不同最终会导致你和其他人做这件事情你的这个路径和最终达到那个终点一定是不一样的就是今天可能很多方向上面大家这个产品形态会非常像比如之前做chat的时候大家都是chatbot对然后可能接下来做coding大家都是这个就是cursor的那个形态对这些都是今天这个时间点在产品非常早期的时候我们去看到的一些就是方法的收斂方法的收斂就做這件事情方法大家是收斂比如說產品形態這個軟件就該長這樣對吧大家都應該有一個chat框然後大家都應該有一個ID這個東西已經收斂了對但是你底層的做法然後以及你做這件事情的目標會導致說接下來的這個時間大家的分化會越來越大所以就是我不知道這麼能不能就是回答你這個問題就是首先我們也不会去担心或者是或者是焦虑就是其他人他是不是在做同样的事情其他人会不会去做这个同样的事情那我们要去关心的就是说自己是从一个什么样的起点去出发的那我们的目标是什么然后不断的去找到说达到那个目标中间这个路径怎么让他速度最快就可以了你刚才你说了三份数据第一份数据是公寓数据第二份是领域数据第三份是这种新产品带来的新的内生数据第一份数据第二份数据我们都很清楚第三份你觉得哪些产品实现了在你看来你觉得满足你说的这个条件就是能够在产品内产生新的数据今天来看其实不那么多为什么因为我也覺得不那麼多對因為這個階段它就是相對靠後的因为这个东西它是隐藏在产品背后的就是你看它的这些产品界面你可能是没有办法去猜测说它背后到底有没有去设计自己的这个数据你是看不出来的所以我可能要回答你这个问题我可能只能从我自己的这个例子来去说对比如我们现在在做的这个产品是跟我们把它称为视频生产相关的对那我们去做这个产品的第一步其实并不是直接去设计一个视频编辑器的形态软件形态而是什么呢而是从设计一个如何去表达视频和制作方法的语言体系开始的对就是一个视频它为什么是这样你如何用一种很清晰的結構化的語言能夠去描述出來然後一個視頻它為什麼被做出來是這樣它的這個製作過程也應該是可以用一種非常結構化非常清晰明確的這個語言去表達出來的對所以這個其實是我們工作的出發點叫一個視頻它長什麼樣以及它的製作過程應該是可以用一種語言去描述的那这份语言至少在我们的视野里面它之前并不存在它是我们设计的一个DSL就是一个特定领域语言然后第二步才是说从这样一个语言再往下去走那我前面应该有一套什么样的这个技术的这个架构从数据的存储开始然后包括到今天可能叫agent的框架对吧或者是workflowanyway各种各样的东西再到前面的软件的这个界面其实我们会把软件界面称为是一个environment是一个环境对就是你应该了解就是强化里面的概念就是你要去搭建你要为智能体活动去搭建一个环境为什么要这么去做因为只有完成了从语言的设计其实也就是数据的这个定义它有和这套语言所匹配的整个工程的这个实现我们来讲说从数据存储到前面的比如说整个软件概念设计这个概念建模然后再到前面Environment里面的各种功能每一个按钮然后用户的每一个指令你都能够用语言的方式把它连起来这件事情它才是一个足够我们认为它是未来具备智能化的一个系统智能化可能的一个系统什么叫智能化可能整個這系統它運行的過程中人和智能體它都是在這個環境裡面去做活動的然後這些活動它會去產生數據然後這個數據它未來是可以去訓練一個模型然後並且你能夠有足夠的方法去篩選從數據中去篩選出所谓的有效数据那这一切其实都是都其实是从数据就是从那个我们说的那个设计一份新的数据设计一种新的语言为出发点来去做的这其实只是我们自己的一个实践就是就像刚才说的我其实并我们也不知道就是其他的这个产品他们是用什么样的这个思路和路径去做但是只是说这个是和我们刚才讲的那套逻辑在我们产品的实践过程中它是能够匹配上的你们现在获得了新的数据吗对当然怎么获得的呢你可以想象成为我们在做的产品它其实很像一个标注平台就是这个软件界面我们来讲它是一个environment这个environment它里面有兩種活動的主體一種活動主體是人然後另外一種活動的主體是AI叫智能體也好或者叫其他的名字也好對那這兩種活動主體它在活動過程中是會產生數據的智能體能產生人也能產生當然比如他們做什麼就是一个视频该怎么去做出来比如这几个镜头的顺序为什么是A而不是B就是它的组合为什么是A而不是B这个可能是人就人在生产视频的时候自动它的工作流就被你记录了然后这个对你来说是一个数据标注对你可以这么理解就是为什么叫它环境呢就是因为这个环境它代表的是主体就是人和AI它能够去行动的范围就这个环境里面你得有一个功能有一个能力这个人或者是AI它才能够按照这个能力去行动才能产生相关的数据对吧那再往下一步这份数据它得能够被学习就产生了数据就这些软件也在不断的产生数据对吧就是这个所有SaaS的这个产品因为它都是在线的所以它都会产生这个数据就人在一直使用它一直会产生数据那这个数据是不是一份可被学习的这点是更关键的一件事情对那什么叫标注呢就是其实我们并不会去把用户的这个使用来去作为未来这个系统要去迭代的参考为什么呢因为就回到刚才那个点就是你要去找到所谓叫有效数据所以这件事情它在很长一段时间这个标注它是由我们自己的专家来去完成的我说了它是个标注平台所以我们其实是会有你可以认为叫知道怎么去做出更好视频的这样的一个角色他们来去用这个产品就好比以前说DeepSeeker他们内部有那种学中文的那种标注是的是的是的就是OpenAI做完GD4之后就开始招各种什么Stanford的PhD然后甚至招一些大学的老师来去标一些领域的数据对你可以想象成为在自然语言的问答这件事情上ChatGBT就是一个环境只不过这个环境它可以对外去使用也可以对内去使用对我们来说其实也是一样所以它会实现的是什么就是你其实可以不用在软件层面去做任何的迭代和优化你通过标注产生数据然后重新把它内化到你的这套系统里面你就可以实现让前面的这个用户他可能昨天做的这个视频和今天做这个视频他会感觉到质量不一样了我觉得我自己的工作就很希望有一个AI能够记录下来我的工作流然后它能帮我以后完成因为我觉得它其实是一个固定的工作流我很希望AI能取代对因为这其实就是刚才讲到讲到那个第三个数据的一个非常非常典型的表现就是你的工作流你的knowhow它其实是没有被信息化的就是为什么你们的文章比其他的好的文章可能写的更好这里面一定是有代表着某种方法的对吧但是这个方法它并没有被信息化这其实就是一份我们刚才去讲的尚未形成的这个数据那你当时为什么在众多的第三份数据中选择现在这个方向这个方向是怎么做的选择你是24年底开始创业的对吧是的是的这个想了多久啊我们是24年年初我是24年年初对出来开始创业对只是过公司我们成立的那个过程比较坎坷只是说到24年年中的时候我们才把公司成立起来对你是23年年初加入的Moonshot然后23年底离的职24年年初离的职然后24年年初开始创业的对24年Q2才把公司建起来怎么坎坷了是是很坎坷啊对这其实另外一个故事我们先说前面这个视频这个事情吧对就是首先我们当时刚出来的时候视频这个模特还是不成熟的对多模特还当时还不是一个主流的声音是的是的就是最成熟的是文字然后图片也还不错然后再往下可能是跟声音相关的对比如说音乐视频其实在当时的状态是是比较早期的一个状态对那为什么去选择这个方向其实有几点考虑第一点是从商业层面来去考虑的就刚才讲了我们是一个起于微末的团队就是我们一开始就很坎坷没有什么钱所以我们要想的第一个问题一定是怎么能够赚到钱开始去养活自己对那视频显然是一个价值更高的一种模式对那视频赛道上面你去研究会发现比如在美国市场上面虽然这个CAPCUT它的这个营收是一记绝尘的但是你会发现可能有20到30家做所谓视频处理的这种软件产品SaaS的这种产品它的AR都能做到几千万美金它是一个非常典型的蚂蚁工具市场这意味着什么呢这意味着说你在任何单点能力上面如果能做到足够的好用那你就能够产生不错的收入因为视频它的价值是更高的对然后第二点是从技术层面去考虑因为我们刚才讲了我们要去做的未来这个产品它是要从设计一个数据出发的设计一门语言出发的那要去设计一门语言的前提是这件事情它能够被设计成为一个所谓的封闭域就像围棋一样围棋它有规则然后它有固定的这个棋盘的位置就是封闭语代表的说你的行动你的下一步的这个行动是可被计算的对所以这点很重要那你会发现说视频处理这件事情对视频处理这件事情它是可以被设计成一个封闭语的为什么因为视频的处理过程你可以把它其实你就可以把它看成是一系列的我们大家知道原子能力比如说视频的某种特效它就是用原子能力一个花字它就叫一种原子能力对吧对就是视频处理它的这种原子能力的数量是有限的你可以用一个最小化的原子能力的集合就能够做出某种视频视频的制作过程本质上就是这些原子能力按照时间关系的一个这个排序或者是组合对所以它是可以被设计成为一个封闭也意味着说它符合我们要从设计一个语言设计一个封闭的任务出发来去做一个产品的这样的一个技术的一个特点什么叫设计一门语言就刚才讲的就是一个视频它是什么样然后它是被如何制作出来的你应该有一套清晰的语言体系能够去表达它它是一个学科你可以这么认为它是一个高度能够被明炼和评判的一个学科对就是你可以把它抽象成为一系列的对象然后每个对象有对应的属性和值然后这些对象和属性值它是可以用一种语就是依托于某种语法来去表达说这个视频是这么被做出来的这个视频它是长成这样的它并不是说单独给它开了一门语言对吧它其实是一个可描述的状态但是我们还是用大语言来描述它它是一种介于自然语言和代码中间的一种形式就是你人maybe是能够看懂的但是它有特定的格式所以刚才讲的是第二个维度就是从技术上面来说它是符合我们就是做这个产品的一个出发点然后第三其实还有一个对未来的考虑这一点其实是我觉得是有点抽象并且它未必是对的只是我们自己会这么想就是我们会认为说之前互联网时代它的这个模态不管是PC互联网还是移动互联网它都是从文字图片然后再到声音最后再到视频是这么发展过来的我们去回想这个PC互联网然后移动互联网的发展历史它其实就是好就是那些大的这些产品都是用以这样的一个模态顺序它发展过来的为什么呢核心原因在于说一方面是有所谓这个硬件和技术的一个约束比如说流量很贵对吧然后其实更主要的是模态越高它对人来讲生产的难度也就越大就是写文字比做视频一定是要更简单的就对你来说可能不这么认为但是你要能写出一篇文字我们不是说这个文字的好坏就是你能够写一篇文字作为一个文字的创作者和你要能做出一个视频成为一个视频的创作者它的这个门槛一定是不一样的所以它就一定会有这样一个发展顺序因为门槛更低的它的产量就会越大它就会更多的人能够加入到生产就是写文字的人他天然就会比做视频的人多你看这是互联网的特点因为它并不解决生产问题对吧互联网并不解决生产问题它解决的是连接问题它解决的是分配问题还有消费的问题就如何去消费这样一个内容所以它的生产都是在人这里那今天有了各种各样的生产能力尤其是这些生产能力未来越来越成熟之后其实不同模态的生产能力它会被拉得很平就是你要用AI去写出一个好文章和你要用AI去做出一个好视频它的那个门槛可能并不会差异很大对那代表着什么呢那代表着说一定是价值更高的那个魔胎他在这个市场上他就会有他就会越来越占据更统治的地位大家一定更愿意去看视频对于广大的这个人民群众来说大家一定会更愿意去看视频你这个可以从抖音啊TikTok这种可以看看到嗯对是的那如果说不同魔态它未来的这个生产的门槛都被拉到很平了那意味着一件事情就是今天价值最高的这个魔态它其实是下一个时代也就是AI时代的起点就是未来只会出现比视频这个魔态更高级的东西价值更高的东西比如说软件比如说游戏对就是今天大家还在这个怎么讲就是比如说生成游戏它还是很难对吧你要生成一个很棒的游戏生成一个小游戏可能已经很简单了但你要生成一个有消费价值的游戏它可能就不那么容易但是视频可能已经可以了就今天它已经可以了但是我们是在24年的年初在去想这个问题所以你一定得去站在一个新时代的起点来去做这件事情所以我们认为说视频其实是AI时代内容的一个起点前面干嘛语言都是预言是吧就至少它的商业价值可能不会那么高OK对所以是这三个维度那你怎麼看圖片這個魔胎這圖片魔胎包括文字魔胎然後包括聲音其實他們是它们是视频的组成部分未来也会变成比如说软件和游戏的组成部分对之前为什么会出现这些我们叫它更低维度并不是代表贬义词只是说它可能相对更简单就是说为什么会出现这些就是更低维度模态它能够支撑起一个内容的产品核心原因是在于生产力的问题就还是回到那个点就是人在去生产内容就是我能够画出一张好的画的人他可能未必能够写出好的文字我能够写出好文字的人未必能够去做出一个好的音乐那大家只能术业有专攻我做音乐做得很好那我就去作曲对吧那我画画画得很好我就去画漫画Maybe我还有很好的这个故事构建的能力然后可能不会画画然后我也不会做音乐那我可以去写网文对所以如果以人去作为生产的主体的话他就会出现这些不同模态的一个划分但是如果这些模态未来就是他被他被这个生产能力把这个生产的门槛拉平了那其实这个模态的它的這個差異就可能就不會那麼的精味分明就是為什麼一個漫畫裡面不能有音樂呢為什麼一個好的文字它不能以視頻的形式去存在呢所以結論就是視頻是內容生產的起點我們認為視頻是未來AI的就是AI時代它的內容的一個起點就是只會出現比視頻更高維度的模式這個很有意思那不同創作者之間他們的壁壘是什麼呢還是如果內容都是原來生成的創作者才有價值嗎当然有就是创作者的创作者他的身份和我们来讲产品经理的那个身份是非常像的我们去讲说刚才产品经理在控制的是什么产品经理在控制System1System2对吧他控制的方式其实是生产端的就是说生产能力这一端的那其实创作者他控制的是什么创作者他控制的是这个就是这个生产能力它如何被使用的你刚才说未来这个差异会变成什么这个差异会变成就是前阵子很时髦那个事你叫它Taste也可以然后我们对我们内部会把它称为叫Recipe就是你生产过程的时候会有一个菜谱对吧就是你可以就是如果你是一个如果你做饭其实你是会有一套自己的这个工作方法的你甚至可以把它写出来变成一个菜谱但是这个菜谱我写的菜谱交给你你用这个菜谱你严格去执行你做出来的菜跟我做出来的菜它的味道其实是会有差异的是会有差异的但是公报鸡丁还是公报鸡丁对吧水煮肉还是水煮肉就是水煮肉你不会拿着这份菜谱把它做成公报鸡丁那这个recipe我们认为它是有价值的而且是不同的这个创作者他们之间能够去形成差异化的一个很核心的一个点那你们是做视频的工具还是你们是生产方这个其实就跟这个就跟商业模式会有关系了就是其实今天大量的产品大家都是从工具端开始出发的为什么呀為什麼對為什麼我們也想過個問題為這什麼我們要去做一個工具對吧要說服自己對因為你可以從工具出發你也可以從比如說社區分配端出發你也可以就是從一個消費端去出發對吧我自己就去做這個內容工具商那為什麼要從工具出發核心原因是因為底層的技術它是從生產它是帶來所謂生產力革命的就是生成等于生产所以生产这个技术它最直接影响的就是生产的这个环节生产环节对应的就是最直接的产品形态就是工具就是生产力工具所以它是离这个技术革命最近的地方那如果你做的直接是生产的结果就是生产那个物品呢就比如说你做的就是創作的是視頻本身而不是說成為創作者手中做視頻的工具好問題好問題這裏面有一個很重要的很重要的點是timing的問題就是生產端它的技術還是在快速變化的技術沒有穩定下來對這個技術穩定下來我們會認為說它其實是兩個維度一個維度是我們講說systemone的部分System1的部分它要稳定下来比如说对于文字形态来说可能语言已经很稳定了然后代码可能会越来越稳定就是代码可能会未来达到9.%的这个可执行成功率对吧对那你看其实多姆泰他今天远未谈得上稳定對從這個Wheel3然後到SR2出來其實我們才第一次看到視頻領域之前可能需要多個單點的這種模型產生的這個能力和內容它被合到了一起比如說音畫同步然後比如說分鏡那這其實是一個非常早期的階段我們會認為說其實SR2和Wheel3它並不是多模態的ChatterGBD時刻而是GPT-2的那个时刻什么意思呢就是如果对标语言模型它那个发展历程的话其实这两个模型因为它前后差的时间很少它隔的时间很短所以我们认为它是就是同一个时间点它其实是第一次把就是视频的多个单点任务合到一个模型里面这是第一次就是GPT-2当时是实现了这个那后面还有很长的路要去走包括你的数据量的scale然后包括你的模型的参数量的scale然后未来可能还包括说你的成本得怎么能降下来你的生产速度推理速度怎么能够去提升然后当然还有最重要的是你的模型本身的这个能力比如我们今天实现不了一件什么事情呢我输入一个视频让他参考这个视频再去做一条新视频诶有人就会说了其实你可以把这个视频先用Gemini去拉偏你去理解它把它变成一个脚本然后再把这个脚本再输到一个生成模型里面让它再去输出一个新的视频但是这并不是端到端之前翔宇你们也聊过多模态的技术的发展如果参考语言模型它能够实现的效果来去说的话未来对于端到端的多模态模型从我们应用的来讲我们希望看到的是像今天这样大家不需要去调那么多的不同的这种工具就是调那么多的LM我只需要去知道如何把一个LM它的不同的能力从一个模型里面给抽出来然后再去组成我的System2那意味着什么呢意味着说那个端的端的多模态模型它应该可以接受任何模态的输入它不需要经过中间语言的转化它在模型内部就应该去理解不同的模态它应该去理解输入的这段音乐它基于这段音乐然后能够去做出一个视频现在语言还是个转换器对对就是加农鱼对吧它需要一个介质那我们也相信说未来的动物态的能力断了断的动物态能力它一定会把语言模型走的这个路可能需要就是它也会重新走一遍比如到今天语言模型走到了所谓推理模型的这个阶段那未來端到端的這個多木炭模型它也不會有推理的能力只不過它是以視頻的形式再去推理然後以音頻的形式再去做推理對但是你看這個狀態跟我們今天所處的這個狀態去比的話可能它就很難想像到那個時候該去做什麼產品了對吧你連怎麼用這個模型可能現在都想不清楚那更不要提說你要在上面去做什麼樣的这个产品形态了而生产端是距离这个能力它变化最近的地方无论它怎么去变化就是生产工具一定是第一时间能够去感知到这些变化并且知道或者说是会去探索说如何去利用这个能力的与此同时就是生产工具我们刚才讲说我们其实在构建所谓system2我们在去构建这个让system1能够更好去发挥它的效果的所谓这个context对那这件事情它对于未来不管是分配端还是这个消费端它也是同等重要的就是真正的生产能力的成熟它是system1和system2同时达到一个相对稳定的状态然後這個成本快速下降然後maybe是新的硬件maybe是新的這個算法架構但那個時候可能會有一個更繁榮的就是生產之後環節的一些產品所以現在好好做工具對就是我們有一個觀點叫不要在諾基亞的時代去做APP現在是諾基亞時代嗎也许吧只是从我们自己的思考来去看可能现在这个时间点不太适合去做APP不太适合去做APP这是一个打引号的APP就是比如说生产端生产端它是一个更离模型近的地方然后它能够感受到模型能力变化并且它本身也在为未来的那个时间点成熟去积累自己的数据现在的整个这个状态其实就还是在我们认为叫诺基亚的时代然后当然在诺基亚里面也有APP就诺基亚里面有小游戏诺基亚里面也有计算机对吧你用过诺基亚吗我当然用过对就是诺基亚里面也是有APP的但是诺基亚时代的APP和iPhone时代的APP差别很大它不是一个东西对它那个比较傻对就是今天只有在更多的在生产端来去做好做好积累和沉淀未来才会有机会在iPhone出现的那个时间点去做出真正的好的AppiPhone出现时间点的一个标志有可能是什么样的呀它是一个硬件的创新还是一个什么的创新我们刚才其实描述了一部分就比如对于视频来说那那个多模态的端到端的多模态模型它應該具備剛才我們描述的那些能力然後它的推力的它的推力的速度比如說有幾個數量級的下降它的成本有幾個數量級的下降現在還像一個大型機的時代當然當然你剛才講到就是整個產業鏈的就是AI對於產業鏈結構的影響非常的有意思你覺得它會怎麼重塑剛才比如說我們提到的這些現有的這些APP一個互聯網時代的APP它會對現在的這種格局帶來很大的變化嗎我們其實會從就是軟件然後互聯網AI這樣三種不同的技術方式來去考慮這個問題这里面其实很大的一个变化在于说对于最终消费物的权利的转移什么意思我们去想软件的那个时代软件的时代它很像就是比如咱们国家早期的时候的那个供销社就是你只能买我生产出来的东西对吧就这个软件做出来之后你就用就好了好不好用你可以去说但是不好意思我也不知道不迭代对所以它的权力是更多在生产端的对那到了互联网的时代这个权力慢慢转移到了分配端比如说电商的平台然后比如说推荐引擎然后搜索引擎就是權力被轉移到這裏了它是轉移到平臺對它轉移到分配端分配這個環節了那再往下其實就是按照這個趨勢推演那它自然應該是轉移到消費端才對就是我要去消費的內容我們來稱叫信息商品這個信息商品是什麼樣其實它的權力應該在於消費那個商品的消費者本身它告诉你我想要什么然后还生成一段内容那这就没有创作者傻事了呀它应该不需要去再告诉这个模型它想要什么内容就像你去用推荐引擎的时候你并不需要去输入一个query你就能得到你想看的东西它会推得越来越准那照这个技术的发展趋势它一定会出现有一天你看到的这个内容它其实是根据你的userprofile根据你所处的这个环境甚至根据你此时此刻的精神和生理状态来generate出来的它是一个更极致的更智能的个性化对我不知道你看不看火影忍者火影忍者最后那个要实现叫无限阅读那个boss要实现说无限阅读每个人生活在自己的就是想象的那个世界里面其实那个就会就会比较像我们按照这个逻辑去推演的一个终局但是它应该还需要很久因为你问的是对一个整个产业链就是它这个经济环节的一个变化那从逻辑上面来去推演的话它应该是这样但是在这个过程中不管是我们去做工具的人还是比如说还是创作者还是其他参与到整个经济链条里面的人大家都是在自觉或不自觉主动或者是被动的再朝这个目标去前进的就像刚才讲的互联网的时候大家并不是在为今天就是一开始大家并不会想到说我是在为未来的大模型去标注数据或者是生产数据但是有一天这些数据它就是会被训到一个模型里面变成一个很强大的System1那今天也是一样20年的互联网发展是为AI的大模型训练做准备是的是的大家是不自知的在去做这件事情那我们今天比如说像我们这样的应用公司刚才说我们去标注了一份定义了一份新的数据去标注了一份新的方法那这件事情其实也是在为未来的那个模型取得准备参与到这个产品的构建和使用的人大家不管今天的目的是什么但其实最终也都是在为那个目标去努力的或者是在推动这个精神那个最终的目标应该怎么描述它感觉很宏大就是我们所有人在一直在标述去做的是什么呢为的是什么呢可能这就是另外一种AGI吧就是AGI可能不是通過某一個Lab實現的你覺得是一個拼圖是的是的我們之前好像有聊過這個概念就是我對AGI有兩種定義一種定義是比較怎麼講呢比較抽象的稍微叫廣義AGI它的標誌是什麼它的標誌是一個狀態這是說当模型知道自己不知道什么的时候这个不知道是真正的不知道什么意思就是我们人在去在去进行这个信息的交互的时候我是知道我自己知道什么我也知道我自己不知道什么就你问我一个问题我不知道我可以假装我知道的去回答你但是我自己心里清楚我不知道对那其实今天的模型它不具备这样的能力对它有的时候会说这个问题我不能回答或者是怎么样但是其实你并不知道它是因为被训练成为了某种pattern还是因为它的数据里面真的不存在这样的一份数据甚至是因为模型有所谓的涌现的能力它其实是会泛化的你也不知道它到底有没有泛化出这个能力不知道你也不知道他也不知道对那如果知道自己不知道什么意味着什么呢意味着他可以去有目标的学习去解决自己不知道的信息今天的模型已经有非常强的信息获取和工具使用的能力了那如果模型它能够就是真正知道自己还缺乏什么样的能力他不知道什么那他其实是可以有你可以去设计一个rewardfunction让他逐渐把自己不知道的事情全部都这个补全进来对那他完全可以是一个自动化的过程所以当所以我说他是一个状态就是当达到那个状态哪怕他還沒有去把那些不知道的東西都已經學會但是那個時候我覺得我們就應該可以認為他是AGI了因為他的學習速度會很快這個是一個定義但是這個定義我覺得他其實並沒有太大的價值為什麼因為就因為它很難去評判它很難去抽象對因為在今天這個時間點我們沒有任何技術的手段去判斷它然後另外一個定義可能就會更狹義一些這個狹義是指就是剛才講的它可能是局部的就是它是會一點一點發生它是個漸進式的過程這個漸進式的過程是什麼呢是說在某一個有價值的商業問題領域裡面模型可以自己賺到錢或者說贏得資源來去優化自己就比如說這兩天那個炒股就是一個非常經典的例子就是如果說這個模型它能夠就是賺到錢然後並且通過這個錢去為自己採購叫数据也好或者是叫算力也好再用新的资源让自己赚到更多的钱那么在炒股这件事情上它就能够形成一个闭环就是它的目标是说让我能够比如说它的rewardfunction就叫我能够赚到越来越多的钱然后其中的这个工具有获得更多的卡获得更多的电获得更多的数据然後maybe還有一個這自我進行這個evaluation的這麼一個環節那他完全可以自動化的去把這個鏈路賺錢不斷的去賺到更多的錢再讓自己變得更強再賺到更多的錢去買卡然後去訓練今天這個過程其實人是在大量介入的就是剛才這個loop剛才這個loop裏面今天我們是可以這麼去做但是這裏面有大量人會去參與的部分对对所以他就在这个领域里面还不够AGI对所以未来反正都是畅想对吧其实我们应该能够畅想或者是未来能够看到在很多有价值的商业问题里面会出现一个AI系统它自己能够赚到钱并且在人参与越来越少的情况下它會自己優化和迭代對所以這個我認為它是一個更狹義的AGI概念它會是一點一點發生的語言的發生了Coding的發生了好像是一點的點亮了是的就是人我們一定會看到說人在這樣一套優化的系統裡面他去參與的部分越來越少人慢慢退出一個路途嗯有很民科啊就是就是我覺得今天聊的很多東西很民科視頻那一站什麼時候會打打到我覺得還比較遠我覺得還比較遠呃對因為就是剛才講的就是對於端倒端的多摩呃多默態模型來講呃他底層的這個技術還有挺長一段路要去走嗯所以你们其实是先在这个点上开始积累能力我们是强跑其实也不能叫强跑我觉得更像什么呢更像去为未来的那个模型能力去做好一个能适配它的架构我们刚才讲了说我们做的是System2的部分对那今天的System1它长成这样但是我们可以去推测未来的System1它会成为什么样它到什么时候可能会能力会相对更稳定然后它开始去优化自己的成本去优化自己的推理速度对吧那我们其实希望做的是你推演出未来它那个能力稳定的那个状态那我们今天去按照那个状态去构建自己的System2举一个不恰当的例子可能会说Coding这件事情在Cloud3.5出来之前Cursor也不那么好用但是当Cloud3.5它的代码能力一下有一个很大的提升之后Cursor就变得非常非常强了就是Red说产品应用公司先做一个壳等着模型能力提高对会很像会很像你认可它这个壳的说法吗壳可大可小可薄可厚对所以我们肯定是认可这个所谓壳的这个说法就是壳这个词一点都不是贬义词对我们做的也是个壳就是system2本身就是一个壳只不过它可薄可厚就什么意思呢我们刚才讲的所有的这个system2我们都是围绕context这个概念的ContextiseverythingEverythingiscontext什么意思呢Contextiseverything就是你要去做的这个产品你要去实现的那个效果的好坏它就是由context决定的因为基座模型是一样的大家用的是同样的模型所以你的产品的好坏它就是由你在基座模型之外的这些context去决定的这个context跟你之前说的那个内生新数据是什么关系它不是一个概念但是肯定是会有一些overlap就是那份我们叫它特定就是领域语言DSL比如说视频的DSL然后视频表达的DSL它是组成这个context的一个非常基础的一层就是你所有的context都是从这个DSL网上设计出来的对所以就刚才讲说这个contexteverything本质就是说本质就是说我们在去做应用的这一层大家其实拼的东西只有一个就是你的context质量更好你的使用效率更高你的成怎么讲叫相同的token你可以比别人实现更好的效果那你就赢了怎么做到这一点那就涉及到刚才你说的contextengineering的部分了对它有很多方法比如说agent的框架不同的agent框架的设计理念它对于token的消耗就会不一样比如说你用react的这种方式它就会产生海量的这个token的消耗但是如果说你对于一个更确定的问题你把整个的就是整个的这套架构里面有一些更确定的部分提前把它固定下来那你需要新产生的token就会变少比如说像这种这种memory的一些管理的这种机制它都会降低token的消耗这是这个contextiseverything然后everythingiscontext是指其实对于未来的那个终极的模型来说所有的东西就是跟视频相关的子模态它都应该是可以以context这个形式来去影响模型的输出的就像刚才说的就是音乐它对于视频的这个创作它一定是有影响的所以音频它就是应该是一种context就是文字模态的东西甚至是视频模态的东西它都应该可以像今天的语言模型像代码这样作为一个context来去影响最终的结果那要实现刚才说的就是很繞就是contextiseverythingeverythingiscontext它一定需要一套systemtool來去適配它它需要有一套軟件和產品的架構來去適配它基礎檔模型做不到嗎基礎檔模型當然也可以做就像AzurePeak它也可以去做CloudCode對啊這就是下面我想問你的你怎麼看克里斯頓和克勞克的這其實是一個很必然的事情就是其實到今天來講我們不應該再去區分所謂模型公司和應用公司就是模型公司已經都開始做產品了曾經他們是他們是不做產品的技術公司曾經我們可以這麼去看對吧但是現在所有的模型公司都有自己的產品那今天的應用公司我們也不應該只把他們看成所謂的殼或者是軟件的公司app的公司而是還沒有開始去做自己模型的公司就像CursorCursor它其實一直有在去做自己的模型只是它的速度可能没有那么快但是它的体量然后它的资源已经足够支撑它去做一个自己的coding的基座模型了而且只有当它把这个基座模型把握在自己手里的时候它才能够真正的去产生利润因为它的成本就可控了它的成本是在自己手里去掌握的这句话我没听懂因为你可以去优化它那用别人的模型不是我的成本更低吗但是你没有办法优化cloud你没有办法优化cloud但是从成本的角度来讲它确实更低你说要优化cloud是从技术壁垒的角度讲不是是从两个层面一个层面是效果然后另外一个层面是成本效果是什么是说就是跟周围一些这个这个Founder去聊就是大家其实都是做某个特定领域其实很多人都会遇到去调机构模型的时候探索到他们的能力边界就这个问题已经他就做不好但这个时候我们的解决方案只能在System2的这个层面去对吧我们只能去调Prompt要么我就放弃我不要去调了对就这样吧他能做到什么样就这样就接受不了我就不要这个能力了我就不要这个效果了对就你只能在它的模型能力基础上雕是的是的是的是的所以大家未来一定会遇到越来越多的这个能力边界为什么因为我们是在去探索一个特定的问题而机座模型它是general的就是模型的参数量模型的参数量就跟人脑子里面有多少神经元一样它是固定的所以就是他一定他的这个能力是是会分配到不同的这个任务上的对吧当然不同的任务之间他会有的是互相促进但是也有的他是互斥的对就是一个能力好另外一个能力没必他就差了对吧就是一个以通用为目标的基座模型他和一个以具体的场景为目标的这个应用他们在能力上的需求一定是不同的对所以从效果上面来讲应用公司他一定会越来越多的去遇到那个模型能力边界的这个问题那这个时候你为了自己的发展你一定会需要去优化这个结构比如我们可能就会尝试去找国内的几座模型厂商来把我们的场景去变成这个evaluation然后变成一些这个种子数据让他们去我们的场景去驯模型那这个是这个是怎么讲呢就是我们把这些模型厂商看成是我们自己的模型部门但是他给你们驯的模型他也可以给别人用对不对当然因为这个数据就逊进去了但是对我们来说它一定是天然更适配我的场景的就是至少我应该是更知道怎么去用这个能力的人对吧这其实是一个现在这个时间点我们不得不去做的一个取舍因为我们没有钱和卡去逊气的模型然后这个是效果一定是有这个必要性的然后从成本上面来去说从成本上面来去说的话你刚才说去掉就是这种就是就比如说去掉Cloud其实现在算来是更划算的是因为它们已经有了规模优势它有足够好的AI英法的这种基建然后它可以去因为它的掉落量越多它就越能够去做各种消温填补它的整体的成本就会降下来那这件事情其实是因为现在单个的垂直场景大家没有就是大家的这个价值没有那么大商业价值没有发挥到那么大比如说像coding这个领域对于cursor来讲它已经可以有这么高的AR它已经证明了这件事情的商业价值它也融到了足够多的钱它就一定会去训自己的模型它又可以去走当年机座模型走的那条路就是我训一个更好的自己的这个模型然后并且有自己的算力的集群我也能够去做各种各样的成本的用所以就是从效果还有成本上面来说的话应用公司如果说这个场景它未来能够变成一个很大的生意那么一方面如果他是个很大的声音那你一定会遇到机模厂商的去做同类型的事情对吧对然后就是这种结果也是让你必须要去训自己的模型对因为原本你们从上下游变成竞争对手了对然后另外一个方面是你在发展的这个过程中从刚才说的就是从效果还有你要去更有效的去优化自己的成本去真正获得利润你也必须得去做自己的模型模型公司会去做产品产品公司会去做模型这个我能理解那你觉得当他们共同面对一个非常有商业潜力的场景的时候谁能赢呢就科测和高扣的如果你們的場景是一個非常有商業價值的場景那肯定巨頭會下場模型公司會下場對不對都會爭奪這個領域但是你們也會同時做自己的模型到時候肯定會更有資源更有錢也有算力那誰能贏呢這個影響因素就會很多了我們剛才講了就是有目標的差異有這個路徑的差異有起點的差異那最後可能就它的影響因素其實真的還有很多就比如說之前OpenAI公鬥的這種事情對吧指不定哪一天某一個公司它的組織架構就崩了它被收購了或者anyway就是有很多影響因素這個就不是一個單純的業務問題了因為當其他所有的因素都趨同的時候大家都那個目標很明確了就是做那個事情然後大家的資源可能也很趨同了都是這些資源那還能比拼什麼呢比拼人才密度比拼這個決策速度或者比如说张一鸣就是他早年采访的时候说最后拼的是什么最后拼的是大家对某一件事情的认知的差异对那可能就是这些东西但是互联网时代不像今天这么的需要算力需要卡需要钱就是它的资源的损耗量远远不如今天所以你觉得应用公司的优势会是什么呢當你如果有一天商業價值足夠大要去跟模型公司和大廠競爭的時候其實就還是剛才提到的提到那些點吧因為對利用公司來講現在這個階段唯一的很唯一的優勢就是速度就是對就是就是速度是說速度是說你和對手的這個距離它隨著時間的變化是在變大還是變小至少在今天這個時間點每一個應用公司它在一張地圖上面如果有一個目標它應該和大廠或者是基座模型的那個位置它至少應該是領先的才對它中間應該是有段距離差才對就不能說是一個應用公司它在要實現那個目標其實它的起點是低於某一個基座模型廠商的你說的起點是起步的時間還是什麼包括起步的时间包括业务的状态然后包括就刚才提到你到底是以一个什么样的方式来去开始做这个产品这些都会决定你的起点对那它意味着什么呢就是当你的位置有一个距离差的时候那剩下的事情就变成保持或者是扩大这个距离差就会转化成为这个问题今天的模型能力对你们来说足够吗? 你觉得模型能力的screenload有放缓吗?
你说多模态的模型吗? 视频这个场景吧OK,就还是刚才说的那个点我们认为今天的视频模型或者是多模态的模型它处于比较早期的一个状态但是不代表它没有商业价值对,这个我认可只是说今天的商业价值其实是这个技术非常早期的那個階段就是它未來應該釋放出就是比今天大非常非常多的商業價值才對所以回到你的問題今天的能力對我們來說是否足夠這個其實我們沒有辦法去沒有辦法去說它夠或者不夠因為我們只能在已有的技術範圍之下去做产品然后去产生商业价值那只能是说如果用户需要的就是能够产生商业价值的那个效果是某一个水平那模型能力它还达不到那就是我们需要通过System2的部分来去补全这部分的价值那我们补全这部分的价值所产生的成本和用户愿意为此去付的费这个东西到底它是一个赚钱的状态还是一个亏钱的状态就是关键问题其实是这个因为我们没得选就是基座模型它的能力今天就是在这里它是在变化我们也看到它在变化但是这个事情我们既不能控制也无法就是也着急不了对就是不要去做模型能力边界之外的事情就是今天只能这样2025年大家都会说是agent的元年或是产品爆发的元年但是我觉得已经到1月份了好像进度不如我们年初的时候的预期你觉得卡电在哪里你有觉得时间线是在往后延迟的吗我其实倒没有这么觉得因为其实有不少的产品已经证明了自己是有赚钱的能力了对吧包括代码的agent然后包括Manus然后包括Lavat他们在不同的模态上面然后在不同的这个工作场景上面都证明了是可以赚到钱的对所以我并不会觉得说是是地狱代我觉得这种地狱区很多时候產品公司是證明自己掙錢的能力比模型公司快是嗎倒也不是我說已經被證明是說這件事情就是agent的这种方式然后用agent的方式进入到某一个商业问题它有价值这件事情是可以被证明的不管是用所谓壳的方式是用workflow的方式还是用所谓agent的方式它都能够产生价值它是有效的那问题其实在于说大家可能觉得不够多没有出现这个勃勃生机万物竞发的这么一个状态对吧你觉得有没有啊我感觉没有因为还有很多公司它是在一种近水深流的状态近水深流还是近水流深呢近水流深近水流深的状态对因为不同的领域它对于模型能力的要求然後包括對於這個領域的knowhow的梳理然後把它變成system2它的進度是不一樣的比如說語言就是所謂文字這件事情那很顯然是模型能力最成熟的那也不要去跟大模型公司捲了吧但是其实也可以去做就是也有一些更垂直的场景他们能够赚到钱对吧比如说像海味比如说像这个openevidence在这个法律然后在医疗的这些场景他们也能够赚到钱就是他们的生意也很大就法律跟医疗肯定是很大的这个赛道也不是说模型厂商不知道对吧但是比如你看openevidence他为什么能做得好它有更好的system2的context它做了大量的专库它的数据质量就是更高所以就还是回到刚才那个问题吧就是每一个领域它的条件都是不一样的就是它对于模型能力的要求就是今天模型能力的ready程度然后包括说这个领域要去梳理它的knowhow比如说你要去建立所谓的这个专库然后再叠加上团队的状态资源这些东西都不一样但是这条路是有效的这条路是指说用以模型为核心的agent也好workflow也好来去解决某一个商业问题产生用户愿意买单的经济商品这件事情是完全被验证的剛才我們說了模型公司和產品公司的邊界問題其實邊界是越來越模糊的大家都會相互滲透那通用agent公司和垂類agent公司的邊界會在哪裡我覺得其實很難去說今天有什麼通用agent公司就是垂直大家很好理解但是通用的这种公司似乎也不是真正的通用对吧就是可能是有更多的垂直任务或者说垂直领域问题他们能够去解决但是这个问题领域也不是无限的我认为说今天的通用和垂直它很像这么一个诗描述的状态叫千江有水千江月万里无云万里天什麽意思呢? 就是千秋水千秋月其實是你可以說是我們這樣的垂直的其實我特別不喜歡用agent的這個詞啊為什麼呢? 因為我覺得就是你不會去說一個產品是互聯網產品是一個移動app產品你會說這是百度这是今日头条这是抖音你不会说它是一个移动互联网的视频那我可以说它是一个app对吧对agent不是一个类似于app的概念吗不是吗我觉得agent是一个技术就是它最终会被内化到所有的产品里面就那个时候大家不会去说你是一个XXXagent大家应该就是说它是它的場景或者說就是這個產品的名字就像今天我們不會說短視頻App不會說對吧不會這麼去描述抖音和TikTok那是因為它這個品類它這個名字佔據這個品類是但是其實也有其他的類似的產品嘛但是就是Agent我會認為它是一個技術對回到對回到剛才那個問題啊就是像我們這樣在去解決特定領域問題的公司其實它裏面有很多不同的agent就是麻雀雖小但是五臟俱全它裏面有很多解決不同問題的agent然後各種各樣的tools對所以這個是所謂叫千江有水千江月就是每一條河裏面它其實都會有自己的所謂的智慧然後有自己的數據然後有自己的商業價值對然後通用agent的競爭就萬里無雲萬里天了就是只能有一片天對吧如果你是一個通用agent我也是一個通用agent那麼最後一定只有一個通用agent對但是我覺得這其實只是一個今天發展到特定時間段的一個很特殊的過渡的狀態因為就是垂直的這些agent他也會慢慢去延伸自己的邊界对比如说视频视频它是很容易去降维成为其他的模特的什么意思啊比如视频如果你把每一个画面都把它想象就都把它变成一个图片然后这个图片上面它可以就是生成很好很结构化很漂亮的这些图和文字然后甚至它还可以有图层它其实就可以降维成为比如说PPT對只不過說這個PPT它不是在Office裡面那樣的一個東西它可能是一個更就是有這樣的展示效果但是你可能沒有辦法去編輯裡面具體的這種元素但是這件事情其實今天來看就是編輯這件事情它會變得越來越不那麼重要因为可能生产出来的东西它的质量就会越来越好对所以就是什么意思就是说其实今天在解决某个垂直问题的这些应用这些公司它的能力边界也是会慢慢去拓展的那么对于通用的这些公司来讲大家去解决的那些问题一方面是会扩大另外一方面也需要慢慢去做深对因为每一个问题就是用户最终是为效果买单的是为效果和成本去买单的就是我付出了多少钱我一定希望拿到值得这个钱甚至是高于这个钱的回报才对那所以就是能够去完成的这个任务能够去产生的东西它的质量应该要越来越好才对所以就是通用Agent公司它也需要去把特定的有价值的这些任务去做的更深那原本这个范围窄的在扩大自己的范围原本这个范围宽的公司他要去做深自己的这个范围所以最终就是他我觉得大家可能会殊途同归啊就是就是怎么说呢就是最终还是会回到那个最朴实的道理就是你到底在生产什么你是在生产视频还是在生产音乐还是在生产PPT那你生产的这些内容到底用户需要花什么样的代价来去得到一个什么样的效果所以它就会变成海上生平月天涯共此时最愛念詩的黃定宇你之前說過一句話我印象很深你說AI時代的公司最終都是生成系統公司這個能不能解釋一下生成系統其實是一個我們內部橫造就從公司成立的第一天就會和所有入職的同事大家去講的一個詞生成系統對生成系統對這個其實跟就是你的姚舜宇姚舜宇的那期訪談就是看完之後就會非常有共鳴非常會有共鳴他可能是更從算法的角度去思考然後我們可能更多的是在應用端去做這個時間那什麼是生成系統呢就是你可以去類比比如推薦系統推薦系統它是一種方法它是一種技術方法用這種技術方法你可以去推荐各种东西它是一种通过对经济商品和用户的偏好经过算法去计算来去进行关联的这么一种技术的方法那你到底去推荐的是什么这件事情是会有很多的对你可以推荐这个文章它变成了今日头条你可以去推荐视频它变成了抖音对吧推荐段子它变成了皮皮虾和内涵段子对所以生产系统首先对我们来说它是一个我们工作的方法那生产系统里面它可以生产各种各样的东西对今天我们做的可能是这个视频但是我们不是去所谓叫generate视频而是包含generate的一个更广义的处理对那未来也可以用深层系统去做其他的事情那到底深层系统它里面包含什么我们认为它是由三个模块构成的第一个环节是我们刚才讲的其实整个生成系统它都是System2的部分就是我们在做的System2就是一个生成系统它包含我们刚才提到有DSL就是你的生成系统所要解决的那个问题比如说是视频所对应的底层的那个DSL就是视频到底该如何被准确的表达出来视频的制作方法该如何被准确的表达出来然後從DSL出發其實我們剛才都已經都已經聊過了就從DSL出發你是可以再往上去構建整個就是context的這個部分context它的範圍其實就會更廣比如說其實之前大家會有agent和workflow之爭對吧agent會覺得workflow比較low對吧就是沒有技術含量然後workflow會說agent它不可控然後它的成本太高其实在我们内部是不会做这样的划分的因为刚才已经提过了不管是agent的方式还是workflow的方式它本质上都是去产生更多有效的contacts产生更多有效的token让System1的效果更好这里面也包括比如说领域knowhow的这种专库这些其实本质上刚才讲的都是contacts这些contacts它解决什么问题呢其实我们在contacts之上还有一层抽象就是我们去设想说为什么需要这么多的contacts为什么需要有效的contacts其实本质上是在去解决在去降低两种伤一种伤是用户意图的伤比如我很简单的一句指令就是我要一个什么对应到语言模型我要一个什么什么样的报告这是一个很模糊的一个指令它代表的信息的范围是非常非常大的对那在没有推理模型之前其实它可能就写的模型直接出的内容可能就不好或者说模型它会有一种模式叫反复跟你去确认说你到底要写什么领域你需要什么样的结构有的模型可能会这么去做对吧那推理模型其实它就是去自动补了这些context它有一個非常長的推理的過程它提供了有效的這個context它的這個結果就會變好所以這個是對用戶的這個意圖其實是通過這些context來去把它的傷給降下來然後另外其實還有一種傷叫行動的傷就是你的系統或者說你的這個智能體他要去行動他去用工具他去這個planning對吧那他也需要更明確的這個信息來去這個讓他做得更準確為什麼降低他們的傷因為他要做的事就是你的效果要能够足够可控效果要足够好一定意味着说他去做的这个事情要更明确他是要精确让他要精确要能够控制就是你的模糊指令要能够转化成为精确行动的指令OK并且这两件事情他是他要能够就是很好的去映射起来的这也是你们做的是吧在System2上面做的对他都是在就是我们刚才讲说在context这个范围之内就是所有的context我们认为它是在一方面是在降低用户的意图intention的上然后另外一个作用是去降低这个智能体活动的时候它的行动的上对所以这是第二部分然后第三部分就是刚才也提到其实是environment它直觀看上去是前面用戶去活動的這個軟件的介面但是可能和之前的軟件有一個很大的不同就是這個介面裏面它不光有人在活動其實也有智能體在活動甚至可能智能體活動的佔比會越來越大就是刚才讲的一个很模糊的指令然后它其实可能对应的是很多的工作但这些工作其实就并不是人在活动它是智能企业在活动对吧那要能够实现这件事情就一定意味着说你的指令所转化成为的那些行动它是能够在软件里面有对应的能力是能够去对上的对我要用10个这个tools那这些tools所对应的这些操作如果你要形成标注的能力那人也是能够去介入到这件事情里面的它可能对应的是按钮然后它对应的可能是各种各样的GUI的操作对所以这些GUI的操作它依然会存在但是它的主要的使用人主要使用者可能不是人了它是为了一个智能体更多的市区让智能体用的人士通过这些GUI来去进行一些校验或者说是进行一些微调的并且这个环境就是既然叫環境不叫軟件就意味著說它一定不是簡單去記錄這些活動所產生的log就是第一它產生的數據一定是可被學習的剛才講的就是第一這個環境裏面它一定要能夠和你整個的工作方案能夠映射上这个可能还得稍微再多讲一点因为跟你刚才讲的那个事情它就有关联上了就比如说你写的文章比别人写的好你说你有一些这个工作理由你有一些工作方法那这个工作方法我们依然去类比做菜这件事情就说今天这些菜谱尤其是中文的菜谱它是非常不精确的就是盐少许对吧那这个东西你拿给另外一个人他做出来的味道一定会不一样但是如果说我对于一个做菜的过程我把整个环境搭建的非常非常完善完善到说这个厨师他在第几分钟开始他的动作他下油的这个手臂的这个角度然後這個油它此時的溫度它的鍋的溫度這些東西就是在這個環境裡面它都是是有明確的這個信息的並且可以被記錄下來並且是可以被另外一個系統所能夠理解並且能夠去執行的那就意味著說你可以把它的這個recipe非常無損的傳遞出去对所以这个是环境里面非常重要的一个环节就是它必须得有一个编辑器而且这个编辑器它可能也会越来越复杂但是它更多不是给人去使用的对这是当然还有更重要的一点是就是一个环境它里面已经需要有一个rewardfunction就刚才讲过我们说它是要有筛选出有效数据的能力的那這件事情本質上就是一個reward的一個概念比如對於用戶來說你剛才說你不希望你的這個recipe被別人這個拿走但是你希望你自己用的時候它是越來越好的那這裡就一定意味著說模型是有第一它能夠記錄下來第二它是有理解和篩選的這個能力它把好的這個信息留下來把你的好的方法記錄下來對所以它需要它需要评价然后它需要reward所以就是这三个这是environment然后它是整个生成系统它从DSL出发然后去构建所有的这些context相关的事情然后最终以一个environment来去呈现给用户和智能体就是这整套东西我们把它称为叫生成系统我們討論的是怎麼搭建一個特定領域的AI生產系統你怎麼評價一個好的視頻呢? 好問題這其實是一個非常典型的開放語問題就一個視頻好不好那這裡其實是你是可以從你可以從用戶的這個行為然後包括說其實核心就是從這個用戶的行為你是可以抽象出到底哪些視頻是符合要求的對比如我們剛才講說有很多的這個活動是agent來去做的那agent做完之後對於一個用戶來說他沒有做那麼多的修改那意味著說對於這個水平的用戶來說這次的這個活動它是有效的那這種方法對於這個用戶來說就應該被強化但是这里你看这里看它其实是它是会区分人的它的评判的方法是一样的但是最后得到的结果是不一样的但是对于我们来说我们前面也去讲过了对于我们更有效的去提升整个系统它的效果的方式是我去做更专业的标注我自己去做我把这些knowhow我把这些方法就是放到整个系统里面让所有的这个用户他都能够这个被动的去提升自己的这个能力对所以其实就是标注的那个环节会更多的发生在我们内部就像MediaJourney它内部是有所谓的艺术家这样一个角色的你们有吗当然有啊叫什么你们的叫什么你叫艺术家吗我们还没有名字我们就叫PM是PM去标注PM要决定审美对吧PM和那些有视频审美和制作能力的人他们一起你们审美制作能力是是什么样的人啊我认为就是那些就是很会剪视频的人你们是招进来的吗有外部合作的也会有在内部的就比如说你们要做的视频它是要为什么场景服务的吗它是为哪一类的比如说B站的up主服务的还是YouTuber这可能是一类还是说导演就是它的人群是什么样的我们其实就因为视频它的这个内容会非常非常的广对有长的有短的有娱乐的有严肃的我们其实不会这么分我们会把视频我们会把视频认为是它其实就是人对于世界的一种信息化的构建对就是比如物理世界我用手机把它构建出来它就变成了就是我摄像头里面拍到的这个视频那这是物理世界的视频我们面向的是另外一类视频就从大的类型上面来说我们面向的是理念世界的视频就夢裏什麽都有對吧就是理念世界我們認為它是一個比物理世界更廣闊的一個世界就是不是用攝像頭能夠拍出來的不是大自然的視頻就叫物理世界吧不是物理世界的視頻或者說不是用攝像頭能夠去解決的視頻那為什麽選這個角度為什麽從這裏切入因為物理視頻已經做的足夠好了呀物理世界的視頻已經有那麼多的攝像頭遍佈在到這個各種地方對吧然後尤其是有手機然後大家每個人都可以去把某一部分的物理世界變成一個視頻這內容已經建設的足夠好了對就今天的每個人有個手機就能做了對今天的短視頻它是以物理世界的視頻為核心的那理念世界的視頻我們認為它還在非常早期的階段理念世界的視頻像什麼呢比如說你要去傳遞一個知識你要去傳遞某種思想比如說要把你們的文章變成一個視頻有兩種方式一種方式你自己出來讓你去就是口播這是一種方式然後另外一種方式是講到一個具體的知識點然後講到一個具體的這個理論它有對應的公式然後它有對應的這個文字的動向這個數字的動向对吧那它就和你真人出镜去说这个事情是不一样的它代表的是你的理念的视频化对所以从大类上面来说我们是去做这个理念视频然后它的原因在于说我们认为理念视频它有很大的这个空间比如说我们内部会把它称为叫要在视频的世界中去构建图书馆格局院还有大教堂这个其实就是我们内容品类的划分它代表的是知识类的内容然后艺术类的内容还有跟精神相关的内容对就是那与之对应的是什么比如说现在的现在的这个视频世界里面可能更多的是我们把它稍微叫夜店跟多巴胺相关的这个芒果卫视娱乐内容对娱乐内容对吧这个帅哥美女的跳舞对吧对还有什么上一个时代证明这类内容是更有商业价值的为什么要去做精神类的内容呢它商业价值足够大吗大家变得更爱学习了吗在AI时代不是那一定不是幾個點吧一個點是就剛才也提到就是來自於物理世界的視頻它已經足夠的豐裕了就它的供給是足夠充分的就它有夜店然後有生活廣場大家可以去你說的八卦我們其實會把它放在這個所謂廣場的這個範疇對然後可能還有超市各種賣貨的就是现在的这个视频里面有很多这样的内容它其实已经把物理世界可能能够覆盖的这个范围就有价值的范围它可能已经都已经覆盖掉了而理念世界我们认为第一它的阶段会更早因为它的成本会更高就是你拍一个自己跳舞然后去拍一个自己讲一段话它肯定比说你去要去写一个有深度的文章然后再把它做成一个视频要來的更容易對吧就後者肯定是門檻更高了所以它現在處於一個更早期的一個階段然後第二呢是這個理念世界它會有更多的想像空間就是之前因為視頻的生產能力不夠或者說沒有今天這樣的生成技術很多東西是不容易視頻化的或者說它沒有辦法用視頻的方式來去產生一些價值比如什麼呢我们有一个客户就是他们是给别人去做视频的他们有一个客户就是去做那种潮玩的其实潮玩就天然是一个非常适合视频的场景因为你可以把那些潮玩变成视频化的故事然后变成视频化的各种创意的这种场景对吧他对于喜欢这个潮玩的人来说就是一个很有消费价值的东西但是在没有很好的生产能力之前这就不会是一门好生意因为要去做那样一个视频它价格很高为什么我们会知道这个事情是因为我们这个客户就是他在用我們這個產品過程中他就把這一類潮玩在整個小紅書上面的內容就包圓了就是你去看這個潮玩在小紅書裡面相關的這種AI視頻就全都是他們做的因為它的生產效率足夠高它的成本足夠低它就可以變成一個由之前可能這個myidea是吧用你们的产品对因为它把成本降下来然后把生产速度提上来之后它就会变成一种新的这种内容的方式就是它的这个内容的量其实也很好因为确实有很多人他喜欢这个潮玩的这个形象那你想在之前如果这种视频它需要以周围单位然后它可能是几千甚至是上万这样的制作成本那這件事情它就不會發生對比如說像就我們前面也提到像蘋果像耐克他們去做的那種非常高大上的品牌廣告那之前只有他們這樣的公司可能一年做上幾條然後每一條幾十萬美金甚至是上百萬美金當然他們的質量一定是更好但有很多人他也需要用這樣的方式能夠去表达自己的产品那么在之前的生产力情况下它就不可以它就不可以那今天如果我们这都属于理念世界的东西因为它来自于人们对这件事情的一个想象和理解然后去把它视频化那今天它就有可能变成一门新的品类变成一种新的内容的类型对所以就刚才讲的就是理念世界它其实是随着生产力的发展它会有更多的想象的空间它会出现新的内容的形式就生产力决定生产关系嘛就是现在生产力发生了巨大变化那上面的从生产关系然后包括到最终就是和用户最直接相关的那些消费的部分它一定都会连带的发生变化你们这个生产关系是什么样的你的客户给你付钱你们商业模式是什么样的我们现在还没有产生新的生产关系我们现在的就依然是以一个工具的这个方式来去提供给对就是要去要去制作视频的人版权属于谁版权属于制作的人那当然现在试用的人多吗我们正式版的产品其实还没有上线我们其实之前五月份的时候有一个做了一半的产品我们就把它静默上线了然后那个静默产品的话其实已经有不少的用户已经产生了比较大的商业价值就我们前两天才知道可能具體的那個號我就不說了就是是在B站然後包括視頻號上面非常大的一個AI內容播主就他的那個量很大他的每一條視頻可能都是幾十萬上百萬的這種播放誰呀AI視頻播主不多的他做AI內容對AI內容播主不多的对就是前两天我们才知道他其实是我们的用户他的生长环境中会用到因为我们现在限量产品并不是一个真正能做到端到端完全在产品里面去闭环掉的可能还有一些其他需要去处理的东西可能他们依然还会去用简易硬去用达芬奇去做对就是因为我们现在是只能用Google账号然后需要海外的这种付费的方式所以他們是把周圍能借的所有的谷歌賬號全部都借了一遍然後最後把我們每一檔的那個積分包都買完了因為我們沒有就是所謂叫流量包的那個概念就是你想買多少積分就買多少積分我們之前壓根沒有做這個功能對所以他們把能用的這個號全部都用完然後把所有的这个账号也都充到最满的那个状态之后发现积分还是不够用就联系到了我们我们才知道原来他们在用对从你们上一个半成品到现在这个成品你觉得中间的迭代是什么呀就是12月份可能即将发的产品就是刚才讲的整个生产系统这套完整的构建对所以我们之前为什么发半成品呢因为那个时间点的那个产品我们也提前会去给一些客户和用户去做试用我们每一版产品都会给用户和客户去做试用那个时候其实已经能够感觉到它有很大的商业价值了對後來發出來之後也確實證明了這一點只不過是原本在背後我們剛才講的這些DSL然後包括整個Contacts這套系統它搭建的沒有那麼完善它有很多功能沒有辦法暴露給用戶對所以剩下的時間我們其實在完善這些剛才我們講到了信息商品你覺得在整個信息商品的鏈條從生產端平台端到消費者端你剛才講的一點是它的權利重心會向消費者端去滲透那其他環節你覺得會帶來什麼變化比如說平台會變化嗎會有新的平台出現嗎你怎麼看Solar2首先一定会有新的平台出现的那这个新的平台是就是又有真人创作者然后还是只有AI内容的平台这个平台有没有一些构想首先消费端的事情我们现在没有考虑那么多就是刚才讲到了这个原因我们因为还早对现在这个台领对于我们来说可能太早就是这个大家会有不同的这个判断他无所谓对错只是我们认为现在消费端可能有点早所以我们其实不太会去想很多跟消费端它的这个形态会是什么样我们现在是有一个能够推演到的那个终局就刚才讲的无限阅读那个可能是对但这个终局我相信就是很多团队大家都能看得到自己的内部肯定也在讲这个也看到这样的终局也在为这个目标去努力但是这里会有一个我觉得可能会有一个大家遗漏掉的一个很关键的问题就是所谓传统的分配平台依托双边关系来去构造的整个模式它会发生巨大的变化为什么呢就是刚才讲了之前为什么需要有双边关系是因为生产端这边它永远是需要人的那我们刚才所有的推演里面已经说明了就是生产端它需要的人数量会越来越少需要人去做的操作或者是努力它会越来越少甚至像就是如果我们搭建好足够完善的这个环境那人他的生产方法也会被越来越精确的能够记录下来未来甚至是可以被RL出来的那未来会变成什么未来可能就这个就是所谓这个双边关系的生产端它就完全自动化掉了或者是它是一个单一供给方单一供给方指的是某个公司对一个生产平台这个生产平台里面不是说它就完全没有人了而是说一个生产平台一个生产平台就比如说字节这个公司它是一个生产系统它不是一个推进算法系统你可以想象说目前所有的生产者都是这个公司的员工就以抖音這個系統為例對比如說所有的生產者其實都應該是這個生產平臺它的員工差別是什麽呢它不需要那麽多人那還需要人嗎就是我核心問題還是還需要創作者嗎需要創作者但是不需要那麽多創作者但是創作者會有新的身份會有兩種創作者一種創作者是我們剛才說他是屬於這個生產平臺裏面的员工或者是合作方他们其实是金字塔间的那批人他们永远会在这个平台能力之上他能够去提供增量的数据能够去提供额外的这个智慧这一波还需要真人的创作者你可以想象成为是OpenEye去买20刀每个月付20刀的那波人或者是之前那個OPI不是有公佈他們的那個用量嗎對就是真的有人他可以把這個系統用到極致他能夠把這個系統發揮出的價值和其他人是不一樣的對這是生產這一端的我們叫創作者的這個角色你可以把它稱我們可以把它稱為叫藝術家群體數據標註員是一個事兒是吧也可能不是就是因為我們剛才講了所有人本質上都是在標註只不過你標註的這個數據它的作用是什麼有的數據質量低有的數據質量低但它可以作為預訓練數據然後數據質量高那它可以作為這個这个SFT的数据对吧它可以作为对齐的数据对所以大家本质上都是标注点互联网时代所有人都是标注点我们想去强调的是说这批人他的特点是有足够强的主观能动性所以他永远可以在工具和系统之上去做出更好的东西那系统对于他们来说是一个什么呢是一个能力的放大器对就是整个系统其实是去scale最强的人把最强的人去复制一万份十万份让少数的人能够去产生海量的内容对这是一类创作者的角色然后还有另外一类创作者的角色他其实就直接在消费端发声了就有一个概念叫产销者就是他生产的同时就是在做消费生产本身是有价值的叫劳动最光荣这件事情他就是原本字面的意思就是比如你写文章的过程你会进入到心流状态你是會覺得這個過程對你來說也是有價值最後產生這篇文章對你來說也是有價值它對你來說你就是在消費它它對你產生了消費的價值對吧這是你的作品寫毛筆字對吧就是退休老幹部在家買很貴的這個筆墨紙頁然後去寫毛筆字本身生產的這個過程對他來說就是有消費價值的經濟創作者都是啊平臺上的這些創作者也有不是的也有说纯为了纯为了获得更高的这个流量去获得更多的用户注意力就是我相信你肯定刷短视频刷的比较少就是我们因为工作原因需要大量的去刷去刷这个短视频要去看现在平台上面会是什么样的东西你就会发现说就是因为有推荐算法有这样一套分配机制的存在它是有自己内在的逻辑的所以大家从商业目的的来去出发的话大家一定会去做一件事叫撞库就是我去撞你的这个推荐机制给你举一个例子就是有一类的这种视频它就是给你拍一个就是让你很有想象空间的一个镜头比如一个远处的山就是一个山的远景然后他会突然把那个镜头拉近但是其实什么都没有但是他就会让你觉得说那里是不是有一个什么很奇怪的东西我没有看清他很短他就几秒钟他可能总共这个视频就是两三秒钟你第一次没有看清它就会循环播放可能你不知不觉就会看好多遍它的玩播率就高它不光是玩播率重复看所以它的量就会很大對這就是一種就是你看短視頻它有很多的方法論什麼黃金三秒然後怎麼去在中間去設置各種各樣的這個hook去增加多少秒的這個就是能播到多少秒它永遠不會把就是最吸引你的那個問題的那個答案在一開始就告訴你它前面會囉嗦說一大堆廢話它其實本質上是為了去撞整個這推薦算法的這個庫去撞到那個匹配的機制对所以它并不是一个刚才你说的产销的那个逻辑它并不是说我生产的过程中就是能够去满足自己的消费它就是去为了在流量的十字里面在所谓注意力经济里面去获得更多的收益这个makesense对所以产销者他的逻辑不是这样的产销者的逻辑是说当我看到这个内容的时候比如我去做二创然后比如说我去基于某一个主题我有自己的想法我把它变成一个内容这个内容它对于别人来说有没有价值可能不那么重要它对我自己有的那个价值它就已经足够了但是这里就有一个很关键我们刚才认为那个timing的问题就是对你来说对于产销者他自产自销的那个价值和他的生产成本他一定得是自己的那个对自己的消费价值他得大于那个生产成本才可以但今天这个生产成本它对于视频来说是非常高的但是可能在一些其他的模式里面它其实已经发生了比如说文字和图片它就已经发生了就是大家在這個chatbot裡面去做一些比如說思想的實驗然后你去调研了一个什么样的问题他产生了一个很好的一个回答他去deepresearch出来一个很好的报告这个报告其实你并不是为了去把它拿出去去赚钱的你自己看完它对你来说就已经有价值了这是一种产销的过程然后图片也是这样其实很多图片社区里面大家是画图给自己看的对这之前是一门生意就是因为有很多的有很多的那个漫画它是很小众的所以它没有那么多的周边它没有那么多的就是所谓叫这种图包就是我要画同人我要去画图包它没有这样的东西它原本是一门生意也就是有一个新的什么办法出来其实之前会有社区有专门会画画那些人去画说就是这个漫画里面某一个角色的图包会有人去买的但是今天这门生意已经消失了因为你喜欢这个角色你喜欢这个漫画你就可以去图片的社区里面自己去产生你想象的那些图他不需要再拿出去给别人去消费他对自己来说就已经有消费价值了所以这些人也是创作者因为他们创作出来的只是说他的创作目标不一样了就是他创作的目标本身是为了自己去消费但是他对于整个系统和整个平台来说他是去提供了新的内容的老干部在家里面写了一副字你直接说吧这个系统里面干掉了哪些现存的创作者它并没有干掉任何人因为在产销者这一块我们认为它的范围是是扩大了的因为所有人它都可以参与生产今天已经实现了UGC就是讲这个事吗UGC解决不了生产能力的问题就是UGC去参与生产就它进一步降低了制作的门槛对它进一步降低了生产能力然后就让UGC更广大了对是的那這部分創作者算是這個生成系統的公司員工嗎就是這個系統今天不是嗎今天就是平台和創作者的關係對今天肯定不是但是在未來這個商業模式是什麼其實這就是我們沒有去想清楚或者說可能我們現在還沒有去仔細去想的一個問題那這個AI生成系統和現在這些AI推進系統你覺得它的本質區別是什麼沒有中間商賺差價現在中間商是誰現在中間商其實所有的互聯網平臺都是中間商推薦引擎也是中間商搜索引擎也是中間商淘寶這種電商也是當然也是中間商互聯網平臺也是中間商這個你不是第一個跟我說的不光會在信息商品發生它也會在實體的商品也會發生所以你是覺得新的生存系統會替代舊的互聯網平臺系統我們對它的描述是從原本的就是互联网时代我们把它称为叫分销平台就是它掌管分配和消费对但是生产是通过它在分配和消费端产生的权利来去控制对这些平台它其实都不是生产端他们其实在剥削生产端你做的视频你发给了平台就是你投入了成本你付出了努力你做出来一个内容你发到平台但是可能它只是作为那个划一下中间的填充物對就是你並沒有得到應有的這個價值而且這個分配它是可能是失效的就什麼意思呢同樣的一個內容你不同的人去發它的量一定不一樣對我們倆同樣發一篇文章你的量一定比我們發出來的量要大你說在微信這個平臺嗎各種平臺微信是不行的因為它有一個原創其他就不能重複了微信是有这个原创保护的但是视频平台好像是比如说你拍了一个视频然后我照着你的脚本重拍一遍我不知道他们对于这个抄袭是不是有保护这个在视频平台可能是多见的其实我自己做的视频就被盗过就是那个原创它是没什么用是吧它一定是有一些方式去规避的我们现在可能更多是一个思想实验你刚才说有原创那就假设我们俩是牛顿和莱布尼兹大家各自想到了位积分然后在同一时间发到了平台上牛顿的那个量一定会更大因为他的身份更高他在系统里面会更权重会更高然後甚至你可以再去假設就是兩個人他的兩個創作者他的userprofile是完全一樣的他們在同一個時間同一個地點所有東西都一樣然後他發了一個同樣的內容他這個量也會不一樣這說明什麼這說明這套經濟的分配機制是不那麼有效的同樣的商品它的價格不一樣那生產系統為什麼可以做得更好呢因为没有这个环节了没有分配这个环节了就是它的核心价值在于产销比如说我要买东西它推荐给我什么样的商品它也是一种分配的权利啊对当然它还是有分配的只是这个分配内化在这个新的生产系统里面如果是生产系统的话它它没有分配这个环节是它是一个库存分配的这样一个逻辑变成一个直接下单的逻辑就什么意思呢就是你对于某一个内容的需求它是直接交给到生产端然后生产端产生一个内容再直接给到你就是我们面向的其实是刚才说的那个产销的那个场景的那个价值就是这个内容它对于你自己来说它的价值就已经兑现了比如说我打开一个这个新的平台新的系统我要看什么内容我理解它是一个更精准的推荐更智能的推荐没有推荐它只有generate哦它只有生成对你看过的这个内容都是此时此刻为你generate出来的以內容為例啊那生產端的生產者去哪了呢他如果作為消費者我看到的是生成的東西如果只有生成的話那真人創作的內容去哪了呢他們不是去創作內容啊他們是去創作方法我們來講是recipe那這個對創作者的衝擊還是很大的我認為因為創作recipe的人是極少數而且又有多少recipe呢當機器一旦學習了以後它就不再需要這個人了就你所謂的藝術家這件事情只能說我們從邏輯推演它會發生成這樣啊但是第一這個過程是可能是會很漫長的然後第二這個過程它也是其實不可避免的就像這還挺難想像的就像之前大家在互联网上去展示自己的各种各样的内容去写帖子然后去这个就是把大家自己认为有价值的东西这个共享出来其实可能也没有想到有一天会因为这些数据产生一个智能的系统来去替代掉自己的工作是一样的最典型的就是代码我想想那比如说我要去买一个东西他给我生成什么呢他怎么给我生成一个商品呢他可以直接连接到产线呀这件事情我相信应该有团队已经在做了就是只不过他不是去做非常general的这种商品的生产而是直接可以就是直接就是它的整个这个产线是可以跟前面的需求是对上的所以在市场关系上你觉得首先干掉的是中间商当然就中间商任何时候都应该被干掉所以移动互联网互联网时代成长最大的应该都是中间商吧这是技术决定的就是中间商他当然它当然是有历史发展的特定阶段的重要贡献和价值的但是今天的技术就是又有了新的变化而且我们刚才讲说这个权力的这种过渡它一定是不可逆的它一定是越来越朝消费端去做转移就像即使在互联网时代也会出现像拼多多这样因为他在消费端他给了消费者更多的权利所以他能够做得更好的例子一个很俗的词叫创作平权对创作平权我们其实把它进一步去做一个衍生就是让它更就是更具象化是什么呢是创作可以变成表达什么意思呢我们去想不同的这种信息模态比如说语言是每个人都可以去使用的就我跟你说话这件事情是最低门槛的对只要我不是有病对吧就是我不是这个失语我就一定能够用语言去表达然后再往下一步文字文字可能对于咱们国家来说就已经基本消灭这个文盲对吧但其实从全世界的人口范围来去看的话应该是有70%的人是能够读写的然后其实还有很多人他是没有办法去写字的那他的门槛其实就高了起来然后再往下一步一步那图片的表达呢他的人就会变得更少你要用图片你要用图像去表达自己当然就是有相机之后这个事情就变得相对容易些但是我刚才讲了它是一个物理世界就是你可以把物理世界变成图片来去做表达理念世界依然是很难的就是你想象中的这个画面你要想去用图像去表达它那今天可能稍微比文字要更难一些声音音乐对更难视频至少是现在我们能够看到的可能最难的一种形态就是你要用视频去作为你的一种表达方式它是非常非常难的那为什么这件事情有意义就是第一它的发展趋势就应该是这样的为什么呢因为这种表达方式我们已经能够看到它的发展趋势就是我能够去传递的这个信息量越来越高对吧那视频它的信息量就是会更高的所以它一定会朝这个方向去发展那第二就是当从创作变成表达之后它一定会出现新的产品形态和商业模式比如如果文字你要把它就是你要去创作这个文字的话或者说就是你要这个文字它只能通过创作去产生的时候就是什么呢怎么古代要用笔墨纸印还得会写字你才能够去创造出一个文字的信息那那个时候书就是非常非常珍贵的一种东西对那到今天来说的话就是它变成一种表达方式就会有微信你可以用文字随时随地很低成本的去表达自己所以它就会有微信你很难想象说如果产生文字的信息是需要用一种创作的方式就是才能得到这个文字的话它不会有微信这样的东西那对于其他模态来说也是一样对所有的模态就是它的这个信息量信息密度越高然后它成为表达的这个难度也就越大但是当它能够成为表达的时候它产生的这个价值也会更大对所以这个其实是这个其实是我们今天去在工具端去做产品的一个初心就是让视频也能在有一天从一种创作变成让人们能够去做表达的这种方式嗯比如就是原本这个情侣之间是去写情书的对吧要表达爱意是去写情书的然后我们很多时候可以在网上看到说很用心的这个新郎给新娘在这个结婚的这个典礼上去做了一个我们历程的就是我们俩从相识到这个结婚中间所有历程的视频大家会觉得好棒这个新郎用心了这就是这个魔态的价值对但是现在它还是一种创作未来它应该变成一种更低门槛每个人随时随刻都能去做的表达对所以这个是我们现在这个阶段我觉得至少可以做很长一段时间的一个目标就是让饰品这件事情从创作能够变成表达那在这个过程中因为整个这个工具它的能力会越变越好那也意味着说至少在当前的这套经济逻辑下那使用工具的人他应该拥有比其他人更好的收益更高的效率新的AI产品应该怎么做你觉得嗯我觉得你这个词是不是有点等同于说到底什么是AInative我们觉得其实现在的产品都挺AInative的因为大家都是有了AI之后才开始做的产品只是说不同的路径然后不同的形态什么意思呢比如说现在我们能够看到的产品形态聚合能力的聚合一定是也就是大模型厂商就就不说了就大模型厂商他天然就是模型级产品从模型的能力直接这个增加一个产品的这个这个外壳他就变成了一个一个好的产品啊那我们还会看到比如说能力的聚合在语言模型的时代就会有比如说poe啊對它今天依然還在A16Z那個Top50的產品的榜單裡面對那在其他模態也會有這樣的產品因為聚合它天然就是有價值的然後再往下會有什麼呢會有比聚合比如更進一步那我不光是聚合的能力我還擁有一些編輯的能力就是我給用戶提供的價值更多了就是我不光能用到各种各样的服务我还可以把这些服务的内容能够去做进一步的加工和处理就更往前走了一步那当然也都是有价值的那比如说再往下可能就是我们刚才讲到就agent也好workflow也好它其实比简单的这个编辑处理又更近了一步它把就是智能體所謂AIworker引入到了這個系統裏面它進一步的去提效對所以這些產品形態它都是有價值的就是我們今天其實能夠看到每一個產品形態它都有做的AR做的很好的因為它們都確實產生了價值我們只不過是就是用一種和大家平行的方式去思考這個產品的形態就是刚才我们说我们要从DSL要从一个语言的设计出发这就会做的比较笨重比较慢一些但是这个可能只是它更适合我们这个团队的基因和我们对这个产品的理解所以我觉得并不存在说我们觉得应该怎么去做产品就是我们是这么去做产品的但是我们也看到有其他去做产品的方式我们认为不同的这种做产品的方式其实大家都有自己的价值也都有做的非常好的产品你觉得AInative产品的北极星指标应该是什么样它应该衡量的是什么样这个我觉得也只能从我们自己的角度出发Mydio的角度对吧是的或者是从我们未来去做所有产品的这个指标出发我觉得就是首先做产品它有商业价值这件事情是毫无疑问的去做一个公司去做一个组织即使是一个产品工作室它一定要去产生商业价值我觉得这个是一个最基本的一个标准但是在这之上我们其实会想用说整个系统它的智慧程度来去衡量这件事情对那这个其实听上去就是有点奇怪我们一个做应用的公司有什么智慧对吧对但我们不这么去认为啊就是什么意思呢就是说我们说会有一个生成系统会有一个system2那这就意味着说这套系统它是有自动生产能力的那它自动的生产能力一定是有一个评价的标准的就是你能做出60分的内容还是能做出70分的内容这东西其实是可以可以判断的它不光是一个就是比如说对内容质量的主观判断它也可以来自于就是比如说用户在这个平台上面去产生的比如说导出率然后比如说就是一个人他会付很多钱对所以我觉得至少会有一个阶段是判断生产生产端的产品和之前的SaaS产品要有一个不一样的地方在于说你能够让特定的就是少数的用户去产生海量的营收是比你用海量的用户去产生相同的营收是要更好的对就是用少量的用户产生我用三个用户产生一百万的这个营收和用十万的用户去产生一百万的营收你说对你们公司来说对吧对我们会更看重前者为什么呀因为刚才就是已经提到了就是我们认为深层系统它的价值是去scale最强的人哦对因为更強的人他也會讓系統變得更強對依然這是一個很明確的一個說法而且我相信這個可能大部分人不會這麼想這是現在的工具產品都把價格抬高的原因嗎我覺得是這樣不是因為token貴是吧算力貴当然模型就是更贵的那个价格背后对应的一定是更好的模型更完善的这个System2这是一定的对但是从刚才讲的就是你要让整个系统变得更好的这个角度来说那一定是更强的人他对你的价值更大但这绝不代表说我们不去做AR对不代表说我们不会去做收入因为只要你产品是真正能够帮用户去解决问题的你的定价合理那就是收入它是一件它是一个水到渠成的事情对就是你去提高整个系统的智慧程度它也会它就天然就会影响说你未来能够产生收入的这个上限你怎么衡量智慧程度就刚才说的就是你能够做出来的内容就是它应该是在它应该是能够去对它有一个质量的评分的你今天能够去做出60分的内容明天能够去做出70分的内容它是在提高然后比如说相同的输入的情况下对吧然后另外其实还有一个分母前面其实也有提到其实你要做到相同质量的内容如果你消耗的token越少其实你就更智能为什么因为我们去想象说我们想说去拿人去做类比去一道很复杂的数学题一个人他看了一遍题直接就给说正确答案然后另外一个人他需要就是把整个过程演算出来可能中间还做错了一遍他说这个方法错了再回头重新去算一遍然后最后得到了一个相同的答案如果說每次這兩個人他們都能用各自的方式去把這個問題做對我們一般會認為前面的人可能更聰明一些對所以對其實就是這個道理關於AInative時代的組織你有什麼思考嗎就其實還是那個點我覺得沒有什麼nativenative就是大家都是有了AI之后才出来做的公司肯定都是native的对那我们对这件事情就我们自己的这个工作过程中其实是有一些可能比较有意思的观点就是就我们前面提到了产品的这个智慧程度就这个系统的智慧程度这个智慧程度它其实是有一个能启动的要素的这个能启动的要素其实就是这个组织自己什么意思呢就是你的产品的智慧程度或者说它的这个能力等同于你的组织在这件事情上的智慧程度在成一种转化率为什么会有一个转化率这是一个组织问题的原因这个转化率肯定是越高越好对吧对那怎么能够怎么能够去提高这个转化率呢我们的我们的想法其实就跟刚才产品工作室这件事情是是连接上了就是它必须是一种主动自取的一种方式就什么意思就是我们会把这个公司视为一种环境去建立这个组织其实就是去搭建了一个环境这个跟上次那个直龄跟你讲说要用强化的方式去管理组织很像对很像我那天看到之后也是就是还蛮有意思的周星鱼跟他说的我就能猜到就是周星鱼说的对我们其实也是在构建一套环境这个环境里面的每一个员工我们把它视为一个智能体就是一个人是一个智能体为什么说在这个组织里他是一个智能体可能大家都听过一个词叫异化就是人工作就马克思主义的一个基本概念对吧就是资本会把人异化那什么是异化异化的一种直观表现就是意义的缺失或者叫意义的虚无感就是很多人他的工作就在大厂里面大家都会很苦恼的一个原因是这件事情它并不是我想做的所以当有一天你去追问这件事情的意义的时候你一层一层往回去追问我为什么要去做这件事你会发现那个意义是缺失的它是虚无的对所以人在这样的状态下他是被异化成为了就是比如说是公司的营收或者是组织或者是老板的某一个KPI就是被异化成了这样的一个工具工具人对吧对那去搭建环境的意思我们就刚才讲说人回归到人本身或者是一个智能体是说这些事情的意义它应该是由自己去决定的就什么意思呢是说每一个人的rewardfunction他不是公司来去指令的其实是大家进入这个组织的时候就带着某一个目标或者是他在这个组织工作过程中产生了某一个目标那这个环境他要做的事情是能够去找到说这些rewardfunction和组织的那个目标能够去契合起来的一种方式对所以这个就是提高那个转化率的转化率的这个关键就是每一个人在这个组织里面是会主动的就是有自己认同的这个目标来去做这件事情比如说去做Madew这个产品的这个同事那如果他对于视频这件事情本身是缺乏热爱的那这个转化率就一定是低的對這個其實比較好理解就是因為人是有主觀能動性的嘛如果他是自己對這件事情感興趣那麼其實工作對他來講可能就不是一個不是一個負擔就依然是那個產銷者的邏輯就生產的過程中他是在消費回到勞動最光榮對比如我們挺多同事他們在1期間是沒有没有完全休假的他们一直在做开发但是其实给加班费吗其实公司并没有这个加班的要求这个安排而且我们是remote办公其实你加不加班可能也没有人知道只是说最后看到这个实习期间大家都在提交代码最后都被核进去了对有人提交还有人在核对所以这可能就是就是剛才說的每個人他有自己的這個rewardfunction的一種具象因為其實你會發現有的人的rewardfunction非常簡單就是他不想這個公司死掉對所以他要做的事情就是盡可能讓這個公司能活下去為什麼AI時代需要一個就讓個人個體感受更好的組織呢你回到前面就是我們去講就是生產系統的這套邏輯就是因为你需要去scale最强的人就这个组织也是一样应该去找到最适合的人比如说代码能力那未来的代码一定会越来越多是是由模型生成出来的它的准确率会越来越高它的这个数量会越来越多那就是一个它的技术在更全的更全的一个工程师他能够去产生的代码的数量就一定是比一个技术在就比如说他只会某一种语言或者说只会某一个方向的研发他能够带来的产能就会更大对那这些就是这类人这类人他天然就是他天然就是这种主动主动性和自居性很强的对这类人他很难用传统的方式去做去做管理对所以一定要用刚才的这种方式去我马上回想把管理的问题在招聘的时候解决掉对就是前面我们现在多少人我们现在30个人增长了你们是全员都可以不来公司是吗是的那平时你们办公室有人吗我们每周会有一天大家在线下去办公但這個其實是大家主動要求的你無所謂我無所謂那你平時來公司嗎我會來公司那你看沒有人你不難受嗎不難受這其實你這樣創造力強嗎我覺得至少從結果上面來說到今天為止他的組織的產能是超出我的预期的怎么看呢就是从大家的这个工作的产出的数量还有质量来去做判断那你在招聘阶段你会注重这个人的什么呢自屈力几个点吧一个点是就自屈力包括主动性这件事情它其实是有这个很具象的能够去判断的这个依据的就比如说自蓄力强的人主动性强的人他一定会Buildingpublic他会写自己的开源项目然后他会分享自己的这个认知对然后他会做很多工作之外的这些项目他会发出来对然后另外一件事情是对某一件事情的热爱对这就刚才讲的就是必须得有自己的一个rewardfunction就你的rewardfunction不應該是不工作對吧而是勞動最光榮對就是你有其實每個人他都能找到自己最感興趣的一件事情有的人他的最感興趣的事情其實就是就是休息啊就是躺著對吧就是有直播的人他就是直播睡覺對吧這沒有問題那只是說我們要去一起做一件事情要去做一個產品那你的那个热爱的事情能和我们想去做这个事情它是能够找到就每个人他有一个向量的话他那个投影是能够投下来的就是他有更多的投影是在我们的这条线上你不能是反着对吧你就反着就投下来就不对了对你也不能是这个垂直垂直的话投下来也不对他一定是得在我们要去做这件事情上有一个比较好的一个投影对其实主要就是这两点skill最强的人为什么AI时代支持这种所谓的高人才密度的小团队就是因为有各种生产能力因为对因为生产能力本质上就是劳动力所以未来会有越来越多的劳动力它是以token的形式存在的你们有什么样独特的管理文化吗我们其实管理很轻但是因为我们remote嘛在一段时间内或者说可能未来长期也会面临一个问题就是remote它会天然带来这种孤独感然后包括信任的问题为什么因为你大部分的时间就是自己一个人在工作对以及说因为人和人之间不能就是很快很及时的去面对面的这种沟通因为人面对面沟通的话你的这种语气对吧然后你的这个肢体的动作它都是有context都是能传递信息的但是如果是一个纯线上并且是这种离线的交互方式比如说文档或者是留言这种方式它就会让人产生对其他人的这种不信任比如这件事情你是不是在敷衍我你是不是就是没做对这是很自然的事情那你没有因为这个而停止remote吗没有为什么呢因为这件事情它是可以有解法的就像你线下办公会有线下办公的问题你为什么不让大家来线下如果大家都在北京的话首先我们的人并不是都在北京我们在哪里都有人我们在很多地方都有人并且remote这件事情他其实是从前面我们去说的这个工作室他推演出来的就是如果我们要用要去就是要去做这些比较探索性比较有创作性的这种事情创造性的这种事情那你一定需要刚才说的那种类型的人那刚才那种类型的人如果他有热情他有主动和自取力那你就不需要就是一定要让大家每天到某一个地方一定要在那待着一定要去看到他的这种工作产出因为坐班制坐班制其实是从工业革命的工厂起源的农业时代没有坐班制我想什么时候去田里面去做农活都可以那他还是要依据每天的时间来做但他有足够多的灵活性OK就是因為有產線所以才需要有作班因為那件事情是人在現場的時候他要付出體力才能完成這個工作但今天就大家都是更多都是腦力勞動而且你的信息的傳遞尤其是疫情之后对吧就是这件事情也有非常多好的这些工具去解决了所以我们认为应该就是用这种方式来去适配我们刚才说找到的这些人你至少可以节省每天在路上的时间对吧然后另外一点是说当用这种方式你发现问题之后你其实可以解决的就像传统的这个企业也不像叫传统的企业就是它做棒的时候有问题你有对应的这个手段去解决那其实remote的时候也是有方法去解决比如我们刚才提到说孤独和信任这两个问题对吧那我们其实内部就有一个就是一个计划叫温暖可信计划那个对应的是孤独和失去信任它是可以有一系列的工作方法来去支撑它的怎么温暖可信比如说我们内部就是我们有一个内部的朋友圈就你在Facebook里面每一个人可以去建一个自己的话题组你可以在这个话题组里面去发起一个话题它就是一个内部的朋友圈你想发什么其实都可以可以是跟工作相关也可以是跟工作部相关的你就会发现说其实大家并不怎么发微信的朋友圈但是大家很喜欢发公司的朋友圈甚至在公司的朋友圈里面去写很长的小作文然后去讨论很多生活的八卦层级感肯定是不重的对吧我们没有什么层级感因为公司其实并没有所谓的管理岗就是我们没有管理这个角色就是每一个负责人他也是有自己的工作方向的每一个负责人?
对,每一个负责人啥意思? 就是负责人这个级别的人你们有几个负责人? 我们有三个顾负责人OK对,就是大家都是负责在去工作的其实没有太多要管理的事情你是主要負責啥的Founder我就是模型產品經理還有另外兩個Co-Founder他們是怎麼做的他們是做什麼方向的他們是做輔達編輯器的底層的架構還有就是我們剛才講的整個這System2的這一部分的工程架構你剛才也講到你們開始的時候很困難就是在剛開始24年初起步的時候然後後來是怎麼完成融資的然後你是怎麼湊齊現在這個團隊的就首先我们的融资是一种怎么说呢就是我们并我们其实没有去做这种很正式主动的那种融资为什么两个点一个是一个是当时那个时间点确实是一个资本市场比较差的时候它处于一个大模型刚刚投完然后应用公司还没有形成共识的那个阶段对所以这也是我后来才知道的所以那个时间点它融资天然就是一个挺困难的事情所以我们是做好了bootstrap的准备的就是没有钱如果我们不strap的方式的话就不会像今天这样去做一个就是用这么重的这种方式用生成系统的方式去做我们可能就会像海外的很多工具产品这样从一个很小的功能点去切入然后就开始去赚钱然后再以谋后路对这件事情的转机来自于说就去年下半年然后到其实去年下半年开始有回暖然后再到DeepSake和Manas就是把整个应用这件事情的资本的热情给激发出来了对所以我经常跟朋友讲就是大家大家都应该给Manas磕一个大家都是这个收到这个Manas的庇佑是minus不是deepsick嗎deepsick是激發起了大家重新激發起了大家的那個熱情但是minus是對應用這件事情來講是更本質的對DeepSake是說有開源的模型它可以效果也可以很好那就證明可能大家未來都可以有很好的這個基座的這個能力對吧但是就minus對於我們來說肯定是更重要的對那就是資本市場變好了那我們可能也是不断阶段性的在去deliver出来一些东西虽然我们就是比如说正式产品发布它是相对晚一些但是其实在中间的这些阶段它是会有不断是有这个milestone比如说我们产品没有发布之前其实已经在赚钱了就是我们的理念是自己先用这个东西去赚到钱你们现在怎么赚钱就比如我们现在没有发布的那个产品它其实就我们刚才讲说那种潮这个潮玩视频的这个品类其实就是这个客户用我们测试版来去支持的然后他给你们怎么付费呢就算就还是算那个工具的那个那个token你现在能赚多少钱就包括我自己其实也用产品赚到过钱就是mydeal这个产品对就是我自己用mario做视频然后发到这其实是去年年初的事情就是比较早的那版mario然后我用它去做视频然后我发到平台上面就是我自己那个号差不多做了一个多月吧就在视频号去做可能有总共有20多万的播放量这么多然后然后我一开始就不知道它能赚钱的就突然有一天他提示我说你有那个什么就是有那个那个盗账就是对我去看了一眼就是他的那个就市民号里面他的流量是即使你没有挂任何广告他也是会给你分成的就是还有几百块钱OK对所以就是从那个时间我就意识到说这个产品它真的能赚到钱对然后包括就是最近我们线上的产品也会发现说原来是有那么头部的这种创作者他是每天在用而且把周围的人的号全部都借了一遍去充钱然后新版的这个产品能够让就是我们刚才讲说可以它打穿一个品类对所以就至少证明它是能赚钱的那你团队是怎么凑齐的对刚才还提了这个问题我们是传销模式就是拉人对我们的同事基本上都是一度和二度人脉从哪些公司来的什么公司都有但其实比如上一家公司就是在大厂的不多就很多人的经历是或者说比较典型的话像是一开始在大厂或者说比较好的那种创业公司然后后来就自己出来独立创业或者是加入一个非常早期的公司对就是前一就是就是来我们这的前一份的工作的话像大部分是这样就是我们的就叫那个创业者的那个比例会很高就是我们可能有一半左右的人之前是做过这个founder或者是co-founder的这样的角色的对然后还有还有另外比例很大的人是在就可能从那个公司一成立开始或者就是这个公司这个成立时候的核心的员工哪些公司呀可能是什么类型的公司什么类型都有就工具公司AI公司对什么都有我特别喜欢听你讲畅想因为你特别喜欢推演所以说民科太民科了这个从互联网到AI到底还会发生什么呀刚才我们讲了信息商品的可能的演變那在其他環節呢其他生產環節呢還是再來明科一把我覺得明科的部分我們聊的有點多五年後再來看看吧十年後是的是的我覺得幾個點一個點剛才有提到就是從這個分配經濟然後到生產經濟這剛才已經聊過了對吧就從分銷平臺到產銷平臺这会是从产品形态然后到未来商业模式都会有一个巨大变化然后可能再具体一些比如到比如到具体的这个产品的这个生产其实之前大家生产的都叫单点内容对就是我每个人生产的是一个是一份内容然后这个内容它在一个公寓的这个池子里面接受算法的这个匹配然后内容之间它是缺乏连续性的那我们刚才其实也讲过说在这个生产系统里面未来的生产者他生产的其实是叫RecipeRecipe本身上是一种方法它不代表任何一份具体的内容它并不代表这个视频A视频B而是代表着视频A和B的一种生产的就是抽象出来有共同有通用性的内部所以它对应的就不再是单点内容而是你可以把它称为叫IP就是它是有一些共同属性的连续内容对所以就是生产的东西其实变了不再是生产单点的一份一份的东西而是有共同属性的内容他们组合他们组成的其实就是就我们其实没有想到更好的词就是IP可能也没有那么准确但是现在只能用这个词来去来去代替它对第三点是说因为是一个经济体系嘛那一定是有它的货币的这个货币我们认为也会发生变化为什么就是之前的货币其实大家要注意力就是就刚才举的那个例子就是为什么要出现那种那么奇怪的内容形式什么两三秒钟让你突然看一下又看不清它本质是因为强化注意力对它能够更好的去获得你的注意力就是注意力是这套经济系统里面的货币对因为平台需要这个对那這個貨幣它會隨著生產端內容的風域就是它的性質會發生變化因為內容太多了然後這個注意力是有限的對人的注意力是有限的這個時長也是有限的那它不夠分配的時候又要就是它的这个价值就会转移它会转移到什么呢我们把它称为叫信任比如说你的内容它不是所谓那种就是最能够适合普通大众去消费的那类内容所以它在流量池子里面它天然权重是低的对吧但是你的内容它的价值是高的因为你的受众的人群的价值是高的就看你耗的人的平均收入水平平均学历一定很高对那如何去把这些人他们的价值给提炼出来它其实就不是一个简单的注意力了因为这些人的注意力和其他人的注意力就是每个人的消费能力不同他这个注意力那个价值肯定是有差别的但是他的差别不那么大对一个公寓的流量池子来说但是这些人他对你的就是他对你的这个号的这个价值其实不简单是注意力的一个价值不简单是那几秒就是那几十分钟去读你文章的价值而是会产生一份对你的信任对这个频道的信任之前玩游戏大家说暴雪出品必属精品虽然今天这个暴雪已经不行了但是早年的时候暴雪它本身就是一种信任只要它出了游戏大家就一定认为是非常好的我们刚才讲说在生产端它拥有了对一系列内容的生产能力所以这个内容它从单点的变成了就是系列连续的它变成IP那与IP所对应的那个货币它就从注意力变成了信任就什么意思比如说substockmedium它不是一个流量分配的逻辑它是我信任这个作者我订阅了他的专栏对这件事情在今天它是已经在发生的但是它还并没有那么普及但是它好像互联网时代就发生了它不需要到AI时代了它没有普及它没有成为主流就是那个信任它并不是主流的货币为啥AI时代会成为主流这个跟AI的关系是什么好问题还是回到生产力这个就是还是回到这个生产端因为之前这些内容的生产能力是匮乏的就是之前要去稳定的去生产出好内容这件事情是难的必须要有足够多的内容来去填充这个大的这个池子这个是好理解的对吧那今天的话如果是通过recipe再加上一个生产系统来去做内容的供给那其实就是所谓同一种质量或者说越来越高质量的供给它就不是稀缺的了那稀缺稀缺不會消失稀缺只會轉移它就會從單個內容上轉移到IP上IP對應的那個載體其實就是剛才說的信任好像有道理比如說OnlyFans對最典型的是OnlyFans對就是你會去訂閱是因為信任是因為信任這個號的內容質量對吧其實這件事情它已經越來越普遍了就是大家都會把大家都會把公寓平臺變成一個招商引資的地方就是創作者都會去經營自己的私寓公寓你指的是什麼比如說在抖音上面直播這是在公寓然後大家一定會說家群比如說這個公眾號的作者大家一定會說去小河通去这个知识星球买我的付费内容这其实就是一种信任它的价值是比那个它的价值是比注意力是要高的你有没有发现就是它可能流量不是很高啊就是一些作者他的那个文章的流量不是很高的它的观看数不是很高的但是它的质量很好观看就是喜欢它内容的人产生了信任他们有足够的消费能力那这个价值它就有另外一种这个兑现的方式是什么呢信任呢就是我愿意为信任付费去加入知识星球然后去私域里面去购买一些东西它在AI时代会怎么放大呢就是稀缺的内容提高了数量提高了它能更规模化的生产了就是每一个人他都可以拥有某种稳定质量的生产某种稳定质量的内容生产大家都可以去形成自己的IP而不需要去在一个公寓的流量池子里面去争抢大家的注意力就很优雅一点呗或者說更就還是那個詞嘛就是沒有中間商賺差價嘛那平臺會怎麼樣平臺平臺也會轉型嘛對你覺得推進以前系統直接變成生產系統makesense嗎他們直接升級一下新一種的系統它對舊的系統一定是兼容的就像推薦算法裏面就是推薦的產品裏面它依然有搜索它是不衝突的像你前面有提到一個問題就是那大家看的都是大家看的都是所謂給自己的這個內容那其實也依然存在說其他人能夠看到你生產的內容只不过说它可能不是那个就是价值的唯一兑现方式对吧可能绝大多数的价值就是自产自销但是你你自产的那种你自销的那种它是一个好内容那它依然可以对其他人产生价值就这也是刚才你说就是你说那个创创作者会消失我说其实不是而是说他们的就是他们的群体敌会放大然后第二他们的价值也会放大的这个原因是因为大家的生产力都变得很好因为那个系统它提供了一个baseline就是大家都能够生产出很好的内容但是这里面的差别就刚才讲了就是稀缺它只会转移不会消失这个稀缺就变成了你的品位你的消费品位就是一种生产资源微软的内容会全部都是AI生成的吗电影电视视频我觉得至少会有越来越多的这个比重它是来自于生成的我们去观察其他魔态的发展历程就可以就是做不成熟的魔态有一个非常好的点就是你完全可以去参考已经成熟魔态的发展历程就我们去想说文字的内容我们今天看到的文字内容里面有多少的這個比例就是一篇文章裏面它有多少的內容多少的字是來自於生成的我們的新的代碼裏面有多少是來自於生成的這件事情的比例在不斷的提高然後未來其他模態也會是這樣會不會以後內容消費平臺裏面的內容全部是AI生成的創作者整體消失你覺得不會不會就剛才說的就是你消費的時候就是在創作你消費的時候我覺得從人性的角度來說我還是很想看另外一個人類在做什麼的出於這個目的我覺得我還是會消費它我不會只想消費AI的內容但我不知道如果AI內容太強大了會不會吸引到我全部的注意力好問題其實你把消費時候產生的那個內容不稱作為另外一個人生產出來的東西但是其實它就是這個人生產出來的我系统基于我的偏好它做了一份内容只是说我没有去亲自去写这个内容没有亲自去编辑这个视频但是这份内容它是来自于我对呀那我认为是你的内容对就版权是你的对吧对当然就产销嘛就是它是在它在消费中生产它的生产就是自己的消费但你也同时说有那个生成平台生成系统产生的内容它也自己能凭空generate大量内容这和你作为一个个体通过某一个工具来generate内容我认为第二种是你的内容第一种是平台自动就生成的内容那会不会它把我的注意力全部抓走了我就不想看你生产的内容反正都是民科对吧就是现在反正都是民科时间都是瞎说乱扯這裡其實不存在你剛才說的那個界限為什麼因為產銷的時候產生的那個內容它是消費的這個用戶他的意圖然後這個輸入到這個系統裡面再返回出來的內容並不是說有一個巨大的平臺他在不停的往外自動吐東西就是你可以想像說ChatterGBT其實今天就是這個其實就是這個系統大家在去解決自己的問題的時候其實產生的內容這個內容它對於其他的人是有消費價值的就是一個對某一個領域很有knowhow的人就前兩天那個田園洞對吧他說他們那個新論文是跟GPT-5聊出來的那個過程其實就是它是在產銷的過程中產生了一個對其他人有很大價值的東西背后的那个系统是就我们刚才讲的它是我们说的那个生产系统就GPT-5它是那个生产系统理解你的意思对每一个人在去使用GPT-5的时候它产生了一份内容这份内容其实对其他人来讲也是有消费价值所以你在使用GPT-5的时候你既是在消费它产生的内容你同时也在去做一个新的内容的生产最后几个快问快答一个全球范围内你喜欢的食物首先我不喜欢旅游所以我没有什么全球的概念为啥不喜欢旅游我比较喜欢米饭类的食物甚至是白饭为什么呀因为米饭它的兼容性很强就是任何一个食物和米饭搭配下你会觉得它非常有滋味也有人不吃碳水啊那是另外一个问题一个全球范围内你喜欢的地点对因为不喜欢旅游所以我觉得任何安全和安静的地方就会比较舒适一个少有人知道但必须了解的知识点我其實不能確定說這個事情是不是太多人知道但是我第一次知道的時候我覺得是蠻反常的叫一代人或者說一世就是一世一個世界就是一世它是個時間概念對這個時間概念所代表的那個時間範圍其實很短它大概是25年到30年一世是25年到30年應該是80年90年了是的所以这是我知道这个信息的时候还蛮震惊的这代表着什么呢这代表着说像我这样年龄的人其实是在做可能很多下一代人的产品或者说甚至是下一世的人的产品这是一个听上去很惊悚的事情是说它正在发生比如一个三十多岁的人他做的产品可能是一个二十五到三十就是比他小二十五或者是三十岁的人在去用的东西你其实在服务于另外一代人或者说另外一世的人这是听上去很很离谱据所有读过的书推荐两本必读书没有什么必读的这个概念我觉得每个人他喜欢的东西都不太一样我可能只能说就是一个是可能我常读的书就是《道德经》我会常读然后另外一个是在读的书对我最近在读《慢煮生活》它是汪曾祺的一个散文集就是他描述的是就跟白饭一样他描述就是他可以把很普通的生活描述的让你觉得很津津有味很有意思你是一个道家的人吗? 我不是一个道家的人我只是觉得我比较喜欢传统文化而道家的文化或者说它的一些哲学的理念我觉得和我会更搭一些道家大家会说老庄嘛就是老子和庄子他是非常非常不一样的就是庄子他的思想会更像你说的那一点就是要脱离世俗但是其实就是《道德经》里面的思想他完全是入世该如何去就是你是在这个世俗世界里面如何活得更好而不是教你跳脱出去对我把它形容叫是老子和庄子他合并起来其实是叫一套大鱼与蝶的这样这样的一个比喻吧就是庄子他是他很像大鱼大鱼什么的大鱼是昆,对,他是飞在天上的,他很大,然后他叫背负苍天对吧,这个对一些北海,所以他是从一种很超脱的这个视角来去看到很远的东西,对这当然是好的,但是老子的思想他更像你心目中影响AI进程的重要几片路吗?
因为我不是这个技术出身,所以我对算法的理解其实是很浅的,对,所以我很难去评价说到底哪些论文它对于行业来讲很重要,我只能是说对我的工作或者说对我的认知有比较大的影响的几个文章吧,就是它也未必是论文,就一篇是这个Let'sverifystepbystep它应该是23年的5月份吧就是应该是Q2的时候应该也是伊利亚最后一篇署名的这个论文它里面其实提到的是过程监督但是过程监督大家今天对它有concern就是因为有RIL了就是这个人去标注过程它未必是最高效的但是这里面更重要的一个理念我觉得抽象出来是说方法它是一个更高维度的智慧就做事情的方法它和知识是两个不一样的东西就像单词和语法是两个东西一样这两个东西它都代表着智慧而方法它代表的智慧程度可能更高它可以是人标注的过程监督的数据也可以是RL出来的就是中间过程的数据对,所以这是一个对我影响比较大的,然后第二个其实也跟这个伊利亚相关,它应该不是一个论文,它是一个分享,它应该是对深层的一个观察,就是anobservationofgeneralization就是我完全看不懂它里面有很多数学的公式的计算我是看不懂的但是这里面一个很重要的思想是为什么无监督会有效对就是无监督有效他提出如果是两份数据xy其实无监督是在从xy中学习是从x中学习y从y中学习x所以他是把两份数据中的那个共性是能够抽象出来的这个其实我觉得当时对我的那个触动是很大的对然后可能还有一篇它是讲语言的它是叫语言建模语言建模就是压缩它叫languagemodeling大概是这个意思它也是从数学的这个层面论证了说为什么语言模型它就是压缩那你看在对应上我们之前聊到的其实压缩它就能带来智能所以这件事情它就是对的但是我其实很多细节是看不懂的它全是数学公式看不懂但里面一些这个理念我觉得对我影响很大基于你当下的认知一个关键的重要的bet是什么不管是AI这件事情还是所谓的AGI这件事情它是一个longChina的事情对,所以我betChina好了今天的节目就是这样这里是商业访谈录是一档由语言及世界工作室出品的深度访谈节目你可以到公众号关注我们的工作室获取更多的信息我们的公众号是语言及世界languageisworld我们希望和你一起从这里探索新的世界
张小珺Jùn|商业访谈录 Episode 123 对ONE2X创始人王冠3小时访谈:生成系统、没有中间商赚差价、内容平台的权力分配 播出日期:2025年12月12日
主要嘉宾:王冠(1toX联合创始人/CEO,原Kimi模型产品负责人) 主持人:张小珺
本期节目长达3小时,深度对话ONE2X(1toX)联合创始人兼CEO王冠。节目以“AI生成系统”的产品逻辑变迁、AI时代内容平台的权力分配、创业组织的未来,以及“没有中间商赚差价”的信息平台新范式等作为主线,全面展开对中国产业界AI创业实操、底层原理、个人经验和商业逻辑的深度解析。
[06:40-11:25]
“我们觉得它很像一个工作室…每个人都是独当一面的超级个体。”——王冠 [09:22]
[11:30-38:00]
“今天的产品经理,他的价值反而是被放大了…不管是System1还是System2,都有产品发挥巨大价值和主导的空间。”——王冠 [35:52]
[38:00-65:00]
“虽然之前做了这么长时间AI…但模型能力到底是怎么出来的…其实我完全不得而知。这对产品来说是非常危险的事。”——王冠 [60:11]
[73:30-90:00]
“产品应用公司必须设计一份‘世界上此前不存在的数据’,这是唯一能和大模型公司保持共同存在的解法。”——王冠 [88:22]
[90:00-115:00]
“人工智能有多少人工,就有多少智能。... 数据决定智能边界。”——王冠 [77:53]
[154:00-177:00]
“今天的互联网平台其实都是中间商... 推荐引擎也是中间商,搜索引擎也是中间商。AI生成系统的核心,是没有中间商赚差价。”——王冠 [176:41]
[177:00-200:00]
“我们是为能适配未来模型能力的system2架构做准备…你唯一要做的,就是保持你的速度和目标不变。”——王冠 [161:33]
[200:00-212:00]
[194:00-200:00]
“我们把所有应用公司视为‘还没开始做自己模型的公司’,模型公司都做产品,应用公司迟早会做模型。”——王冠 [171:52]
“应用拼的其实只有context... 相同的token,你如果能实现更好效果,你就赢了。”——王冠 [153:11]
“模型即产品,不代表产品经理失能。产品经理定义system1与system2的结构,本质价值甚至更被放大。”——王冠 [36:07]
“真正的应用机会在‘第三份数据’,即随着产品形态诞生的内生新数据,只有这样才能和底层基座模型形成安全协同。”——王冠 [88:17]
“未来内容平台的权力必然继续下沉,最终归于消费端。所有的生产和分配都将内化到生产系统。”——王冠 [159:12]
“中间商任何时候都应该被干掉,这也是技术决定的。”——王冠 [180:35]
“reward function必须与个人深度契合。只要你找到这种强自屈力的主动智能体,不存在传统意义的'管理'。”——王冠 [195:12]
AI创业与产品经理的未来
“数据为王,产品经理能力被大大放大。设计能力、做能力闭环、挖掘/创造稀缺数据才真正构筑壁垒。”
AI内容平台的权力大洗牌
“通过生成系统实现产销一体,无需中间商,构建属于个人/小团队的内容经济体。”
应用公司与模型公司的新博弈
“只要能持续创造‘第三份数据’,通过System2做好context,应用公司终将突破模型厂商的延长线,建立自己的独特价值与生存地带。”
AI时代的组织新范式
“高人才密度+强自屈力+remote。公司变成‘环境’,组织是scale和放大最强个人的工具。”
本期为AI应用创业与“新内容系统”时代最具代表性的深度访谈之一。无论是技术创业者、内容创作者,还是平台行业观察者,都能从王冠的“顶层推演”与“一线实践”中,洞见AI更大格局的趋势与现实。