
Hosted by Bear Liu · ZH
《BearTalk AI 每日简讯》是一档每天更新的 AI 科技播客,由 AI 制作,人类把关。每天更新,每期约 15 分钟。
每天早上,BearTalk Agent 编辑部从 25 个经过精选的信源中采集内容:包括 Anthropic、OpenAI、Google DeepMind、Meta AI 等一线实验室的官方发布,Simon Willison、Ethan Mollick 等独立研究者的深度分析,以及 Hacker News、Reddit 等社区的一线讨论。候选内容经过多轮 AI 筛选、撰写和校对,最终提炼为 5 个值得认真对待的话题。
这档节目不追热点,不堆资讯。它只做一件事:在 AI 领域每天产出的海量内容里,找出真正影响你工作方式和思维方式的那几个信号。
音频由 Bear 的克隆音色朗读,每期约 15 分钟,适合通勤或晨间收听。
---
BearTalk AI Daily Notes is an AI and technology podcast, published every day. It is produced by the BearTalk Agent team and overseen by Bear Liu.
Each morning, the system collects content from 25 curated sources: official releases from leading labs including Anthropic, OpenAI, Google DeepMind and Meta
AI; in-depth analysis from independent researchers like Simon Willison and Ethan Mollick; and first-hand community discussion from Hacker News and Reddit.
The candidates go through multiple rounds of AI selection, writing and review, and are distilled into five topics worth your attention.
This show does not chase headlines or pile up information. It does one thing: find the signals that actually matter to how you work and think, from the flood of AI content published every day.
Each episode runs around 15 minutes, narrated in Bear's cloned voice. Good for commutes and morning routines.

本期内容今天五件事,从黑客实验到说服力研究,从团队协作到政府禁令,勾勒出 AI 正在快速嵌入权力结构、组织结构和认知结构的轮廓。你会听到一个两千人参与、零人成功的安全实验,一项让人发凉的说服力研究结论,以及 Claude 以「团队成员」身份进入 Slack 这件小事背后的大转变。听完这期,你对「AI 能不能用、谁可以用、用了之后发生什么」这三个问题,会有更清晰的认知框架。本期要点- OpenAI 发布 GPT-5.6 三件套 Sol、Terra、Luna,按复杂度分层定位,但目前仅限预览合作伙伴访问,政府参与了发布节奏的管理- Anthropic 收到美国政府指令,紧急暂停所有外国公民访问 Fable 5 和 Mythos 5,包括持签证的外籍员工,无具体理由说明- Claude Tag 正式推出,可作为真实团队成员加入 Slack 频道,记住上下文、主动规划任务、响应 @ 召唤,不只是一个问答插件- 博主 Fernando 公开邀请两千人攻击他的 AI 法律助手,超过六千封攻击邮件无一成功,文章详细记录了各类攻击模式- 牛津、斯坦福等机构联合研究证实,AI 的说服效果已决定性地超过人类专家,且无需造假,只需更好的框架和更准确的认知切入点参考资料OpenAI GPT-5.6 发布报道 — https://openaifoundation.org/Anthropic 官方声明:暂停 Fable 5 和 Mythos 5 访问 — https://www.anthropic.com/news/fable-mythos-accessIntroducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tagWhat happened after 2,000 people tried to hack my AI assistant — https://hackmyclaw.comImport AI 第462期:超级说服力与通往 AGI 的路径 — https://importai.substack.com---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容AI 正在同时从多个方向往前推:模型更强、说服力超人类专家、开源管控争论持续、Adobe 重构设计工作流、而那些告诉你"哪些职业要消失"的图表,其实掩盖的是最深的不确定性。今天这五件事,帮你看清 AI 和你自己工作之间的具体关系,而不是宏观的恐慌或乐观。本期要点- OpenAI 一次发布 Sol、Terra、Luna 三款 GPT-5.6 模型,分层定价成平台标配,但受美国政府要求暂时限制访问- 牛津、斯坦福等机构联合研究证实:AI 的说服效果已系统性超过人类专家,谁在决定 AI 向哪个方向说服人,是产品设计必须正视的问题- 一篇反对禁止开源 AI 的观点文章被各大主流媒体拒稿后发在 Substack,作者认为禁令在技术上无效、在政策上适得其反- Adobe 将代理式工作流嵌入整个 Creative Cloud,从生成单张内容升级为跨工具任务编排,设计师角色从操作者变为流程设计者- Benedict Evans 指出预测 AI 对工作的冲击几乎不可能,因为工作本身在持续变形,与其看替代率图表,不如自己梳理任务清单参考资料Previewing GPT-5.6 Sol — https://openai.com/index/previewing-gpt-5-6-sol/GPT-5.6 Preview System Card — https://deploymentsafety.openai.com/gpt-5-6-previewImport AI 462: Superpersuasion; self-sustaining AI; paths to ASI — https://importai.substack.comBanning Open Source AI Would Be A Mistake — https://interconnects.aiAdobe embeds agentic AI workflows across Creative Cloud — https://venturebeat.comPredicting AI job exposure — https://www.ben-evans.com---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容AI 正在从个人工具变成组织基础设施。本期五个话题围绕同一条主线展开:agent 如何重新定义知识工作的基本单位,Claude 如何以团队成员而非工具的身份进入协作流,开源模型在 agent 能力上完成质变,以及提示词注入为何是架构层面的系统性问题而非可以打补丁修掉的漏洞。听完这期,你会对"AI 融入团队"这件事有更清醒的判断:能力是真实的,责任边界也需要重新划定。本期要点- OpenAI 内部数据显示,员工已将复杂多步任务大量委托给 agent,知识工作的单位正从单次交互变为可被委托的长程任务- Anthropic 推出 Claude Tag,让 @Claude 以团队成员身份进驻 Slack 频道,积累上下文、执行任务,对整个团队透明- GLM-5.2 被 Nathan Lambert 认定为开源 agent 的门槛时刻,agent 能力存在离散的阈值效应,越过临界点后效用出现非线性跳升- Lambert 与 Kevin Xu 联合撰文反对禁止开源 AI,指出真正的风险是少数机构垄断 AI 决策权,而非开源本身- 牛津大学等机构研究者提出新框架:提示词注入的根源是 LLM 无法区分自己的指令与外部输入内容,是架构层面的身份认知问题参考资料How agents are transforming work — https://openai.com/index/how-agents-are-transforming-work/Introducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tagGLM-5.2 is the step change for open agents — https://www.interconnects.ai(Nathan Lambert, Interconnects)Banning Open Source AI Would Be A Mistake — https://www.interconnects.ai(Nathan Lambert & Kevin Xu, Interconnects)Prompt Injection as Role Confusion: A Theory of Prompt Injection — https://role-confusion.github.io---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容这期节目围绕一个核心问题展开:当 AI 能力足够强,我们和它协作的瓶颈到底在哪里?五篇内容从不同角度切入同一个答案:不是工具不够用,是信任边界还没想清楚。从 OpenAI 内部数据揭示的使用习惯门槛,到 Claude 进入 Slack 团队频道,再到一项证明 AI 说服力超越世界辩论冠军的大规模实验,听完这期你会对"委托给 AI"这件事有更具体的感受,也会对它的风险边界有更清醒的认识。本期要点- OpenAI 内部数据显示,员工花了数月才从聊天模式转向委托模式,代理的真正门槛是使用习惯而非技术- Claude Tag 让 Claude 以团队成员身份常驻 Slack 频道,有上下文记忆,可随时被 @ 处理任务- GLM-5.2 在自主多步工具调用能力上出现质变,本地部署的代理方案开始真正可用- 牛津、斯坦福等机构联合研究发现,AI 个性化说服成功率在每一轮对比中都高于人类专家,包括世界辩论冠军- AI 代理最大的失败模式是跑错方向却一直跑下去,写指令时加上"什么情况下停下来问我"是当前最实用的应对方式参考资料How Agents Are Transforming Work — https://openai.com/index/how-agents-are-transforming-work/Introducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tagGLM-5.2 is the step change for open agents — https://www.interconnects.ai/AI systems out-persuade expert humans — https://arxiv.org/Can AI Learn Good Judgment — https://every.to/context-window---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容本期覆盖 AI 基础设施、协作工具、代理架构、说服力研究和开源政策五个方向。OpenAI 推出自研推理芯片,标志着它从"买算力"迈向"控制算力";Claude 以团队成员身份进入 Slack,改变的是人和 AI 协作的关系模型;Alibaba 用一种反直觉的训练方式,在七项代理基准上全面胜出。如果你在构建 AI 产品或关注 AI 政策走向,今天这五篇都值得原文打开。本期要点- OpenAI 联合 Broadcom 发布首款自研推理芯片 Jalapeño,九个月从设计到量产,目标是降低推理成本、减少对 NVIDIA 的依赖- Claude Tag 让 Claude 以频道成员身份加入 Slack,可被 @ 分配任务并持续积累上下文,把 AI 从对话窗口带进了真实工作流- Alibaba 的 Qwen-AgentWorld 从未在代理环境中训练,而是学习"动作后环境如何变化",结果在七项跨域基准上全面提升- Import AI 462 引用牛津、斯坦福等机构联合研究,指出 AI 说服力已稳定超越人类专家,但意图与授权层面的治理框架几乎是空白- Nathan Lambert 和 Kevin Xu 的文章论证禁止开源 AI 既不现实也造成净损害,被主流媒体拒稿后登上 Hacker News 热榜引发大量讨论参考资料OpenAI and Broadcom unveil LLM-optimized inference chip — https://openai.com/index/openai-broadcom-jalapeno-inference-chip/Introducing Claude Tag — https://www.anthropic.com/news/claude-tagAlibaba's model never trained as an agent — and improved agent performance across seven benchmarks — https://venturebeat.com/ai/alibabas-model-never-trained-as-an-agent-and-improved-agent-performance-across-seven-benchmarks/Import AI 462: Superpersuasion; self-sustaining AI; paths to ASI — https://importai.substack.com/p/import-ai-462Banning Open Source AI Would Be A Mistake — https://www.interconnects.ai/p/banning-open-source-ai-would-be-a-mistake---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容AI 正在悄悄改变几条关键的边界:谁在控制推理基础设施,谁在你的工作频道里等你,谁能更有效地改变你的想法。本期五件事,从芯片到 Slack、从 agent 训练逻辑到说服力研究,还有一篇关于如何识别真正专家的好文,帮你把这些点连成一条线。听完这期,你会对"我真的在控制什么"这个问题有新的感受。本期要点- OpenAI 与博通联合发布推理芯片 Jalapeño,九个月从设计到量产,OpenAI 正在把自己重新定义为基础设施公司- Anthropic 推出 Claude Tag,让 Claude 以频道成员身份常驻 Slack,任务可委托、有记忆、能主动跟进- 阿里巴巴 Qwen-AgentWorld 从未针对 agent 任务训练,却在七项 agent 基准上全面领先,挑战了主流训练范式- 牛津、斯坦福等机构联合研究证实 AI 的说服力已稳定超越人类专家,"你现在的判断是自己做的吗"成了真实问题- Farnam Street 提出区分真专家与模仿者的核心信号:真正的专家知道自己的边界在哪里,而流畅不是能力的证明参考资料OpenAI and Broadcom unveil LLM-optimized inference chip — https://openai.com/index/openai-broadcom-jalapeno-inference-chip/Introducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tagAlibaba's model never trained as an agent — and improved agent performance across seven benchmarks — https://venturebeat.comImport AI 462: Superpersuasion; self-sustaining AI; paths to ASI — https://importai.substack.comExperts vs. Imitators — https://fs.blog---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容AI 正在从工具变成权力结构的一部分。本期从说服力研究、团队协作产品、开源格局变化、安全攻击机制,到资源分配思维,五个角度描绘了同一件正在发生的事:AI 不只是帮你做事,它开始影响你怎么判断、怎么分工、怎么竞争。听完这期,你会对"该怎么用 AI"有一套更具体的思考框架。本期要点- 牛津等四校联合研究证实,AI 说服效果可靠地高于人类辩论专家,个性化营销和决策影响的边界正在被重新定义- Anthropic 推出 Claude Tag,Claude 可作为频道成员加入 Slack 团队,持续读取上下文并自主完成多步任务- 清华与智谱 AI 发布 GLM 5.2,支持百万 token 上下文和 Agent 能力,开源模型正逼近实用性临界点- 提示词注入的根本是角色混淆,模型无法可靠区分"执行指令"和"处理数据",这直接影响 AI 产品的系统设计- Token 预算将像广告预算一样被公司管理和分配,能量化 AI 使用价值的人将拥有更强的资源议价空间参考资料Introducing Claude Tag — https://www.anthropic.com/news/introducing-claude-tagPrompt Injection as Role Confusion — https://role-confusion.github.ioToken Tightening (Every.to) — https://every.toImport AI #462: Superpersuasion; self-sustaining AI; paths to ASI — https://importai.substack.comGLM-5.2 is the step change for open agents (Interconnects) — https://www.interconnects.ai---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容一个免疫学家卡了三年的实验室难题,被 GPT-5 在几天内找到突破口。这件事背后真正有价值的不是 AI 有多聪明,而是它能帮你看见那些因为太熟悉而被你忽略的东西。今天五篇内容围绕同一条线:AI 最大的价值,是让你看见,而不只是替你做。听完这期,你会有三件可以今天就动手的事。本期要点- GPT-5 没有带来新实验,而是把三年的文献和数据重新排列,找到了免疫学家一直看不见的逻辑裂缝- 提示词注入的根本原因是"角色混淆",AI 不知道谁说的比说了什么更重要,这个理解对产品设计有直接影响- 开源模型在某些关键指标上已悄悄越过了重要门槛,竞争格局正在重新计算- 把职业经历全部喂给 AI 做诊断,它找出的是你反复回避去承认的那个模式,不是鼓励,是镜子- 给 AI 的输入越精准越好,删掉礼貌性前缀、先浓缩文档、用任务理解确认来校准方向,三个小动作能显著提升输出质量参考资料How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery — https://openai.com/index/gpt-5-immunology-mystery/Prompt Injection as Role Confusion — https://role-confusion.github.ioI Asked an AI to Audit My Own Career — https://every.to/working-overtimeToken Tightening — https://every.to/context-window---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容本期从一篇让人停下来认真想的研究开始:AI 已经能在语言说服力上系统性击败职业辩手,这不是能力展示,是需要认真对待的现实。与此同时,开源模型 GLM 5.2 带着百万 token 上下文窗口出现,让"默认用闭源模型"这个假设开始松动。Cloudflare 在基础设施层给 AI 代理发临时身份证,OpenAI 用 AI 帮开源社区打安全补丁,再加上 Product Hunt 上一个"AI 设计搭档"引发的判断力讨论。今天五件事,覆盖说服力、安全、身份认证、开源竞争、创作主体性,听完你会对"AI 正在变宽"这件事有更具体的感知。本期要点- AI 在近一万九千段对话实验中系统性击败所有层级的人类辩手,超级说服力已是今天的现实- OpenAI 联合 Trail of Bits 推出 Patch the Planet 计划,用 AI 为 Linux 内核和主流浏览器生成安全补丁- Cloudflare 推出 Temporary Accounts,让 AI 代理能程序化创建临时账号,无需人类干预完成注册流程- 清华智谱 GLM 5.2 带来百万 token 上下文窗口,开源模型对闭源的追赶让"用哪个模型"从性能问题变成信任问题- Alai 2.0 在 Product Hunt 上线,"AI 设计搭档"的定位引发关于创作者判断力退化的真实讨论参考资料Daybreak: Tools for securing every organization in the world — https://openai.com/index/daybreak-securing-the-world/Patch the Planet: a Daybreak initiative to support open source maintainers — https://openai.com/index/patch-the-planet/Temporary Cloudflare Accounts for AI agents(via Simon Willison)— https://blog.cloudflare.comGLM 5.2 brings 1M context — The Neuron DailyImport AI 462: Superpersuasion; self-sustaining AI; paths to ASI — Import AI by Jack ClarkAlai 2.0 — https://www.producthunt.com---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast

本期内容这期节目围绕一个核心问题展开:当 AI 能力越来越强,我们有没有在用自己的判断?五篇内容分别触及了说服力、基础设施安全、模型供应链韧性、代理身份机制,以及我们预测 AI 影响的方式本身是否成立。听完这期,你会对"依赖 AI"这件事有更具体的感知,也会有几个可以立刻动手试的小习惯。本期要点- 牛津、斯坦福等机构联合研究发现,AI 的说服力已稳定超过世界辩论冠军,而被说服的人往往毫无察觉- OpenAI 联合 Trail of Bits 推出 Patch the Planet 计划,用 AI 同时生成漏洞发现和修复补丁,目标是解开开源维护的公地困境- 日本 Sakana 在 Fable 5 被封禁同日发布 Fugu 系统,通过多模型路由和合成提供不依赖单一来源的前沿性能- Cloudflare 推出面向 AI 代理的临时账号机制,让代理可以跳过人工认证环节独立完成任务- Benedict Evans 指出,预测"哪些工作被 AI 取代"的分析框架根本上就错了,因为工作本身会在工具存在后才被重新发明参考资料Daybreak: Tools for securing every organization in the world — https://openai.com/index/daybreak-securing-the-world/Patch the Planet: a Daybreak initiative to support open source maintainers — https://openai.com/index/patch-the-planet/Statement on the US government directive to suspend access to Fable 5 and Mythos 5 — https://www.anthropic.com/news/fable-mythos-access---BearTalk 狗熊有话说播客,始于 2012 年。订阅地址:https://beartalking.com/page/podcast