PodDeck
← 全部标签
标签

#ai-research

22 集相关 · 22 集已生成

已生成

140. 对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去

姚顺宇 · 研究科学家 · 前 Anthropic · 现 Google DeepMind (Gemini)

张小珺·语言即世界 EP.140,对姚顺宇的 4 小时访谈节选。姚顺宇博士毕业于斯坦福 理论高能物理,2024 年半道出家加入 Anthropic 参与 Claude 3.7、4.5 的强化学习训练; 2025 年 10 月跳槽到 Google DeepMind 做 Gemini 的 ML coding / long horizon。 这期把两家 lab 的打法、coding bet 的内部信号、AI safety 的"幼稚"自我说服、 以及"个人英雄主义时代已经过去了"等小疯言论摊开讲清楚。

What rebuilding AlphaGo teaches us about self-play, RL, and future of LLMs - Eric Jang

Eric Jang · ex-VP AI @ 1X · ex-Google DeepMind Robotics

Eric Jang 在 sabbatical 期间用大约 10K 美元 + Claude Code 重新实现了 AlphaGo, 在和 Dwarkesh 的对谈里把 MCTS 拆到底——为什么它不是 credit assignment、 为什么它比当下 LLM RL 优雅得多、以及 10 层网络居然能把一个看似 intractable 的搜索问题塞进一次 forward pass。后半段是用 Opus 4.6/4.7 做自动化研究的体感: 超参搜索很强,但还不会"换条路想想看"。

137. 对洪乐潼的4小时访谈:AI for Math、把数学变成Lean、数学天书中的证明、直觉、被创造与被发现的

洪乐潼 · Axiom 创始人 & CEO

张小珺对 24 岁 Axiom 创始人洪乐潼的 4 小时长访谈。00 后华人女孩、MIT 摩根奖得主、 斯坦福数学博士辍学、A 轮 16 亿美元。访谈把 AI for Math 的来龙去脉讲透——从 1960s ATP 到 2024 年 DeepMind AlphaProof,再到 2025/12 Axiom 拿下 Putnam 满分 98.93%; 也讲透了洪乐潼的创业心智:蛮力型选手、对苦难上瘾、bet system not model、 把自己定义成 "research scientist intern" 而非 CEO。

Andrej Karpathy: From Vibe Coding to Agentic Engineering

Andrej Karpathy · AI researcher, OpenAI co-founder, ex-Tesla AI

Karpathy 在一场炉边对谈里,从"作为程序员从未如此落后"讲起:December 是 agentic 编码工作流真正开始 work 的拐点。他串起 Software 3.0(编程变成 prompting)、可验证性如何造就"锯齿状"智能、vibe coding 与 agentic engineering 的分野,以及人类仍独一无二负责的"理解"。

138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权

罗福莉 · 小米大模型负责人

小米大模型负责人罗福莉的 3.5 小时深度对谈:从春节凌晨 2 点 OpenClaw 觉醒,到 MiMo V2 系列 (Pro / Omni / TTS) 的"悄无声息伏击",再到 Agent 时代后训练算力 1:1、组织扁平化、AGI 两年内可期。 当下范式已从 Chat 切到 Agent —— 1T 基座 + 后训练敏捷性是新的入场券。

134. 【数据的综述】和谢晨聊,新时代的石油、历史、版图、数据金字塔、定价与Recipe

谢晨 Steve · 光轮智能创始人 & CEO

张小珺《商业访谈录》第 134 期:和光轮智能 CEO 谢晨把 AI 的"数据"这架马车 做成一次产业综述。从数据 = 教育的第一性类比,到朱玉可提出的数据金字塔 (真机 / 仿真 / 人类第一人称视频),再到为什么特斯拉模式在具身不成立、 BEHAVIOR Challenge 的 26%、为什么"先失败再成功的数据最贵",一直到终局: 一家 AI 教育公司,提供环境让模型自己修炼内功。

Skill Issue: Andrej Karpathy on Code Agents, AutoResearch, and the Loopy Era of AI

Andrej Karpathy · Eureka Labs 创始人 · 前 Tesla AI 总监 · OpenAI 创始成员

Andrej Karpathy 做客 No Priors,描述他这几个月每天 16 小时"对 agents 表达意图"的真实状态: 编程不再是写代码,瓶颈从算力变成了人自己,做不成事往往是 skill issue 而非 capability issue。 对谈延伸到 AutoResearch、家庭智能体 Dobby、软件退化成 API endpoints、模型的锯齿状智能与物种化、 Folding@home 式的开放研究,以及"把如何解释编码进 agent"的新教育形态。

State of AI in 2026: LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI | Lex Fridman Podcast #490

Sebastian Raschka, Nathan Lambert · 《Build a Large Language Model (From Scratch)》作者 + AI2 研究员 / RLHF 书作者

Lex Fridman 请来两位"一线做过模型、也写过书"的研究者做 2026 年初的 AI state-of-the-art 盘点: Sebastian Raschka 从 GPT-2 一路手撕到 Qwen3 / Gemma 3, 最擅长从架构里读故事;Nathan Lambert 是 AI2 研究员、RLHF 书作者、atom 项目 发起人,frontier 与 open-source 两边都站过。两人聊了 DeepSeek 时刻、Opus 4.5 神话、RLVR 的"假 aha"、scaling 的三个轴、AI 2027 的时间线推后、Anthropic $1.5B 和解、CUDA 的真护城河、atom project,一直到 100 年后世界的样子。

Terence Tao – How the world's top mathematician uses AI

Terence Tao · UCLA mathematician, Fields Medalist

当世最强的数学家谈他亲手用过 AI 之后的判断:想法生成的成本几乎归零, 但瓶颈搬到了 verification 这一侧;50 道 Erdős 问题被 AI 攻克之后随即陷入瓶颈; AI 像在黑暗中乱跳的机器人,能跨过低墙、爬不上悬崖;breadth × depth 才是 数学的下一步——但要先重设整个学术工作流。

Andrej Karpathy — "We're summoning ghosts, not building animals"

Andrej Karpathy · AI 研究者,曾领导 Tesla 自动驾驶、OpenAI 创始成员

Andrej Karpathy 在 Dwarkesh Podcast 的长访谈。他给出一份冷静的"祛魅":这是 智能体的十年而非元年;我们造的不是动物而是"幽灵"——通过模仿互联网而来的数字 实体。他剖析了 RL 的根本缺陷("用吸管吸取监督信号")、模型坍缩、自动驾驶式的 "九分进军",以及他为何离开前沿实验室转去做教育。

Elon Musk – "In 36 months, the cheapest place to put AI will be space"

Elon Musk · CEO of Tesla, SpaceX, xAI

Elon Musk 与 Dwarkesh Patel 长达 3 小时的深度对谈,涵盖太空 AI 数据中心(36 个月内最经济)、 Starship 每小时一次发射、月球质量驱动器、Terafab 自建芯片厂、Optimus 机器人的递归指数增长、 中美制造业竞争,以及 xAI "understand the universe" 使命与 AI 安全。

Dario Amodei — "We are near the end of the exponential"

Dario Amodei · Anthropic CEO

Anthropic CEO Dario Amodei 三年后再度做客 Dwarkesh Podcast,深度解析他为何认为 我们正接近 AI 指数增长的终点。从 2017 年的 Big Blob of Compute 假说到 country of geniuses in a data center 的 1-3 年预测,从 Anthropic 10x 年增长到算力采购的 生死赌局,从 AI 宪法的三层治理到独裁体制道德过时论。

Dario Amodei: Anthropic CEO on Claude, AGI & the Future of Humans & AI

Dario Amodei, Amanda Askell, Chris Olah · Anthropic CEO + Character lead + Interpretability co-founder

Lex Fridman 与 Anthropic 的三位核心人物同场对谈: CEO Dario Amodei 讲 scaling 假设、RSP 的 if-then 结构、"race to the top" 战略与 Machines of Loving Grace; character lead Amanda Askell 讲 Claude 的性格工程、sycophancy 与最优失败率; interpretability 共同创始人 Chris Olah 讲 features、circuits、superposition 和那个著名的 deception feature。三人从战略、产品、研究三个层面拼出 Anthropic 对 "AI inside" 的完整 stereo view。

Michael Nielsen – Why aliens will have a different tech stack than us

Michael Nielsen · Research fellow, writer, quantum computing pioneer

Michael Nielsen and Dwarkesh Patel explore how scientific progress actually happens — from the messy reality of falsification to hostile verification loops that mislead for decades. They discuss why the tech tree is far vaster than we realize, why alien civilizations would develop radically different technologies, and what this means for AI-accelerated science.

139. 【Agent的综述】和苏煜聊Agent技术史、OpenClaw Moment、边界的消弭和社会的辐射

苏煜 · 俄亥俄州立大学计算机系教授 / NeoCognition 创始人 / 2025 斯隆研究奖得主

张小珺商业访谈录 #139 期:和俄亥俄州立大学教授、NeoCognition 创始人苏煜做的一次 Agent 技术综述。 从 Logical Agent (1960s-90s) → Neural Agent → Semantic Parsing → Language Agent 的演进史出发, 讨论了 OpenClaw Moment 与 ChatGPT Moment 的相似性、universal digital agent 的目标、 中美科技辐射的不同 pattern,以及 2026 年 Agent 的瓶颈和大厂们的赌注。

Moonlake: Interactive, Multimodal World Models — with Chris Manning and Fan-yun Sun

Chris Manning · Fan-yun Sun · Stanford NLP 教父 · Moonlake 联合负责人 + ex-NVIDIA Research / Moonlake co-founder

Latent Space 与 Moonlake 两位负责人 Chris Manning 与 Fan-yun Sun 的对谈。Moonlake 押的是另一条 world model 路线: 不是更大的视频生成器, 而是 symbolic 推理 + 神经渲染。 Chris 给出唯一的硬定义 — "you only actually have a world model if you can predict, given some action is taken, what is going to change" — 然后顺势公开和 Yann LeCun 撕: "Yann has never appreciated the power of language." Sun 反驳"反 bitter lesson" 的标签, 真正的问题是"what is the right abstraction level today"。Moonlake 内部其实是 两个模型: 推理模型管 causality / persistency, 而 Rie 这个 diffusion model 负责 photorealism — 他们已经把它当作 DLSS 的下一代来卖, "skins for worlds"。

Training Transformers to solve 95% failure rate of Cancer Trials — Ron Alfa & Daniel Bear, Noetik

Ron Alfa & Daniel Bear · Noetik 联合创始人 · 用 AI 把 95% 失败的癌症试验变成 matching problem

Latent Space 与 Noetik 创始人 Ron Alfa、Daniel Bear 的对谈。Ron 的核心 论点:95% 的癌症临床试验会失败,但许多"失败"的药其实有效——只是没匹配 到对的病人。Noetik 用近两年时间只在收数据 (thousands of human tumors, hundreds of millions of images), 训练一个自监督的 "virtual cell" 模型, 并发布 TARIO-2——一个 autoregressive transformer, 从每个病人都已经有的 H&E 切片预测 ~19,000 个基因的空间表达。GSK 已经签了 $50M 软件授权: 不是买药, 是买平台。

How GPT, Claude, and Gemini are actually trained and served – Reiner Pope

Reiner Pope · MatX CEO, ex-Google TPU

Reiner Pope(MatX CEO)在 Dwarkesh 的黑板课式访谈里,从几条 roofline 方程一路推到: 最优 batch size = 300 × sparsity、20ms 的"火车"调度、MoE 必须挤进一个 rack、 Ilya 为什么说 pipelining 不智、RL 时代模型被过度训练 100 倍、Gemini API 价格如何 泄露 ~2KB/token 的 KV cache 大小,以及神经网络和密码学之间的对偶关系。

Mistral: Voxtral TTS, Forge, Leanstral, & Mistral 4 — w/ Pavan Kumar Reddy & Guillaume Lample

Pavan Kumar Reddy & Guillaume Lample · Mistral · Audio Research Lead 与 Chief Scientist

Mistral 同一周内同时发了 Voxtral TTS、Forge 平台、Leanstral 形式化模型和新的 Mistral Small——这期 Latent Space 让 Pavan Kumar Reddy 和 Guillaume Lample 一次性把这些 发布背后的工程选择讲清楚。Voxtral TTS 是 3B 模型 + 自研 12.5 Hz 神经音频 codec + auto-regressive flow matching head——为了实时流式而不是 SOTA quality 选 AR 路线。 Forge 是把 Mistral 科学团队用了 2 年的 infra 直接给客户:fine-tune 后能"10x cheaper", 并在某些客户项目把一种语言从 0~1% 训到 50% 的 mix。Leanstral 看似是数学家工具, 实际是赌 long-horizon reasoning 的 transfer——Lean 的编译器是天然不可 reward-hack 的判官。最后透露下一代 RL infra 是为"6 hours to get a reward"的 trajectory 设计的。

How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI

Alex Lupsasca · OpenAI for Science · 黑洞理论物理学家 · 2024 New Horizons in Fundamental Physics Prize

Alex Lupsasca 是 2024 年 New Horizons in Fundamental Physics Breakthrough Prize(被称为 "Oscar for physics")的得主, 一位黑洞理论物理学家。他追踪 LLM 在科学前沿的能力已经 一年半。GPT-5 发布时 Twitter 反响 "lukewarm" — 但在他的领域, 模型在 30 分钟内复现 了他自己花了很长时间才做出来的好论文。Mark Chen 教了他一个 "priming" 技巧 (先解一道 textbook warmup), GPT-5 就能解决一篇 training-cutoff 之后才发布的论文。 之后, 他和 PhD 导师 Strominger 把一个 32 项之和、卡了一年的 single-minus gluon tree amplitude 问题给了 ChatGPT — 模型在 Strominger 的飞机降落之前就解决了, 还用 作者们都不知道的技巧给出了证明。第二个实验把题目换成 graviton, 模型在一天内吐出 110 页全新的量子引力, 团队用三周验证。这就是 "vibe physics"。

133. 对谢赛宁的7小时马拉松访谈:世界模型、逃出硅谷、AMI Labs、两次拒绝Ilya、杨立昆、李飞飞和42

谢赛宁 (Saining Xie) · NYU 助理教授 · AMI Labs 联合创始人

谢赛宁的第一次播客访谈,7 小时马拉松对谈, 覆盖 SJTU ACM Class、UCSD 屠卓文、FAIR 何恺明、NYU 李飞飞, 到 2024 年和 Yann LeCun 共同创立 AMI Labs 的全过程。 贯穿主线:representation learning 是 12 年都没解决的核心问题, LLM 是 virtual intelligence,world model 才是真问题。