PodDeck
← 全部源头

Latent Space

AI Engineer 生态播客,覆盖 agents、AI coding、模型基础设施与开发者工具

9 集已生成 · 9 集收录

已生成

From Consumer Toys for Pets to War Drone — Yaroslav Azhnyuk, The Fourth Law & Noah Smith, Noahpinion Latent Space
≈ 90 min

From Consumer Toys for Pets to War Drone — Yaroslav Azhnyuk, The Fourth Law & Noah Smith, Noahpinion

Yaroslav Azhnyuk · Noah Smith · The Fourth Law / Odd Systems — founder · Noahpinion — writer

Yaroslav Azhnyuk built Pet Cube in San Francisco — "cameras that fling treats to pets" — and then, after Russia's invasion landed on the last flight into Kyiv on Feb 23, 2022, pivoted to building drone autonomy, thermal cameras, and FPV strike drones for the Ukrainian armed forces. With Noah Smith and Latent Space's Brandon, he walks through five levels of drone autonomy, eight dimensions of the autonomous battlefield, why FPVs replaced artillery as "the god of war" (~80% of frontline casualties), and the disquieting arithmetic of China's drone manufacturing scale (4M Ukrainian FPVs/year vs ~4B Chinese capacity).

The $15B Physical AI Company: Simulation, Autonomy OS, Neural Sim, & 1K Engineers—Applied Intuition Latent Space
≈ 70 min

The $15B Physical AI Company: Simulation, Autonomy OS, Neural Sim, & 1K Engineers—Applied Intuition

Qasar Younis & Peter Ludwig · Co-founders of Applied Intuition (CEO / CTO)

Applied Intuition 给汽车 / 卡车 / 矿车 / 农机 / 防务平台卖"让物理机器变聪明"的技术栈, 18/20 OEM 是它客户, 估值 $15B, 1000 名工程师, 现在在日本跑 L4 无人卡车. 这期把它的三个 bucket (仿真 + 操作系统 + 自动驾驶模型) 全部摊开讲, 还顺手把 "vehicles like pre-Android phones" 这条 类比、neural sim = Gaussian splatting + diffusion、onboard 才是物理 AI 真正瓶颈 这些反直觉点都串了起来.

Inside Abridge: The AI Listening to 100 Million Doctor Visits — Abridge's Janie Lee & Chai Asawa

Janie Lee & Chai Asawa · Abridge — Head of Product / Clinical Decision Support

Latent Space × Supervised Learning crossover with Janie Lee and Chai Asawa from Abridge, the AI clinical-intelligence layer with a dataset on the order of 100M medical conversations. Deep on the "air conditioning" design philosophy, the constellation-of-models architecture behind real-time in-visit guidance, why HIPAA-grade de-identification is one-way, and the hot take that PRDs are very much not dead.

Notion's Sarah Sachs & Simon Last on Custom Agents, Evals, and the Future of Work Latent Space
≈ 84 min

Notion's Sarah Sachs & Simon Last on Custom Agents, Evals, and the Future of Work

Sarah Sachs · Simon Last · Notion — engineering manager (core AI capabilities & infra) · co-founder

Notion 把 agent 重写了 5 次,从 2022 年末 GPT-4 时代试图后台跑 assistant 一直撞到今天的 100+ tools custom agent. Sarah (engineering manager) 和 Simon (co-founder) 用 84 分钟 把"为什么这么慢"和"现在为什么终于行了"都摊开讲: progressive disclosure、SQL-light queries、 notion's last exam(主动留 30% 通过率)、为什么是 credits 而不是 tokens、为什么 manager agent 是 对 70 条通知的解、以及为什么"replacing processes"比"replacing people"更准确.

Moonlake: Interactive, Multimodal World Models — with Chris Manning and Fan-yun Sun

Chris Manning · Fan-yun Sun · Stanford NLP 教父 · Moonlake 联合负责人 + ex-NVIDIA Research / Moonlake co-founder

Latent Space 与 Moonlake 两位负责人 Chris Manning 与 Fan-yun Sun 的对谈。Moonlake 押的是另一条 world model 路线: 不是更大的视频生成器, 而是 symbolic 推理 + 神经渲染。 Chris 给出唯一的硬定义 — "you only actually have a world model if you can predict, given some action is taken, what is going to change" — 然后顺势公开和 Yann LeCun 撕: "Yann has never appreciated the power of language." Sun 反驳"反 bitter lesson" 的标签, 真正的问题是"what is the right abstraction level today"。Moonlake 内部其实是 两个模型: 推理模型管 causality / persistency, 而 Rie 这个 diffusion model 负责 photorealism — 他们已经把它当作 DLSS 的下一代来卖, "skins for worlds"。

Training Transformers to solve 95% failure rate of Cancer Trials — Ron Alfa & Daniel Bear, Noetik

Ron Alfa & Daniel Bear · Noetik 联合创始人 · 用 AI 把 95% 失败的癌症试验变成 matching problem

Latent Space 与 Noetik 创始人 Ron Alfa、Daniel Bear 的对谈。Ron 的核心 论点:95% 的癌症临床试验会失败,但许多"失败"的药其实有效——只是没匹配 到对的病人。Noetik 用近两年时间只在收数据 (thousands of human tumors, hundreds of millions of images), 训练一个自监督的 "virtual cell" 模型, 并发布 TARIO-2——一个 autoregressive transformer, 从每个病人都已经有的 H&E 切片预测 ~19,000 个基因的空间表达。GSK 已经签了 $50M 软件授权: 不是买药, 是买平台。

Mistral: Voxtral TTS, Forge, Leanstral, & Mistral 4 — w/ Pavan Kumar Reddy & Guillaume Lample

Pavan Kumar Reddy & Guillaume Lample · Mistral · Audio Research Lead 与 Chief Scientist

Mistral 同一周内同时发了 Voxtral TTS、Forge 平台、Leanstral 形式化模型和新的 Mistral Small——这期 Latent Space 让 Pavan Kumar Reddy 和 Guillaume Lample 一次性把这些 发布背后的工程选择讲清楚。Voxtral TTS 是 3B 模型 + 自研 12.5 Hz 神经音频 codec + auto-regressive flow matching head——为了实时流式而不是 SOTA quality 选 AR 路线。 Forge 是把 Mistral 科学团队用了 2 年的 infra 直接给客户:fine-tune 后能"10x cheaper", 并在某些客户项目把一种语言从 0~1% 训到 50% 的 mix。Leanstral 看似是数学家工具, 实际是赌 long-horizon reasoning 的 transfer——Lean 的编译器是天然不可 reward-hack 的判官。最后透露下一代 RL infra 是为"6 hours to get a reward"的 trajectory 设计的。

How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI

Alex Lupsasca · OpenAI for Science · 黑洞理论物理学家 · 2024 New Horizons in Fundamental Physics Prize

Alex Lupsasca 是 2024 年 New Horizons in Fundamental Physics Breakthrough Prize(被称为 "Oscar for physics")的得主, 一位黑洞理论物理学家。他追踪 LLM 在科学前沿的能力已经 一年半。GPT-5 发布时 Twitter 反响 "lukewarm" — 但在他的领域, 模型在 30 分钟内复现 了他自己花了很长时间才做出来的好论文。Mark Chen 教了他一个 "priming" 技巧 (先解一道 textbook warmup), GPT-5 就能解决一篇 training-cutoff 之后才发布的论文。 之后, 他和 PhD 导师 Strominger 把一个 32 项之和、卡了一年的 single-minus gluon tree amplitude 问题给了 ChatGPT — 模型在 Strominger 的飞机降落之前就解决了, 还用 作者们都不知道的技巧给出了证明。第二个实验把题目换成 graviton, 模型在一天内吐出 110 页全新的量子引力, 团队用三周验证。这就是 "vibe physics"。

Extreme Harness Engineering: 1M LOC, 1B toks/day, 0% human code or review Latent Space
≈ 1h 12 min

Extreme Harness Engineering: 1M LOC, 1B toks/day, 0% human code or review

Ryan Lopopolo · OpenAI Frontier Product Exploration · engineer

Ryan Lopopolo 在 OpenAI Frontier 用一个 "out there" 的约束做了 5 个月的实验: 3 个工程师, 1M LOC, 1500 PRs, 他自己一行代码都不写. 这一小时他把这套打法所有的 ratchets 全摊开: 一分钟构建、$land 自动合并、Ghost Libraries、Symphony 用 Elixir、end of bullshit plugins、 对 MCP 的 bearish 判断, 以及一句话哲学: "you can just codex things".