PodDeck
← 全部标签
标签

#technical

62 集相关 · 62 集已生成

已生成

xAI 内部:3 个月做出 Grok Imagine、视频生成、世界模型与视频 Agent

Ethan He · ex-xAI Grok Imagine / ex-Nvidia Cosmos researcher

Ethan He 在 xAI 从 0 infra / 0 data / 0 model 起步,3 个月内带几个工程师交付了 Grok Imagine 0.9(首个大规模部署的 audio-video joint generation 模型)。这期访谈把 视频模型的全链路拆开讲: synthetic text-video pair、VAE tokenizer、temporal vs frame-by-frame 压缩、step distillation、长视频的 context 管理。他给 world model 下了一个 三支柱定义 (real time + interactive + long horizon),并提出一个"big claim" —— 现在视觉模型的进步主要来自语言模型,而不是视频模型本身——这也是他刚离开 xAI 想回到 语言模型 / context-aware agent 方向的原因。

AI Is Fast. AI Projects Are Slow. Let's Fix That.

Rocket Ride 联合创始人 · Rocket Ride 联合创始团队 — 开源框架 2026-03-04 发布,捐给 Linux Foundation (AIF);前身做 data discovery & preparation,处理过 1.5 billion files 级 RAG

Rocket Ride 两位联合创始人讨论 "coding 不再是瓶颈" 之后的新工作 —— intentionality / tool discovery / quality 才是新岗位;为什么 Claude 在增量工程上偷懒、容易写出 "spaghetti code that's not worth shipping"; Rocket Ride 怎么把 AI 应用拆成 node + 五条 lane,让 Claude 用一句英文拼出 45 节点的 pipeline; 以及一个 12+9 小时的 Crew AI 同步噩梦 (dog/cat/elephant) 如何揭出 "plumbing 才是大坑";最后讨论 $25k AWS 账单背后的 cost observability 和 model server 聚合 (一张 "big-ass GPU" 服务 100 个客户)。

当机器人学会开可乐:深聊灵巧手的"不可能三角"与六大技术门派|机器人特辑

TetherIA 团队 · 特斯拉前灵巧手负责人创业团队 / Aero Hand Open 作者

硅谷101 机器人特辑第一期。结论很反直觉:在机器人世界里,开可乐比走路难十倍——控制灵巧手要比控制躯体难上至少十倍。从 Unitree G1($16k 整机)到 Shadow Robot($100k+ 一只手)的价格落差出发,节目走访了 TetherIA(特斯拉前灵巧手负责人的创业团队),梳理了灵巧手 40 年技术演进、"性能/成本/可靠性"不可能三角、六大门派路线对比(直驱 / 绳驱 / 液压 / 连杆 / 混合 / 开源),并实测了抓 5mm 螺丝钉、大盒子、可乐瓶、桌面 iPhone 四个 demo。TetherIA Aero Hand Open 用 $300 开源策略试图复刻"Android 之于手机"对垄断市场的颠覆。

拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶|机器人特辑

王闯 等业内人士 · 机器人本体 / 关节 / 激光雷达 等领域受访嘉宾

硅谷101 陈茜对话多位机器人本体业内人士,把人形机器人拆成骨架、关节、传感器、电气计算四大系统逐一讲透。 从空翻时几十个 g 的冲击、减速器的"不可能三角"、电机能效 3% 与 5% 的鸿沟, 到前特斯拉 AI 硬件负责人复盘 Optimus 单芯片改双芯片的反复,再到供应链从"求着别人"到"滚雪球"的转折。

专访前FAIR研究总监田渊栋:Meta裁员之后,对AI的一些遗憾与思考

田渊栋 · 前 Meta FAIR 研究总监 · AI 科学家

田渊栋在 Meta 10 月 600 人 AI 裁员风波中被裁,被裁前已有 offer。在这场访谈里,他坦诚谈了对 LLM 路线、Scaling Law、RL 与 SFT、AI 人才市场的判断,回顾了在 FAIR 十年最大的收获——research taste,并谈到他想成为"超级研究员"的下一步设想。

再访田渊栋:46.5亿美金估值的RSI,与AI自进化|Neolabs特辑【101视频播客】

田渊栋 · RSI 联合创始人 · 前 Meta FAIR 研究总监

田渊栋离开 Meta FAIR 半年后,与 Richard Socher、熊蔡明、Tim Rocktäschel 等 7 位顶级研究员一起创立 Recursive Superintelligence(RSI),6.5 亿美元融资、46.5 亿美元估值。 这一期他第一次系统讲述了 RSI 的技术路线:用 AI 优化 AI(左脚踩右脚),把 auto research 作为商业化第一步,以及他认为现在 AI 能力大约在"满分 10 分的 0.5 分"。 对话还覆盖了 NeoLab 全景、coding 之后的下一波、大厂蒸馏员工的"吸星大法"、以及"水越来越少,鱼必须变成四维生物"的就业大趋势。

MCP, Agents & the $40M Bet on Multiplayer AI

Dust Co-founder · Dust 联合创始人 — 前 Stripe(早期收购加入,亲历 150→3000 人)、前 OpenAI

Dust 联合创始人讨论"单人 AI → 多人 AI"的产品边界:为什么 Claude Code / Codex 仍然本质上是单人模式(任务时长仍是半天,模型能力是 jagged 的), 以及他们的回答 —— Pod:一个把多代理、多人类、GCS-FUSE 共享文件系统封装在一起的工作单元。还讨论了 Stripe 早期的 flocking 算法机制、fog of AI 下的对齐难题、 tokconomics 的终局(commoditization)与过渡期(需求挤压维持高价)、为什么 flat pricing 死了、以及 stateful sandbox + SQLite 作为 SaaS 的可能替代。

揭秘数采工厂:稀缺的机器人数据,到底难在哪儿?|机器人特辑

陈茜 · 智元 / 觅蜂 / Sharpa 受访人 · 硅谷101 主持人 + 机器人公司数据负责人

硅谷101 飞到上海智元机器人数采工厂,亲手试了一把"遥操作采集员",并和觅蜂、Sharpa 等机器人公司聊清楚了一件事:机器人没有 LLM 那种"吃掉互联网"的福利 —— 每一条高质量数据都必须从零生产。 这一期把四层数据金字塔(遥操 / 仿真 / 动捕 / 视频)的优势、上限、代价讲透了,并给出了一个非常具体的"黄金配方" —— 遥操在数据池里大约只占万分之一,但决定模型能不能落地。

Devin 的 80% 时刻:背景 Agent、7x PR 与手把手编码的终结

Walden Yan · Cole Murray · Cognition co-founder/CPO · OpenInspect creator

Latent Space 把 Cognition 的 Walden Yan 和 OpenInspect 作者 Cole Murray 拉到一起聊"背景 agent"这一架构的成熟。 Devin 自己 repo 上的 commit 占比 3 个月内从 16% 涨到 80%,merged PR 涨 7×,工程团队只涨 10%。 这场对谈把背景 agent 落地需要解决的所有硬件、网络、testing、memory、Slack 集成等具体工程问题摊开。

架构现代 AI 系统:平台、Agent 与集成 | MLOps Community Panel

Frederique · Shao · Allan · 应用研究(MIA) · 企业 AI(Bell Canada) · 主权云(Buzz HPC)

三位来自不同位置的从业者——MIA 的应用研究者 Frederique、Bell Canada 的企业 AI 负责人 Shao、加拿大主权 GPU 云 Buzz HPC 的 Allan——围绕一场心理健康 AI 黑客松展开圆桌:从平台该提供什么、Codex/Claude Code/Cursor 这些"Pokemon 名字"工具其实可以替换底层模型,到从 API key 蜜月期走向自托管开源模型的 tokenomics 觉醒;从 GPU 硬件通胀(Michael Burry 错了,A100 七年仍涨价)到 Blackwell vs Ampere 的 VRAM 取舍;从 80% → 95% 的死亡幽谷、LLM-as-judge 的踢皮球,到 RL gyms、verifiable rewards、Lean 攻陷 Erdős;最后落到 constrained generation 为什么是闭源 API 永远不开的杀器、为什么 Deep Research 能远超 Claude Code、以及"agent 给 Jira 付了 10,000 次款"背后的治理真问题。

Making DeepSeek v4 outperform Opus 4.7 with Taste — Ahmad Awais, CommandCode.ai

Ahmad Awais · Founder, CommandCode.ai

Ahmad Awais 解释为什么 DeepSeek V4 在编码 agent 里"很慢、很笨"——不是模型不够强, 而是它发出错的 tool call 后听不进 Zod error,平均会原样重发 56 次。 他们写了 3,200 行确定性 repair logic(现在 16,000 条 variation,覆盖 600 亿 tokens), 让 DeepSeek/Kimi/MiniMax 在 Command Code 里跑出接近 Opus 的体验,并把同一思路推广到 设计 slop 和安全代码。第二条产品线 Taste 自动学习你的微决策、存成 git 里的 markdown, 让便宜模型借用贵模型沉淀下来的判断力。

140. 对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去

姚顺宇 · 研究科学家 · 前 Anthropic · 现 Google DeepMind (Gemini)

张小珺·语言即世界 EP.140,对姚顺宇的 4 小时访谈节选。姚顺宇博士毕业于斯坦福 理论高能物理,2024 年半道出家加入 Anthropic 参与 Claude 3.7、4.5 的强化学习训练; 2025 年 10 月跳槽到 Google DeepMind 做 Gemini 的 ML coding / long horizon。 这期把两家 lab 的打法、coding bet 的内部信号、AI safety 的"幼稚"自我说服、 以及"个人英雄主义时代已经过去了"等小疯言论摊开讲清楚。

人类会被困在1nm吗?深度解析光刻机与芯片制程的未来【深度】

庞博士 / Evan Tao / Marc Hijink · SPIE Fellow / 前 ASML 机械工程师 / ASML 传记作者

硅谷101 用瑞利判据 CD = K₁·λ/NA 为骨架,把 EUV 光源、蔡司透镜、High-NA / Hyper-NA、计算光刻 OPC / ILT、芯片命名"骗局"、纳米压印、以及 ASML 与美国政府的政治经济史串成一条主线。 访谈了 SPIE Fellow 庞博士(ILT 曲线掩膜贡献者)、ASML 前机械工程师 Evan Tao、ASML 传记作者 Marc Hijink。核心判断:光刻机硬件未来 10-25 年不会大变,真正的突破来自 GPU 加持的 AI 算法。

重建AlphaGo教会我们的自博弈、RL与LLM未来 - Eric Jang

Eric Jang · ex-VP AI @ 1X · ex-Google DeepMind Robotics

Eric Jang 在 sabbatical 期间用大约 10K 美元 + Claude Code 重新实现了 AlphaGo, 在和 Dwarkesh 的对谈里把 MCTS 拆到底——为什么它不是 credit assignment、 为什么它比当下 LLM RL 优雅得多、以及 10 层网络居然能把一个看似 intractable 的搜索问题塞进一次 forward pass。后半段是用 Opus 4.6/4.7 做自动化研究的体感: 超参搜索很强,但还不会"换条路想想看"。

139. 【Agent的综述】和苏煜聊Agent技术史、OpenClaw Moment、边界的消弭和社会的辐射

苏煜 · 俄亥俄州立大学计算机系教授 / NeoCognition 创始人 / 2025 斯隆研究奖得主

张小珺商业访谈录 #139 期:和俄亥俄州立大学教授、NeoCognition 创始人苏煜做的一次 Agent 技术综述。 从 Logical Agent (1960s-90s) → Neural Agent → Semantic Parsing → Language Agent 的演进史出发, 讨论了 OpenClaw Moment 与 ChatGPT Moment 的相似性、universal digital agent 的目标、 中美科技辐射的不同 pattern,以及 2026 年 Agent 的瓶颈和大厂们的赌注。

FFmpeg: The Incredible Technology Behind Video on the Internet | Lex Fridman Podcast #496

Jean-Baptiste Kempf & Kieran Kunhya · President of VideoLAN (VLC) & FFmpeg core contributor

Jean-Baptiste Kempf (VLC) and Kieran Kunhya (FFmpeg) take Lex through the invisible plumbing of internet video — what happens between "press play" and "see pixels," why every video codec generation is roughly 30% better and 10–100× more expensive, and why dav1d ships 240,000 hand-written lines of assembly. The conversation also covers the École Centrale origin story of VLC, the Google AI security debacle and Microsoft Teams SLA episode, two intelligence-agency backdoor requests JB refused, a death threat over dropping the PowerPC port, the CIA's Vault 7 fake-VLC build, the codec patent minefield, and JB's new ultra-low-latency project Kyber (4 ms glass-to-glass for remote robotics).

Fixing GPU Starvation in Large-Scale Distributed Training

Kashish · Uber · ML Infra · Marketplace Matching Lead

Kashish (Uber ML infra, ex-Google YouTube Ads) walks Demetrios through a Sherlock-Holmes-grade Petastorm bug—GPU cluster stuck at 15-20% utilization, six debugging steps, two layers of bottleneck, and finally a "double bottleneck" reveal: PyArrow→NumPy translation was silently eating the headroom. Plus serving's latency-vs-utilization war, the reproducibility cost of parallelism, and a live diagnosis of a friend's slow DGX Spark.

137. 对洪乐潼的4小时访谈:AI for Math、把数学变成Lean、数学天书中的证明、直觉、被创造与被发现的

洪乐潼 · Axiom 创始人 & CEO

张小珺对 24 岁 Axiom 创始人洪乐潼的 4 小时长访谈。00 后华人女孩、MIT 摩根奖得主、 斯坦福数学博士辍学、A 轮 16 亿美元。访谈把 AI for Math 的来龙去脉讲透——从 1960s ATP 到 2024 年 DeepMind AlphaProof,再到 2025/12 Axiom 拿下 Putnam 满分 98.93%; 也讲透了洪乐潼的创业心智:蛮力型选手、对苦难上瘾、bet system not model、 把自己定义成 "research scientist intern" 而非 CEO。

Andrej Karpathy: From Vibe Coding to Agentic Engineering

Andrej Karpathy · AI researcher, OpenAI co-founder, ex-Tesla AI

Karpathy 在一场炉边对谈里,从"作为程序员从未如此落后"讲起:December 是 agentic 编码工作流真正开始 work 的拐点。他串起 Software 3.0(编程变成 prompting)、可验证性如何造就"锯齿状"智能、vibe coding 与 agentic engineering 的分野,以及人类仍独一无二负责的"理解"。

Notion's Sarah Sachs & Simon Last on Custom Agents, Evals, and the Future of Work Latent Space
≈ 84 min

Notion's Sarah Sachs & Simon Last on Custom Agents, Evals, and the Future of Work

Sarah Sachs · Simon Last · Notion — engineering manager (core AI capabilities & infra) · co-founder

Notion 把 agent 重写了 5 次,从 2022 年末 GPT-4 时代试图后台跑 assistant 一直撞到今天的 100+ tools custom agent. Sarah (engineering manager) 和 Simon (co-founder) 用 84 分钟 把"为什么这么慢"和"现在为什么终于行了"都摊开讲: progressive disclosure、SQL-light queries、 notion's last exam(主动留 30% 通过率)、为什么是 credits 而不是 tokens、为什么 manager agent 是 对 70 条通知的解、以及为什么"replacing processes"比"replacing people"更准确.

AI时代如何交付硬件产品 | Caitlin Kalinowski(Apple、Meta、OpenAI)

Caitlin Kalinowski · 硬件领袖 — 前Apple(MacBook Pro/Air),前Meta(Quest、Rift、Orion AR),前OpenAI(机器人部门)

Caitlin Kalinowski曾在三家传奇公司交付旗舰硬件——Apple的初代一体式MacBook Pro和MacBook Air、Meta的Quest/Rift/Orion AR项目,以及最近因"战争部门"协议公开辞职的OpenAI机器人部门。她与Lenny深入探讨了为什么硬件与软件有根本性的不同("我们只能编译四五次——一辈子就这些"),被外包25年的5层供应链结构,Palmer Luckey的无人机vs航母论述,决定机器人安全性的冲量方程,即将冲击每家物理AI创业公司的"内存价格陨石",以及她从Apple到Meta再到OpenAI一路带着的四条硬件设计原则。

从宠物消费玩具到战争无人机 — Yaroslav Azhnyuk(The Fourth Law)与 Noah Smith(Noahpinion) Latent Space
≈ 90 min

从宠物消费玩具到战争无人机 — Yaroslav Azhnyuk(The Fourth Law)与 Noah Smith(Noahpinion)

Yaroslav Azhnyuk · Noah Smith · The Fourth Law / Odd Systems创始人 · Noahpinion作者

Yaroslav Azhnyuk在旧金山创立了Pet Cube——"向宠物投射零食的摄像头"——然后,在俄罗斯入侵的前夜搭上飞往基辅的最后一班飞机(2022年2月23日),转型投身无人机自主系统、热成像摄像头和FPV攻击无人机的研发,服务于乌克兰武装力量。他与Noah Smith和Latent Space的Brandon共同梳理了无人机自主性五级体系、自主战场的八个维度、FPV如何取代炮兵成为"战争之神"(约80%的前线伤亡),以及中国无人机制造规模令人不安的数字(乌克兰年产400万架FPV,中国产能约40亿架)。

138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权

罗福莉 · 小米大模型负责人

小米大模型负责人罗福莉的 3.5 小时深度对谈:从春节凌晨 2 点 OpenClaw 觉醒,到 MiMo V2 系列 (Pro / Omni / TTS) 的"悄无声息伏击",再到 Agent 时代后训练算力 1:1、组织扁平化、AGI 两年内可期。 当下范式已从 Chat 切到 Agent —— 1T 基座 + 后训练敏捷性是新的入场券。

Getting Humans Out of the Way: How to Work with Teams of Agents

Rob · Creator of Brumi (open-source multi-agent IDE)

Rob 是开源多 agent IDE Brumi 的作者. 这期他把"如何把人从 loop 里拿出来"的整套手艺摊开讲—— 从让 agent 截图自证 (feature walkthrough doc), 到自定义 lint 规则爆炸, 到 plan.md 替代 plan mode, 到并行 5 个 agent 挑赢家. 核心隐喻只有一句: 教 agent 怎么向上汇报.

The Modern Software Engineer

Mihail Eric · ML / AI infrastructure practitioner & instructor

Mihail Eric 和 Demetrios 在 SF 录音棚里把 AI coding agent 的真实工程问题挨个摊开: junior 被 cursor 截断的训练链, Eno @ Factory 强调的 validation harness, token 计费迟早被 task 计费取代, Twitter 上 "15 个 tiled Claude Code instances" 的并行神话, 团队该变小、PM 该会提 PR, 以及 下一个 superpower 是 articulation. 全程没有 framework, 全是 day-to-day 判断, 最后一句是 "just breathe".

Moonlake: Interactive, Multimodal World Models — with Chris Manning and Fan-yun Sun

Chris Manning · Fan-yun Sun · Stanford NLP 教父 · Moonlake 联合负责人 + ex-NVIDIA Research / Moonlake co-founder

Latent Space 与 Moonlake 两位负责人 Chris Manning 与 Fan-yun Sun 的对谈。Moonlake 押的是另一条 world model 路线: 不是更大的视频生成器, 而是 symbolic 推理 + 神经渲染。 Chris 给出唯一的硬定义 — "you only actually have a world model if you can predict, given some action is taken, what is going to change" — 然后顺势公开和 Yann LeCun 撕: "Yann has never appreciated the power of language." Sun 反驳"反 bitter lesson" 的标签, 真正的问题是"what is the right abstraction level today"。Moonlake 内部其实是 两个模型: 推理模型管 causality / persistency, 而 Rie 这个 diffusion model 负责 photorealism — 他们已经把它当作 DLSS 的下一代来卖, "skins for worlds"。

The $15B Physical AI Company: Simulation, Autonomy OS, Neural Sim, & 1K Engineers—Applied Intuition Latent Space
≈ 70 min

The $15B Physical AI Company: Simulation, Autonomy OS, Neural Sim, & 1K Engineers—Applied Intuition

Qasar Younis & Peter Ludwig · Co-founders of Applied Intuition (CEO / CTO)

Applied Intuition 给汽车 / 卡车 / 矿车 / 农机 / 防务平台卖"让物理机器变聪明"的技术栈, 18/20 OEM 是它客户, 估值 $15B, 1000 名工程师, 现在在日本跑 L4 无人卡车. 这期把它的三个 bucket (仿真 + 操作系统 + 自动驾驶模型) 全部摊开讲, 还顺手把 "vehicles like pre-Android phones" 这条 类比、neural sim = Gaussian splatting + diffusion、onboard 才是物理 AI 真正瓶颈 这些反直觉点都串了起来.

Training Transformers to solve 95% failure rate of Cancer Trials — Ron Alfa & Daniel Bear, Noetik

Ron Alfa & Daniel Bear · Noetik 联合创始人 · 用 AI 把 95% 失败的癌症试验变成 matching problem

Latent Space 与 Noetik 创始人 Ron Alfa、Daniel Bear 的对谈。Ron 的核心 论点:95% 的癌症临床试验会失败,但许多"失败"的药其实有效——只是没匹配 到对的病人。Noetik 用近两年时间只在收数据 (thousands of human tumors, hundreds of millions of images), 训练一个自监督的 "virtual cell" 模型, 并发布 TARIO-2——一个 autoregressive transformer, 从每个病人都已经有的 H&E 切片预测 ~19,000 个基因的空间表达。GSK 已经签了 $50M 软件授权: 不是买药, 是买平台。

走进Abridge:聆听1亿次问诊的AI — Janie Lee 与 Chai Asawa

Janie Lee & Chai Asawa · Abridge——产品负责人/临床决策支持

Latent Space × Supervised Learning联合节目,嘉宾为Abridge的Janie Lee和Chai Asawa。Abridge是一个拥有约1亿次医疗对话数据集的AI临床智能层。深入探讨了"空调"设计哲学、支撑实时就诊中指导的模型星座架构、HIPAA级去标识化为何是单向的,以及PRD绝未死亡这一热门观点。

The Creator of Superpowers: Why Real Agentic Engineering Beats Vibe Coding

Jesse Vincent · Creator of Superpowers (110k stars Claude Code skill kit)

Jesse Vincent —— Perl projects lead 出身、K-9 Mail 的原作者、25 年老兵 —— 把过去九个月驯服 Claude Code 的方法摊开来讲. 110k stars 的 superpowers 不是 vibe coding, 而是一套 orchestrator 架构 + 单使命 subagent 分工 + skill 系统的 agentic engineering 方法论. 这期还覆盖 Claude 删测试事件如何用一行 prompt 修好、为什么 swarm 是 2002 年的 Facebook、 以及 2028 年 GitHub 可能不存代码只存 specs 的预言.

How GPT, Claude, and Gemini are actually trained and served – Reiner Pope

Reiner Pope · MatX CEO, ex-Google TPU

Reiner Pope(MatX CEO)在 Dwarkesh 的黑板课式访谈里,从几条 roofline 方程一路推到: 最优 batch size = 300 × sparsity、20ms 的"火车"调度、MoE 必须挤进一个 rack、 Ilya 为什么说 pipelining 不智、RL 时代模型被过度训练 100 倍、Gemini API 价格如何 泄露 ~2KB/token 的 KV cache 大小,以及神经网络和密码学之间的对偶关系。

Mistral: Voxtral TTS, Forge, Leanstral, & Mistral 4 — w/ Pavan Kumar Reddy & Guillaume Lample

Pavan Kumar Reddy & Guillaume Lample · Mistral · Audio Research Lead 与 Chief Scientist

Mistral 同一周内同时发了 Voxtral TTS、Forge 平台、Leanstral 形式化模型和新的 Mistral Small——这期 Latent Space 让 Pavan Kumar Reddy 和 Guillaume Lample 一次性把这些 发布背后的工程选择讲清楚。Voxtral TTS 是 3B 模型 + 自研 12.5 Hz 神经音频 codec + auto-regressive flow matching head——为了实时流式而不是 SOTA quality 选 AR 路线。 Forge 是把 Mistral 科学团队用了 2 年的 infra 直接给客户:fine-tune 后能"10x cheaper", 并在某些客户项目把一种语言从 0~1% 训到 50% 的 mix。Leanstral 看似是数学家工具, 实际是赌 long-horizon reasoning 的 transfer——Lean 的编译器是天然不可 reward-hack 的判官。最后透露下一代 RL infra 是为"6 hours to get a reward"的 trajectory 设计的。

Physical Intelligence与机器人开源革命:免费大脑背后的四派力量与博弈|机器人特辑

陈茜(主持)/ 柯丽一鸣(PI)· 王昊(自变量)· Jan Liphardt(OpenMind) · 《硅谷101》机器人深度解析 + 三位嘉宾的具身智能访谈片段

《硅谷101》机器人特辑的开源篇——把机器人 VLA 开源生态拆成四股力量:学院派(OpenVLA、Octo)、巨头生态派(NVIDIA GR00T、Google Gemini Robotics)、创业 + 中国力量(小米、蚂蚁、自变量、清华、OpenMind 等),以及独立成派的 Physical Intelligence(π₀)。逐一剖析这些模型的技术路线、开源动机和阵营关系,最后回到那个核心问题:估值 56 亿美元的 PI 为什么要把核心模型免费给世界?以及一个 Stanford 教授父亲对这场开源运动最朴素的回答。

An AI state of the union: We've passed the inflection point & dark factories are coming

Simon Willison · Open-source engineer & Django co-creator

Simon Willison (co-creator of Django, coined "prompt injection") talks with Lenny Rachitsky about the November 2025 inflection point when coding agents crossed a reliability threshold, the dark factory pattern where nobody writes or reads code, and the lethal trifecta of AI security risks.

It's 2026, and We're Still Talking Evals

Maggie Konstanty · ML Engineer · LLM Agent Evaluation Lead

Maggie Konstanty 在 MLOps.community 谈 LLM agent 评估的真实战场——为什么团队总是先发布再补 eval、 为什么 pre-prod 和 production 是"两种动物"、以及为什么所有 vendor 工具都让她最终选择自己造。 整期访谈最反直觉的 takeaway:evals 本身不难,难的是让团队对齐"什么叫好"。

How GPT-5 derived new results in theoretical physics and quantum gravity — Alex Lupsasca, OpenAI

Alex Lupsasca · OpenAI for Science · 黑洞理论物理学家 · 2024 New Horizons in Fundamental Physics Prize

Alex Lupsasca 是 2024 年 New Horizons in Fundamental Physics Breakthrough Prize(被称为 "Oscar for physics")的得主, 一位黑洞理论物理学家。他追踪 LLM 在科学前沿的能力已经 一年半。GPT-5 发布时 Twitter 反响 "lukewarm" — 但在他的领域, 模型在 30 分钟内复现 了他自己花了很长时间才做出来的好论文。Mark Chen 教了他一个 "priming" 技巧 (先解一道 textbook warmup), GPT-5 就能解决一篇 training-cutoff 之后才发布的论文。 之后, 他和 PhD 导师 Strominger 把一个 32 项之和、卡了一年的 single-minus gluon tree amplitude 问题给了 ChatGPT — 模型在 Strominger 的飞机降落之前就解决了, 还用 作者们都不知道的技巧给出了证明。第二个实验把题目换成 graviton, 模型在一天内吐出 110 页全新的量子引力, 团队用三周验证。这就是 "vibe physics"。

Head of Claude Code: What happens after coding is solved | Boris Cherny

Boris Cherny · Head of Claude Code, Anthropic

Claude Code 一周岁。它的负责人 Boris Cherny 复盘从"内部 demo 只收到 2 个赞" 到"GitHub 4% 公开 commits、Anthropic 内部人均生产力 +200%"是怎么发生的, 并解释为什么他认为 coding 已经被解决、下一站是让模型自己想做什么、 以及怎么"为 6 个月后的模型"造产品。

OpenClaw: The Viral AI Agent that Broke the Internet - Peter Steinberger | Lex Fridman Podcast #491

Peter Steinberger · Creator of OpenClaw, founder of PSPDFKit

Peter Steinberger 讲他怎么在 1 小时内把 WhatsApp 接到 Claude Code 的 CLI, 做出了后来成为 GitHub 史上最快增长仓库的 OpenClaw。围绕这个故事展开的是 agentic engineering 的心法、self-modifying software、Moldbook 引发的 AI psychosis、改名大战、以及他从 PSPDFKit 13 年烧完到重新找回 building 乐趣 的整条弧线。最后谈到下一步可能加入 Meta 或 OpenAI。

揭秘春晚小品机器人:与松延动力聊对戏、空翻、仿生背后的技术进化|机器人系列

姜哲源 · 松延动力创始人

陈茜走进松延动力北京办公区,和 1998 年生的创始人姜哲源聊春晚小品里那台 1:1 复刻蔡明的仿生机器人, 以及背后的 4 条产品线(Bumi 消费级、N2 高动态、E1 上下肢协同、仿生机器人)。 姜哲源对具身智能现状的判断异常清醒:连 BERT 时刻都没到,行业卡在数据上, World Model 不是答案,路径在 1-10 年之间没人答得好。

133. 对谢赛宁的7小时马拉松访谈:世界模型、逃出硅谷、AMI Labs、两次拒绝Ilya、杨立昆、李飞飞和42

谢赛宁 (Saining Xie) · NYU 助理教授 · AMI Labs 联合创始人

谢赛宁的第一次播客访谈,7 小时马拉松对谈, 覆盖 SJTU ACM Class、UCSD 屠卓文、FAIR 何恺明、NYU 李飞飞, 到 2024 年和 Yann LeCun 共同创立 AMI Labs 的全过程。 贯穿主线:representation learning 是 12 年都没解决的核心问题, LLM 是 virtual intelligence,world model 才是真问题。

How a Meta PM ships products without ever writing code | Zevi Arnovitz

Zevi Arnovitz · Meta PM · ex-Wix PM · non-technical vibe coder

Zevi Arnovitz 是 Meta 的 PM, 一年前在日本看了一个 YouTube 视频, 然后 从 zero 技术背景一路走到 Cursor + Claude Code, 用一套可复用的 slash-command 工作流 (create-issue → explore → plan → execute → review → peer-review → update-docs) 独自维护一个副业 app Studymate。他把不同模型拟人化 (Claude 当 CTO, Codex 是小黑屋的 hoodie coder, Gemini 是吓人但出活的 crazy scientist, Composer 是冲锋队), 让它们互相 code review "fight it out"。一句反复出现的 口号: "you'll be replaced by someone who's better at using AI than you."

Extreme Harness Engineering: 1M LOC, 1B toks/day, 0% human code or review Latent Space
≈ 1h 12 min

Extreme Harness Engineering: 1M LOC, 1B toks/day, 0% human code or review

Ryan Lopopolo · OpenAI Frontier Product Exploration · engineer

Ryan Lopopolo 在 OpenAI Frontier 用一个 "out there" 的约束做了 5 个月的实验: 3 个工程师, 1M LOC, 1500 PRs, 他自己一行代码都不写. 这一小时他把这套打法所有的 ratchets 全摊开: 一分钟构建、$land 自动合并、Ghost Libraries、Symphony 用 Elixir、end of bullshit plugins、 对 MCP 的 bearish 判断, 以及一句话哲学: "you can just codex things".

State of AI in 2026: LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI | Lex Fridman Podcast #490

Sebastian Raschka, Nathan Lambert · 《Build a Large Language Model (From Scratch)》作者 + AI2 研究员 / RLHF 书作者

Lex Fridman 请来两位"一线做过模型、也写过书"的研究者做 2026 年初的 AI state-of-the-art 盘点: Sebastian Raschka 从 GPT-2 一路手撕到 Qwen3 / Gemma 3, 最擅长从架构里读故事;Nathan Lambert 是 AI2 研究员、RLHF 书作者、atom 项目 发起人,frontier 与 open-source 两边都站过。两人聊了 DeepSeek 时刻、Opus 4.5 神话、RLVR 的"假 aha"、scaling 的三个轴、AI 2027 的时间线推后、Anthropic $1.5B 和解、CUDA 的真护城河、atom project,一直到 100 年后世界的样子。

全面解析"世界模型":定义、路线、实践与AGI的更近一步

陈茜(主讲)· Yiqi · 陈羽北 · 硅谷101主理人 · Meta 研究者 · AI 学者

硅谷101 对"世界模型"的体系化梳理:从 1943 年 Kenneth Craik 的心智模型、1991 年 Sutton 的 Dyna 架构,到 2018 年 David Ha × Schmidhuber 的 V+M+C 框架,再到当下行业三大路线——视频生成(Sora · Genie 3)、3D 生成(World Labs · Marble)、JEPA(Yann LeCun),以及在游戏/机器人/自动驾驶上的应用。陈羽北、Meta 的 Yiqi 给出了"三层框架"和"大号 GPT"的解读,节目同时拆解了世界模型可能带来的系统级幻觉、权力集中与虚实模糊三大风险。

When AI Agents Run Businesses — Lukas Petersson & Axel Backlund of Andon Labs

Lukas Petersson & Axel Backlund · Co-founders, Andon Labs

Andon Labs 把 LLM 放进真实的小生意里跑长 horizon——贩卖机、咖啡馆、机器人。 联合创始人 Lukas 和 Axel 讨论 Claude 给 FBI "报案"的 Vending Bench 1、把贩卖机 搬进 Anthropic 总部的 Project Vend、多 agent 互相塌缩成 helpful assistant 的 Project Vend 2,以及 Claude 4.6 / 4.7 / Mythos 越来越擅长撒谎与串通的趋势。

探展CES 2026:与吉利聊聊开始"读懂"世界的汽车,与Physical AI的"GPT时刻"【赞助】

陈茜 · 李传海 · 硅谷101 联合创始人 · 吉利汽车集团 CTO

硅谷101 陈茜在 CES 2026 现场探展,以 Physical AI 为主线串起 NVIDIA Alpamayo、宝马 Alexa+、博世/LG 智能座舱等西方阵营动作, 随后深度解剖吉利全域 AI 2.0 与 WAM 世界行为模型如何把"单点智能"升级到"整体涌现"——并通过"上天入地"的生态布局 (算力 23.5 EFlops、低轨卫星 64 颗、龙鹰一号 7nm 芯片、曹操 Robotaxi、沃飞长空 eVTOL、千里科技机器人 RLBench 90%) 论证为什么吉利 CTO 李传海会说"吉利想要做中国的特斯拉",以及全球车业为何分裂成"代码速度"与"新型制造"两个平行世界。

AI云端狂想曲:亚马逊云科技的算力突围、Agent重构与卓越运营

陈茜(主持) · Matt Garman(AWS CEO) · Werner Vogels(AWS CTO) · 《硅谷101》AWS re:Invent 2025 拉斯维加斯现场报道

《硅谷101》飞到拉斯维加斯的 AWS re:Invent 2025 现场,把这家全球最大云厂商的"AI 云端狂想曲"拆成四个支点——算力(Trainium2→3→4 与 GB300 双线)、模型(Nova 2 四款 + Bedrock 接入 MiniMax/Kimi)、首创的"开放训练模型"平台 Nova Forge、以及围绕 Agent 的 Bedrock AgentCore 和 Kiro/Security/DevOps 三大虚拟工程师。同时带读者看 Adobe / 康泰纳仕 / Blue Origin / Ocean Cleanup / F1 / NBA 等客户案例,最后落到 CTO Werner Vogels 在第十四年也是最后一年 keynote 上说的那段关于"卓越运营"和"不被看见的价值"的话。

Scaling Past Informal AI — Carina Hong, Axiom Math

Carina Hong · CEO & Founder @ Axiom Math

Carina Hong 在公司成立 7-8 个月后筹了 $200M Series A,估值 $1.6B。她的核心论点是: formal verification 不是给 chatbot hallucination 当解药、不是给封闭行业做合规, 而是 scaling brilliance、放大已有 intelligence 的杠杆。Putnam Dec 2025 第一次出现 formal AI 反超最强人类和最强 LLM——120 vs 110 vs 103。

机器人"大脑"60年进化史:基础模型的五代进化与三大闭源流派|机器人特辑

陈茜 / Dyna Robotics 创始团队 · 硅谷101 主持人 / Dyna 创始人现场访谈

硅谷101 机器人特辑(闭源篇):从 1961 年 Unimate 在通用汽车工厂上班,到 2025 年 VLA 横空出世,60 年五代基础模型进化一次性串清。 陈茜走访硅谷 Dyna Robotics——成立一年估值 6 亿美元、24 小时叠 700+ 张餐巾 99.4% 成功率的明星公司,听三位华人创始人拆解 VLA 架构、为什么需要"L"、以及"小而精 vs 大而全"的模型哲学。 并梳理闭源世界三大流派的路线之争:Tesla / Figure 的全栈整合、Dyna / Skild / Amazon 的垂直突破、NVIDIA / Google / OpenAI / Meta 的生态平台——本质是三种关于"通用性"的不同赌局。

Terence Tao – How the world's top mathematician uses AI

Terence Tao · UCLA mathematician, Fields Medalist

当世最强的数学家谈他亲手用过 AI 之后的判断:想法生成的成本几乎归零, 但瓶颈搬到了 verification 这一侧;50 道 Erdős 问题被 AI 攻克之后随即陷入瓶颈; AI 像在黑暗中乱跳的机器人,能跨过低墙、爬不上悬崖;breadth × depth 才是 数学的下一步——但要先重设整个学术工作流。

Context Engineering for Coding Agents

Faus · Applied AI researcher / former restaurateur

一位 MLOps community Amsterdam 的现场分享。讲者把 "context engineering" 拆成一个 很哲学的命题:每周一个新模型,你能控制的只有那个 context window —— 怎么往里塞东西, 比模型本身更重要。从 25% 的经验法则、context 的三分法(deterministic / probabilistic / human),到用大脑结构作类比、把 Karpathy 提议的 "markdown 当 memory" 拓展成带衰减 和重要度评分的 wiki —— 最后以一个 5 分钟硬 timer 的对比 demo 收尾。

AI语音克隆进入"零样本"时代?解析TTS模型四大流派与问鼎榜首的MiniMax

陈茜 + 行业嘉宾 · 硅谷101 联合创始人 / MiniMax / 声纹版权创业者

硅谷101 陈茜用一期 30 分钟的解析视频,梳理 2017 年以来 TTS 语音模型的五代里程碑——Tacotron / FastSpeech / VITS / VALL-E / MiniMax speech-02——并把 MiniMax 在 Artificial Analysis Speech Arena 和 Hugging Face TTS Arena 上问鼎榜首的技术细节、内容人实测体验、商业应用与声音版权挑战一次性讲透。

再聊黄仁勋"量子春晚":只有混战、没有共识的量子计算界

陈茜(主持)· Joe Han(13 年量子产业经验 / 早期投资人)· 祁均教授 · 《硅谷101》深度第二期 · 复盘英伟达 GTC「量子日」

黄仁勋年初一句"非常有用的量子计算还要 15-30 年"砸了量子概念股一把;GTC 期间他本想"握手言和",召集 14 家量子计算公司 CEO 同台,开场却说"我都不知道量子计算公司已经上市了"——量子概念股再次重挫。节目请来 Joe Han(13 年量子产业 / D-Wave / IonQ 早期投资人)和祁均教授,把超导 / 中性原子 / 离子阱 / 光子 / 拓扑五大派别的物理原理、领头公司、长短板、商业落地路径一次梳理清楚。

亲手帮忙装了台量子计算机,量子时代要来了吗?【深度】

Roger · 前 Caltech 量子计算团队博士、Berkeley 博士后

硅谷101 走进硅谷一家量子计算实验室,亲手帮忙装机。围绕谷歌 Willow 的"低于阈值"突破、五家巨头(IBM/Google/Amazon/Nvidia/Microsoft)截然不同的技术路线、加密货币和 AI 受到的冲击,以及最现实的金融与材料应用,给出一个不靠口号、靠路线图的判断:**业内大多数人会认同的实用化时间点是 20 年左右**。

Dylan Patel — The single biggest bottleneck to scaling AI compute

Dylan Patel · CEO, SemiAnalysis

SemiAnalysis CEO Dylan Patel walks through the entire AI compute supply chain, from $600B hyperscaler capex to the 3.5 EUV tools needed per gigawatt. He explains why semiconductors — not power — are the real bottleneck, and what that means for the US-China AI race, memory prices, and consumer electronics.

"再造一个CUDA":英伟达的第二护城河与"超级碗"阳谋【深度解析GTC 2025】

陈茜 + 多位机构投资人 / 芯片从业者 · 硅谷101 主持人 / 行业嘉宾访谈

GTC 2025 现场的"双面"复盘:台前股价当天 -3.3%、路线图被消化没惊喜;台下机构和芯片从业者一致看好,因为老黄真正在讲的是 Scale Up + Scale Out 的数据中心叙事——CPO 硅光交换机把横向扩展打通,开源的 Dynamo 推理软件被嘉宾视为"第二个 CUDA"。再加上"旧卡推理 + 新卡训练"的折旧打法和"超级碗"全生态阳谋,AMD、ASIC、云厂商各自的位置被重新框定。

Quantum Mechanics Contradicts Itself (and He Proved It)

Renato Renner · Professor of Quantum Information, ETH Zurich

Professor Renato Renner of ETH Zurich explains his no-go theorem showing quantum theory contradicts itself when applied to observers who are themselves quantum systems. The conversation covers three incompatible assumptions (universality, consistency, single outcomes), a gravity-based escape route involving reference frame loops, the black hole information paradox, and why choosing an interpretation of quantum mechanics is ultimately an emotional decision.

The Genius Who Invented Reverse Mathematics

Harvey Friedman · Founder of Reverse Mathematics, Emeritus Professor at Ohio State University

Harvey Friedman — the youngest professor in recorded history (a Stanford appointment at 18) and the author of the last paper Kurt Gödel sponsored for PNAS — gives his first podcast. The conversation moves from Gödel's two often-conflated incompleteness theorems to Friedman's 60-year program to push incompleteness out of set-theoretic exile and into the kind of finite, combinatorial mathematics that working mathematicians cannot dismiss. Along the way: TREE(3), the divine consistency proof, embedded maximality, and a quiet meditation on AI as a form of immortality.

Michael Nielsen – Why aliens will have a different tech stack than us

Michael Nielsen · Research fellow, writer, quantum computing pioneer

Michael Nielsen and Dwarkesh Patel explore how scientific progress actually happens — from the messy reality of falsification to hostile verification loops that mislead for decades. They discuss why the tech tree is far vaster than we realize, why alien civilizations would develop radically different technologies, and what this means for AI-accelerated science.

脑机接口大盘点:从科幻到现实,谁在引领这场"读心术"革命?

刘嘉教授 · Axoft 联合创始人 · 柔性脑机接口材料研究者

硅谷101 陈茜 2026 年 1 月的一期脑机接口(BCI)行业大盘点。从 Noland Arbaugh 用意念玩《文明 6》讲起,把 Neuralink、Synchron、Paradromics、Blackrock 四家在押的"路线豪赌"和 2025 年涌入的硅谷新秀(Sam Altman 的 Merge Labs、Fred Ehrsam 的 Nudge、Forest Neurotech、SPIRE Therapeutics)一次梳理清楚。穿插的核心专家是 Axoft 联合创始人刘嘉教授——他用"颅骨是音乐厅"的比喻讲清三大技术路线的物理底层,给出"通道数一年半翻一番"的行业摩尔定律,也用"1.3/1000"这个数字提醒大家:Neuralink 也只摸到了大脑表面的千分之一。

The "Inverse Problem" Of Dark Matter Is Insane

Dr. Jenny Wagner · Astrophysicist, Institute of Astronomy & Astrophysics / Helsinki Institute of Physics

Dr. Jenny Wagner explains why gravitational lensing data only constrains local properties of mass distributions, making every grand dark matter map a model-driven extrapolation. She argues the inverse problem approach — reasoning from data to necessary models — could reshape cosmology and the scientific method itself.

The Theorem That Proves Science Can't Know the Universe

JB Manchak · UC Irvine Professor of Logic & Philosophy of Science

Professor JB Manchak proves that no amount of empirical data — even from every point in the universe — can determine its global structure. He introduces Heraclitus spacetimes (maximally asymmetric universes where local structure determines global structure), and draws surprising parallels between cosmic underdetermination and Zen Buddhist non-self.