PodDeck
← 全部标签
标签

#coding-agents

28 集相关 · 28 集已生成

已生成

140. 对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去

姚顺宇 · 研究科学家 · 前 Anthropic · 现 Google DeepMind (Gemini)

张小珺·语言即世界 EP.140,对姚顺宇的 4 小时访谈节选。姚顺宇博士毕业于斯坦福 理论高能物理,2024 年半道出家加入 Anthropic 参与 Claude 3.7、4.5 的强化学习训练; 2025 年 10 月跳槽到 Google DeepMind 做 Gemini 的 ML coding / long horizon。 这期把两家 lab 的打法、coding bet 的内部信号、AI safety 的"幼稚"自我说服、 以及"个人英雄主义时代已经过去了"等小疯言论摊开讲清楚。

Andrej Karpathy: From Vibe Coding to Agentic Engineering

Andrej Karpathy · AI researcher, OpenAI co-founder, ex-Tesla AI

Karpathy 在一场炉边对谈里,从"作为程序员从未如此落后"讲起:December 是 agentic 编码工作流真正开始 work 的拐点。他串起 Software 3.0(编程变成 prompting)、可验证性如何造就"锯齿状"智能、vibe coding 与 agentic engineering 的分野,以及人类仍独一无二负责的"理解"。

How Anthropic's product team moves faster than anyone else | Cat Wu (Head of Product, Claude Code)

Cat Wu · Head of Product, Claude Code & Cowork · Anthropic

Cat Wu 是 Anthropic 的 Claude Code 与 Cowork 产品负责人。show notes 把这一期框成 "AI is changing the PM role" 的近距离观察:Anthropic 的 shipping cadence 从 months 压到 weeks 再到 days, PM 要在模型还没准备好的时候就开始建产品, Cat 最看重的一项 被低估技能是 "asking the model to introspect on its own mistakes", 而 "just do things" 是她总结的 AI-native 公司第一原则。

138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权

罗福莉 · 小米大模型负责人

小米大模型负责人罗福莉的 3.5 小时深度对谈:从春节凌晨 2 点 OpenClaw 觉醒,到 MiMo V2 系列 (Pro / Omni / TTS) 的"悄无声息伏击",再到 Agent 时代后训练算力 1:1、组织扁平化、AGI 两年内可期。 当下范式已从 Chat 切到 Agent —— 1T 基座 + 后训练敏捷性是新的入场券。

Getting Humans Out of the Way: How to Work with Teams of Agents

Rob · Creator of Brumi (open-source multi-agent IDE)

Rob 是开源多 agent IDE Brumi 的作者. 这期他把"如何把人从 loop 里拿出来"的整套手艺摊开讲—— 从让 agent 截图自证 (feature walkthrough doc), 到自定义 lint 规则爆炸, 到 plan.md 替代 plan mode, 到并行 5 个 agent 挑赢家. 核心隐喻只有一句: 教 agent 怎么向上汇报.

The $15B Physical AI Company: Simulation, Autonomy OS, Neural Sim, & 1K Engineers—Applied Intuition Latent Space
≈ 70 min

The $15B Physical AI Company: Simulation, Autonomy OS, Neural Sim, & 1K Engineers—Applied Intuition

Qasar Younis & Peter Ludwig · Co-founders of Applied Intuition (CEO / CTO)

Applied Intuition 给汽车 / 卡车 / 矿车 / 农机 / 防务平台卖"让物理机器变聪明"的技术栈, 18/20 OEM 是它客户, 估值 $15B, 1000 名工程师, 现在在日本跑 L4 无人卡车. 这期把它的三个 bucket (仿真 + 操作系统 + 自动驾驶模型) 全部摊开讲, 还顺手把 "vehicles like pre-Android phones" 这条 类比、neural sim = Gaussian splatting + diffusion、onboard 才是物理 AI 真正瓶颈 这些反直觉点都串了起来.

Why Agents are Driving Software Development to the Cloud

Zach Lloyd · Warp Founder & CEO · ex-Google Docs/Sheets

Warp 创始人 Zach Lloyd 在 MLOps.community 解释为什么 2026 是 agents 搬家的一年—— 从笔记本搬到云端,从 solo sport 变成 team sport。Oz 是他们的编排平台,agent 不是云电脑、 是云上的同事,meta-app 正在让 SaaS 入口收敛到一个"会做事的浏览器"。

The Creator of Superpowers: Why Real Agentic Engineering Beats Vibe Coding

Jesse Vincent · Creator of Superpowers (110k stars Claude Code skill kit)

Jesse Vincent —— Perl projects lead 出身、K-9 Mail 的原作者、25 年老兵 —— 把过去九个月驯服 Claude Code 的方法摊开来讲. 110k stars 的 superpowers 不是 vibe coding, 而是一套 orchestrator 架构 + 单使命 subagent 分工 + skill 系统的 agentic engineering 方法论. 这期还覆盖 Claude 删测试事件如何用一行 prompt 修好、为什么 swarm 是 2002 年的 Facebook、 以及 2028 年 GitHub 可能不存代码只存 specs 的预言.

An AI state of the union: We've passed the inflection point & dark factories are coming

Simon Willison · Open-source engineer & Django co-creator

Simon Willison (co-creator of Django, coined "prompt injection") talks with Lenny Rachitsky about the November 2025 inflection point when coding agents crossed a reliability threshold, the dark factory pattern where nobody writes or reads code, and the lethal trifecta of AI security risks.

A Motorcycle for the Mind

Naval Ravikant, Babak Nivi · Naval Podcast

Naval 和 Nivi 在散步中录的 52 分钟, 把过去一年关于 AI 的几条 tweet 一条一条拆开: vibe coding 是新 PM, 训练模型是新编程, 英语成为最热门的编程语言. 落到智能的真正测试 (能不能从生活里得到你想要的) 和 AI 焦虑的解药 (动起来), 最后用 "motorcycle for the mind" 收尾.

It's 2026, and We're Still Talking Evals

Maggie Konstanty · ML Engineer · LLM Agent Evaluation Lead

Maggie Konstanty 在 MLOps.community 谈 LLM agent 评估的真实战场——为什么团队总是先发布再补 eval、 为什么 pre-prod 和 production 是"两种动物"、以及为什么所有 vendor 工具都让她最终选择自己造。 整期访谈最反直觉的 takeaway:evals 本身不难,难的是让团队对齐"什么叫好"。

Head of Claude Code: What happens after coding is solved | Boris Cherny

Boris Cherny · Head of Claude Code, Anthropic

Claude Code 一周岁。它的负责人 Boris Cherny 复盘从"内部 demo 只收到 2 个赞" 到"GitHub 4% 公开 commits、Anthropic 内部人均生产力 +200%"是怎么发生的, 并解释为什么他认为 coding 已经被解决、下一站是让模型自己想做什么、 以及怎么"为 6 个月后的模型"造产品。

OpenClaw: The Viral AI Agent that Broke the Internet - Peter Steinberger | Lex Fridman Podcast #491

Peter Steinberger · Creator of OpenClaw, founder of PSPDFKit

Peter Steinberger 讲他怎么在 1 小时内把 WhatsApp 接到 Claude Code 的 CLI, 做出了后来成为 GitHub 史上最快增长仓库的 OpenClaw。围绕这个故事展开的是 agentic engineering 的心法、self-modifying software、Moldbook 引发的 AI psychosis、改名大战、以及他从 PSPDFKit 13 年烧完到重新找回 building 乐趣 的整条弧线。最后谈到下一步可能加入 Meta 或 OpenAI。

Skill Issue: Andrej Karpathy on Code Agents, AutoResearch, and the Loopy Era of AI

Andrej Karpathy · Eureka Labs 创始人 · 前 Tesla AI 总监 · OpenAI 创始成员

Andrej Karpathy 做客 No Priors,描述他这几个月每天 16 小时"对 agents 表达意图"的真实状态: 编程不再是写代码,瓶颈从算力变成了人自己,做不成事往往是 skill issue 而非 capability issue。 对谈延伸到 AutoResearch、家庭智能体 Dobby、软件退化成 API endpoints、模型的锯齿状智能与物种化、 Folding@home 式的开放研究,以及"把如何解释编码进 agent"的新教育形态。

How a Meta PM ships products without ever writing code | Zevi Arnovitz

Zevi Arnovitz · Meta PM · ex-Wix PM · non-technical vibe coder

Zevi Arnovitz 是 Meta 的 PM, 一年前在日本看了一个 YouTube 视频, 然后 从 zero 技术背景一路走到 Cursor + Claude Code, 用一套可复用的 slash-command 工作流 (create-issue → explore → plan → execute → review → peer-review → update-docs) 独自维护一个副业 app Studymate。他把不同模型拟人化 (Claude 当 CTO, Codex 是小黑屋的 hoodie coder, Gemini 是吓人但出活的 crazy scientist, Composer 是冲锋队), 让它们互相 code review "fight it out"。一句反复出现的 口号: "you'll be replaced by someone who's better at using AI than you."

State of AI in 2026: LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI | Lex Fridman Podcast #490

Sebastian Raschka, Nathan Lambert · 《Build a Large Language Model (From Scratch)》作者 + AI2 研究员 / RLHF 书作者

Lex Fridman 请来两位"一线做过模型、也写过书"的研究者做 2026 年初的 AI state-of-the-art 盘点: Sebastian Raschka 从 GPT-2 一路手撕到 Qwen3 / Gemma 3, 最擅长从架构里读故事;Nathan Lambert 是 AI2 研究员、RLHF 书作者、atom 项目 发起人,frontier 与 open-source 两边都站过。两人聊了 DeepSeek 时刻、Opus 4.5 神话、RLVR 的"假 aha"、scaling 的三个轴、AI 2027 的时间线推后、Anthropic $1.5B 和解、CUDA 的真护城河、atom project,一直到 100 年后世界的样子。

Andrej Karpathy — "We're summoning ghosts, not building animals"

Andrej Karpathy · AI 研究者,曾领导 Tesla 自动驾驶、OpenAI 创始成员

Andrej Karpathy 在 Dwarkesh Podcast 的长访谈。他给出一份冷静的"祛魅":这是 智能体的十年而非元年;我们造的不是动物而是"幽灵"——通过模仿互联网而来的数字 实体。他剖析了 RL 的根本缺陷("用吸管吸取监督信号")、模型坍缩、自动驾驶式的 "九分进军",以及他为何离开前沿实验室转去做教育。

The rise of the professional vibe coder (a new AI-era job)

Lazar Yavanovich · Lovable Vibe Coding Engineer

Lovable 首位官方 Vibe Coding 工程师 Lazar Yavanovich 分享了一套完整的职业 vibe coding 方法论: 从平行构建 5 个项目获取 clarity,到 PRD 文档系统和 4x4 调试框架,再到为什么设计品味和判断力 将成为 AI 时代最稀缺的技能。

Andrej Karpathy: Software Is Changing (Again)

Andrej Karpathy · 前 Tesla AI 总监 / OpenAI 创始成员

Karpathy 在 YC AI Startup School 的演讲:软件 70 年没怎么变,却在最近几年被快速改写了两次—— 从 Software 1.0(代码)到 2.0(神经网络权重)再到 3.0(英文 prompt)。他用一连串类比拆解 LLM: 它像电网、像晶圆厂,但最像停留在 1960 年代的操作系统;它是有一身认知缺陷的"人类幽灵"。 最后落到怎么和它一起工作——部分自治应用、自治滑块、生成-验证循环,以及为 Agent 重写基础设施。

Marc Andreessen: The real AI boom hasn't even started yet

Marc Andreessen · Co-founder of Andreessen Horowitz (a16z)

Marc Andreessen argues AI arrives at a miraculously well-timed moment — just as productivity growth has stagnated for 50 years and global population is declining. He unpacks the "Mexican standoff" between PMs, engineers, and designers, explains why task loss matters more than job loss, and makes the case for indeterminate optimism.

Why half of product managers are in trouble | Nikhyl Singhal (Meta, Google)

Nikhyl Singhal · ex-Meta / ex-Google / ex-Credit Karma CPO · Skip 社区主理人

Nikhyl Singhal 在 Lenny's Podcast 上讲了一件很不舒服的事: 约一半的 PM —— 那些 以"frame 和搬运信息"为核心技能的人 —— 正在被 AI 淘汰; 而另一半 "builders" 正迎来 comp 史上最高、机会最多的时刻。他对未来 12-24 个月的预测很直白: "shed 30,000 and hire 8,000", 8,000 人都是 AI-first。给听众的唯一行动项是 "cross the threshold" —— 找到第一次因自己动手构建而产生 joy 的瞬间。

139. 【Agent的综述】和苏煜聊Agent技术史、OpenClaw Moment、边界的消弭和社会的辐射

苏煜 · 俄亥俄州立大学计算机系教授 / NeoCognition 创始人 / 2025 斯隆研究奖得主

张小珺商业访谈录 #139 期:和俄亥俄州立大学教授、NeoCognition 创始人苏煜做的一次 Agent 技术综述。 从 Logical Agent (1960s-90s) → Neural Agent → Semantic Parsing → Language Agent 的演进史出发, 讨论了 OpenClaw Moment 与 ChatGPT Moment 的相似性、universal digital agent 的目标、 中美科技辐射的不同 pattern,以及 2026 年 Agent 的瓶颈和大厂们的赌注。

Fixing GPU Starvation in Large-Scale Distributed Training

Kashish · Uber · ML Infra · Marketplace Matching Lead

Kashish (Uber ML infra, ex-Google YouTube Ads) walks Demetrios through a Sherlock-Holmes-grade Petastorm bug—GPU cluster stuck at 15-20% utilization, six debugging steps, two layers of bottleneck, and finally a "double bottleneck" reveal: PyArrow→NumPy translation was silently eating the headroom. Plus serving's latency-vs-utilization war, the reproducibility cost of parallelism, and a live diagnosis of a friend's slow DGX Spark.

Notion's Sarah Sachs & Simon Last on Custom Agents, Evals, and the Future of Work Latent Space
≈ 84 min

Notion's Sarah Sachs & Simon Last on Custom Agents, Evals, and the Future of Work

Sarah Sachs · Simon Last · Notion — engineering manager (core AI capabilities & infra) · co-founder

Notion 把 agent 重写了 5 次,从 2022 年末 GPT-4 时代试图后台跑 assistant 一直撞到今天的 100+ tools custom agent. Sarah (engineering manager) 和 Simon (co-founder) 用 84 分钟 把"为什么这么慢"和"现在为什么终于行了"都摊开讲: progressive disclosure、SQL-light queries、 notion's last exam(主动留 30% 通过率)、为什么是 credits 而不是 tokens、为什么 manager agent 是 对 70 条通知的解、以及为什么"replacing processes"比"replacing people"更准确.

The Modern Software Engineer

Mihail Eric · ML / AI infrastructure practitioner & instructor

Mihail Eric 和 Demetrios 在 SF 录音棚里把 AI coding agent 的真实工程问题挨个摊开: junior 被 cursor 截断的训练链, Eno @ Factory 强调的 validation harness, token 计费迟早被 task 计费取代, Twitter 上 "15 个 tiled Claude Code instances" 的并行神话, 团队该变小、PM 该会提 PR, 以及 下一个 superpower 是 articulation. 全程没有 framework, 全是 day-to-day 判断, 最后一句是 "just breathe".

Extreme Harness Engineering: 1M LOC, 1B toks/day, 0% human code or review Latent Space
≈ 1h 12 min

Extreme Harness Engineering: 1M LOC, 1B toks/day, 0% human code or review

Ryan Lopopolo · OpenAI Frontier Product Exploration · engineer

Ryan Lopopolo 在 OpenAI Frontier 用一个 "out there" 的约束做了 5 个月的实验: 3 个工程师, 1M LOC, 1500 PRs, 他自己一行代码都不写. 这一小时他把这套打法所有的 ratchets 全摊开: 一分钟构建、$land 自动合并、Ghost Libraries、Symphony 用 Elixir、end of bullshit plugins、 对 MCP 的 bearish 判断, 以及一句话哲学: "you can just codex things".