AI友好的工具链下，如何开发一个产品

PodDeck — 让AI替你听完所有长播客

我现在对信息的质量非常挑剔。

直接原因是公众号、头条号那种内容本质上都是AI生成的，缺乏观点。

AI生成本身不是问题。问题是大部分用AI写文章的人，自己其实不知道要表达什么观点——脑子里没有一个想清楚的主张，扔给AI润色一遍、加几段铺垫，文字流畅、结构齐整，自己读着也觉得挺好——但通篇没有一个立得住的观点。这类文章的特点是被AI绑架了，处在一种"不知道自己不知道"的状态。

这种内容堆在我的信息流里，对认知没有任何帮助。它有信息的体积，没有信息的密度。读完不会改变我对任何问题的看法，因为它本来就没主张要改变什么。

所以我现在主动追的就三类源：Twitter上大佬本人的原话（比如Karpathy）、长访谈类播客（Lex Fridman、Dwarkesh、Lenny’s、Huberman、张小珺），技术博客原文。这一层每个人都是带着自己的观点在说话——一期Lex对Karpathy、一期Dwarkesh对Dario，里头随便挑一段都有公众号永远抓不到的反直觉判断、具体案例、嘉宾自己都讲不清但反复在用的心智模型。

但这套信息流有个明显的瓶颈：播客太长。每期两到三小时是常态。我下班、带娃、做饭，听不完。攒在收藏夹里吃灰比没收藏更焦虑——你知道好东西在那里，但你拿不到。

所以我要的东西其实很具体：能让我十分钟扫完一集嘉宾的核心观点，再决定哪几期值得花完整时间认真听的东西。结构化、可翻、能挑重点跳读的载体。最自然的形式是PPT。

所以做了PodDeck——把几十期2-3小时的长播客，自动转成20-30页可翻的deck，扔在GitHub Pages上。

PodDeck地址：kvenux.github.io/poddeck 源码：github.com/kvenux/poddeck

不知道从哪开始，就先翻这几张：

姚顺宇 — 在Anthropic和Gemini训模型——做AI不要很聪明，本科生都能做，靠谱就行
Dario Amodei — “我们已经接近指数曲线的尾声”——A社CEO亲口说：scaling的红利在见顶
Boris Cherny — Claude Code负责人——CC作者：AI coding已经解题，公司里大部分人开始用CC干编码以外的事
Jensen Huang — 英伟达的护城河还能保住吗？——老黄：跟台积电从来不签合同，60个人直接汇报，不搞1:1
Andrej Karpathy — 从vibe coding到agentic engineering——vibe coding之后，工程的真正形态是什么
Terence Tao — 全世界最顶尖的数学家怎么用AI——顶级数学家把AI当协作工具的具体方式

整个东西是一个周末带娃的间隙搞出来的——零零散散几个小时的碎片，从我问"有没有下字幕的cli"，到能发朋友圈的版本部署上线。我没敲过一条命令，也没写过一行代码。

唯一不便宜的地方是token：每一集要走理解→编辑→视觉→事实校验→playwright自审，单期消耗不亚于开发一个新需求。能这么干，是因为接口的摩擦力小到可以忽略，钱花在了内容本身上。

这件事复盘到底，结论是反直觉的：让它这么快搭起来的不是模型变聪明了，是字符接口时代早就把AI友好的工具链做完了，AI只是终于来用。

一个周末分几段干完的

第一段：问cli→装yt-dlp→拿到Boris、Jensen、Dario三期字幕→让CC去GitHub上搜"播客转slides"的项目→撞上Slidev
第二段：跑第一版deck→视觉审查→把硬规则注进subprocess的系统提示词→并行3个进程生成
第三段：建仓、配Actions、部署Pages
最后一段：发朋友圈

中间我做的事就三件：提诉求、提愿望、验收。剩下的全是几条CLI串起来跑完的。

PodDeck工作原理：四条CLI一条龙

yt-dlp：一条命令把字幕拿到

yt-dlp --write-auto-sub --sub-lang en --skip-download <url>

输入一个URL，输出一个VTT。flag全在--help里，失败有标准报错，可枚举、可组合、可重试。AI看一眼就会用，出错也知道怎么自愈。

这个工具的前身youtube-dl始于2008，作者当年想的不是"让LLM能下视频"。他只是按Unix那套做事：单一职责、文本进文本出、文档贴在--help。十几年后这套接口刚好就是AI最舒服的输入。

gh：建仓、跑Actions、部署Pages都不用打开浏览器

gh repo create、gh pr view、gh run watch——这些命令我自己几乎没敲过，全是让AI干。所以"建GitHub仓库+配Actions+部署Pages"那一步我没担心，知道这条路在CLI上通。

gh把原本只能在网页里点的事折叠成了命令。这种把GUI操作还原回字符接口的产品，给AI留了一条干净的代理通道——它读得到输出、看得见exit code、能自己重试。要是只剩网页UI，AI要么去解DOM要么去做视觉点击，摩擦力大一个量级。

Slidev：markdown直接出deck

让AI写PPT是个尴尬场景：OOXML太重，python-pptx的API不直观，Google Slides要走OAuth。但Slidev把deck退回成markdown：

slidev build slides.md --base /poddeck/episodes/<id>/

输入是markdown，输出是个静态SPA。AI写markdown是它的母语。我在CLAUDE.md里定的所有视觉规范——two-cols大图、卡片网格的配色、Excalidraw的引用——subprocess都直接照着写markdown，全程不碰任何GUI。

CC的丝滑，是CLI给的

把这三个工具放一起看，会发现一个共同模式：它们没有为AI做任何特殊适配，但它们刚好长成了AI最容易使的样子。

Claude Code这个产品本身也是同一个机制。它真正赢的地方不是模型更聪明，是它活在一个接口已经为它准备好的世界里——terminal、git、npm、kubectl、ffmpeg、grep、jq、make，全是字符进字符出、副作用可观测、错误码标准化。这套接口最早是为"会grep的人"设计的，今天发现它对LLM也是最低摩擦。

反观大部分SaaS的"AI战略"——在GUI里塞一个chatbox。方向是反的。GUI是给眼睛和手做的，真正能让AI干活的地方，是产品本身就有一个干净的CLI。

AI时代不是新时代，是字符接口时代被重新放大

这件事让我重新看待"AI时代"这个词。

它不是一个全新时代。它是字符接口时代重新被放大的时代。yt-dlp、gh、ffmpeg、sed、make这一堆工具，过去只在"会grep的人"手里发挥作用，今天被AI接管后，任何能提需求的人都用得动了。

反过来，那些一开始就只活在GUI里、没有干净CLI的产品——大部分企业SaaS、大部分BI、大部分IT系统——反而是AI最难下手的地方。它们留给AI的接口太窄。

PodDeck这件事我能用周末几小时碎片搭出来，功劳不在我，也不在模型。是yt-dlp的维护者、gh的团队、Slidev的作者，过去这些年一直按Unix哲学做事，不小心把AI时代的接口提前交付了。

开源社区从来不是为AI准备的。但他们一直在做的事——单一职责、文本输入输出、错误码标准化、文档塞进--help——刚好就是AI友好。