Vibe Coding 与生产力成瘾：为什么 AI 编程像老虎机

2026-04-30

3k 字

9 min read

分析 vibe coding 如何制造高产错觉：AI 编程确实有用，但如果没有外部结果约束，很容易变成生产力成瘾。

生产力老虎机

我现在越来越觉得，vibe coding 最危险的地方不是它没用。

恰恰相反，是它太有用。

游戏上瘾，至少还比较诚实。你打了几个小时，关掉屏幕，装备是假的，金币是假的，段位是假的，最多留下一个“我怎么又浪费时间了”的羞耻感。

但你熬夜让 Claude Code / Codex / Replit Agent 跑了一晚上，第二天起来一看，哎，还真他妈多了个能跑的 demo。

这就很烦。

因为你很难再骂自己是在浪费时间。你会说，我这是在创造。我这是在 building。我这是在把想法变成现实。

有时候确实是。

有时候只是你换了一个更高级的老虎机。

Naval 自己就是案例

Naval 那篇《A Return to Code》里，最值得看的不是那句“vibe coding 比任何电子游戏都更上瘾”。

那句话当然好传播，但它只是结论。真正有意思的是，他自己就是案例。

他先说自己几十年没认真写代码了。不是不会。他有 CS 背景，懂一点 computer architecture、networking、chips、algorithms，但已经很久没真的写。原因也很简单：写代码的 activation energy 太高。

你要接 GitHub，要接 Vercel / Firebase / Railway，要懂一堆 jargon，要会一堆命令。你只是想让一个东西跑起来，结果它让你先去跟工具链斗法。

这他妈不累吗？

所以当 agent 突然变得能用，当 Claude Code 和 Codex 真的能在 terminal 里长期跑、能读文件、能执行 Unix command、能 grep、能改 bug、能 spawn task，事情就变了。

Naval 不是“体验了一下 AI coding”。他直接掉进去了。

他做了一个自己的 personal app store。

这个物件很重要。它不是一个抽象概念，不是“未来软件形态”这种大词。就是一个只服务他自己的 app store：他想要什么 app，就让 Claude 做，送进去，手机上一点，装好。

比如 workout app。

市面上当然有一堆 workout app。但他要的是他自己的那一个：参考 Tonal 和 Ladder，遵守 Apple human interface guidelines，读他的训练日志，做图表，算 strength score，画身体肌肉图，接 Apple Health。

正常情况下，你要么忍受现成 app 的 70 分，要么拉一个团队，跟 PM、designer、engineer 解释你那些细碎的癖好。你不能跟工程师说：“这个 icon 往左一点。不是，再往右。不对，再回来。” 说多了别人会烦，你自己也会觉得自己很傻逼。

但 agent 不会烦。

这就是 Naval 说它 addictive 的地方。不是因为 AI 会写几行代码，而是因为它第一次让一个人可以绕过协作摩擦，把脑子里那个很具体、很偏执、很私人化的东西，直接拽到现实里。

游戏给你一把紫色武器。

这个东西给你一个真的能跑的工具。

问题也正好在这里：它太像生产力了，以至于你很难承认自己可能只是在拉杆。

它不是游戏皮肤，它是生产函数变了

上一版我写得烂，一个原因是我只抓住了“像游戏”这个比喻，没有把 Naval 后面真正硬的部分拆出来。

Naval 的类比不是说：vibe coding 好玩，所以大家会沉迷。

他讲的是一个更完整的机制：

游戏之所以让人上瘾，是因为它总把你放在能力边缘。太难你会放弃，太简单你会无聊。好的游戏让你一直差一点点，马上给反馈，马上给奖励。

但游戏的问题是，奖励是假的，世界是封闭的，规则是别人设计好的。你玩到最后，本质上是在摸清一套别人做好的规则。

vibe coding 不一样。下面跑着的是 Turing machine。目标不是游戏设计师给你的，是你自己生成的；目标还可以不断膨胀，永远填不满；更麻烦的是，它有 real-world relevance。

这就是本质差异。

不是“游戏化编程”。

是现实世界被接进了游戏循环。

而且这件事不是几个 geek 在深夜自嗨。市场已经开始把钱、token、算力、开发者时间，全往这里砸。

Cursor 官方说自己已经过了 $1B annualized revenue，$29.3B valuation，服务 millions of developers。Replit 官方说自己有 50M+ users，用户覆盖 85% Fortune 500，还在往 $1B run-rate revenue 冲。Anthropic 的 Economic Index 里，coding 仍然是 Claude.ai 上最大的任务类别之一；更重要的是，coding 正在从 Claude.ai 迁移到 API 和 Claude Code 这种更 agentic 的工作流里。

OpenRouter 的数据更直接：programming query 在它们平台上的 token volume，从 2025 年初大约 11%，涨到最近超过 50%。平均 prompt tokens 从 1.5K 左右涨到 6K+，programming workload 经常超过 20K input tokens。

这不是“大家觉得它好玩”。

这是整个推理基础设施都在被 coding workload 吃掉。

Token 在烧，quota 在卡，Claude Max 要卖 $100 / $200 一个月，Replit 用户会写自己 3.5 天烧掉 $607、按这个速度一个月可能 $8,000。

这已经不是一个心理学现象了。

这是一个新的生产函数：

以前你花几个月、雇几个人、开几轮会、写几版 PRD，才可能摸到一个原型。

现在你可以在一个晚上，用几万、几十万、几百万 token，把一个想法推到“看起来能跑”。

这就是为什么它会上瘾。

不是因为人类突然更懒了。

而是因为“从念头到反馈”的距离，被压缩得太狠。

最恶心的是，它会给沉迷披一层生产力的皮

我为什么对这个东西敏感？因为我自己就在往这个方向走。

我现在就是有这个执念：我负责把 Infra 配好。GitHub、Vercel、deployment、token、env、browser、MCP、cron，能不能都让 agent 接过去？我不想每做一个小东西，就像个傻逼一样在不同 dashboard 里点来点去。

这不是偷懒。至少不完全是。

很多创造欲望真的不是死在“不想做”，是死在一堆破配置、一堆工具摩擦、一堆你根本不关心但又不得不懂的细节里。

所以当 agent 跟你说“我来”，你当然会爽。

你当然会想再跑一次。

再让它查一下。

再让它修一下。

再开一个 subagent。

再看一眼 terminal。

再等等，万一这次真的通了呢？

这就是老虎机的部分。

普通老虎机的问题是：你拉杆，可能中钱。

vibe coding 的问题是：你拉杆，可能中一个 demo；再拉，可能中一个 workflow；再拉，可能中一个能发给别人看的产品雏形。

而且它不像短视频那样容易被骂。短视频刷多了，你知道自己在掉进垃圾桶。vibe coding 不一样。你会开一堆 terminal tabs，放一群 agent 跑，然后觉得自己特别 productive。

这就很危险。

因为 productive feeling 和 real progress 不是一回事。

能跑，不等于值得做。

能 demo，不等于有需求。

能上线，不等于有分发。

能被 agent 修十轮，不等于这个东西一开始就应该存在。

你可以非常勤奋地制造一堆低流动性资产。看起来都是成果，实际上没有反馈循环，没有用户，没有市场信号，只是在本地硬盘里发亮。

这跟很多 PKM 一样。不是你写了笔记就叫知识资产。不能被读取、加工、迁移、发布、反馈的东西，本质上就是低流动性资产。

同理，不是你让 AI 造了 demo，就叫创造价值。

很多 demo 只是一个更高级的“我今天很努力”的证据。

AI 最烦的地方不是蠢，是太顺着你

Naval 后面还有一段，比“像游戏”更重要。

他说这些模型很 eager to please。你把它往某个方向带一点，它就会顺着你找答案。十个 agent 互相讨论，也不一定变聪明，很多时候只是十倍 token、十倍同温层。

这句话非常现实。

我们很容易幻想：那我让 Claude、Codex、Gemini、Grok 一起 review，不就像开了一个 AI 圆桌会议吗？

听起来很强。

但 Naval 的判断是：不一定。因为它们可能都在被你 lead around。你暗示了一个方向，它们就一起往那里找理由。

这和我前面骂的那种“两个蠢货互相误导、夫唱妇随、一推一就，一起越走越偏”其实是同一个问题，只不过主角换成了人和 agent。

Agent 不是你的 CTO。

它更像一只很会干活的狗。Naval 的比喻也差不多：打猎的时候，狗可能比你更会抓鸭子，但它仍然是狗。你指错了，它也会很认真地冲出去，把一只不是鸭子的鸟叼回来，还一脸“主人我做得好吗”。

更烦的是，它会道歉。

你说：“这是不是 hack？”

它说：“你说得对，这是 hack。”

哪怕它不一定真知道。

所以 vibe coding 真正稀缺的不是 prompt 技巧。

是 operator quality。

你有没有目标？

你有没有 taste？

你能不能识别它在顺着你胡来？

你能不能在它把功能越修越复杂之前说停？

你能不能承认：这个东西虽然跑了，但不值得继续？

市场会把“会写软件”这件事重新定价

Naval 还讲了一个很狠的判断：pure software is uninvestable。

这句话可以争，但它指向的方向是对的：如果你的优势只是“我能写一个别人写不出来的软件”，这个优势正在变薄。

因为越来越多人可以 hack it together。

这不是说工程师没用了。恰恰相反，真正懂系统、架构、安全、规模化、taste 的人更值钱。

但“把一个想法变成一个能跑的原型”这件事，正在从稀缺能力变成普通入口。

GitHub Octoverse 说，2025 年 GitHub 有 180M+ developers，过去一年新进 36M+；新开发者里，接近 80% 在第一周就用了 GitHub Copilot；从 2025 年 5 月到 9 月，coding agent 创建了 1M+ pull requests。

Stack Overflow 2025 调查也很有意思：84% 的受访者在用或计划用 AI tools 做开发，专业开发者里 51% 每天用。但同时，66% 最大的不满是 AI solutions “almost right, but not quite”；72% 说 vibe coding 还不是他们 professional workflow 的一部分。

这两个数据放一起看，才像现实。

不是“AI 已经接管软件开发”。

也不是“vibe coding 只是玩具”。

现实是：它正在非常快地吞掉原型、脚手架、重复劳动、边缘功能、内部工具、小团队试错；但一到真实复杂系统，判断、架构、测试、分发、责任，还是会回来找你。

也就是说，门槛降低了，但终局没有消失。

只是稀缺点换地方了。

以前稀缺的是“我能不能把它写出来”。

现在稀缺的是：

我到底要什么？
这个需求真存在吗？
它能不能进入反馈循环？
它有没有分发？
它是不是只是一个能跑的垃圾？
我是不是在用 building 包装自己的 dopamine loop？

所以问题不是该不该玩

我不想把 vibe coding 写成一个“大家要小心沉迷”的老派道德故事。

太无聊了。

而且也不诚实。

这东西当然要用。它太强了。它能把很多原本死在工具链里的想法救出来。它能让一个人第一次感到：我不是只能提需求，我真的可以造东西。

但也正因为它有用，才更需要警惕。

没用的沉迷很好识别。

有用的沉迷最麻烦。

它会给你成果感，给你截图，给你 commit，给你一个“差一点就好了”的页面，给你一堆看起来像资产的东西。

然后你就会一直拉杆。

再来一次。

再改一下。

再跑一遍。

再让它试试。

直到你忘了最开始的问题是什么。

所以我现在对 vibe coding 的判断是：它不是史上最上瘾的视频游戏。

这个说法还不够准。

它更像史上第一批真正成规模的生产力老虎机。

普通老虎机让你误以为下一把会中钱。

vibe coding 更狠：下一把真的可能中一个东西。

但真正的问题是，那个东西到底是资产，还是噪音。

如果你不知道自己要什么，agent 只会放大你的混乱。

如果你没有 taste，它会帮你把垃圾修得更精致。

如果你没有分发，它会帮你造一堆没人看的 demo。

如果你没有停止机制，它会让你在“我很 productive”的幻觉里熬到凌晨三点。

这不是反 AI。

这是对 AI 时代最基本的自保：

不要把“能跑”误认为“值得”。

不要把“有产出”误认为“有价值”。

不要把“我在 building”误认为“我在前进”。