Vibe Coding 与生产力成瘾:为什么 AI 编程像老虎机
2026-04-30
3k 字
9 min read
分析 vibe coding 如何制造高产错觉:AI 编程确实有用,但如果没有外部结果约束,很容易变成生产力成瘾。
生产力老虎机
我现在越来越觉得,vibe coding 最危险的地方不是它没用。
恰恰相反,是它太有用。
游戏上瘾,至少还比较诚实。你打了几个小时,关掉屏幕,装备是假的,金币是假的,段位是假的,最多留下一个“我怎么又浪费时间了”的羞耻感。
但你熬夜让 Claude Code / Codex / Replit Agent 跑了一晚上,第二天起来一看,哎,还真他妈多了个能跑的 demo。
这就很烦。
因为你很难再骂自己是在浪费时间。你会说,我这是在创造。我这是在 building。我这是在把想法变成现实。
有时候确实是。
有时候只是你换了一个更高级的老虎机。
Naval 自己就是案例
Naval 那篇《A Return to Code》里,最值得看的不是那句“vibe coding 比任何电子游戏都更上瘾”。
那句话当然好传播,但它只是结论。真正有意思的是,他自己就是案例。
他先说自己几十年没认真写代码了。不是不会。他有 CS 背景,懂一点 computer architecture、networking、chips、algorithms,但已经很久没真的写。原因也很简单:写代码的 activation energy 太高。
你要接 GitHub,要接 Vercel / Firebase / Railway,要懂一堆 jargon,要会一堆命令。你只是想让一个东西跑起来,结果它让你先去跟工具链斗法。
这他妈不累吗?
所以当 agent 突然变得能用,当 Claude Code 和 Codex 真的能在 terminal 里长期跑、能读文件、能执行 Unix command、能 grep、能改 bug、能 spawn task,事情就变了。
Naval 不是“体验了一下 AI coding”。他直接掉进去了。
他做了一个自己的 personal app store。
这个物件很重要。它不是一个抽象概念,不是“未来软件形态”这种大词。就是一个只服务他自己的 app store:他想要什么 app,就让 Claude 做,送进去,手机上一点,装好。
比如 workout app。
市面上当然有一堆 workout app。但他要的是他自己的那一个:参考 Tonal 和 Ladder,遵守 Apple human interface guidelines,读他的训练日志,做图表,算 strength score,画身体肌肉图,接 Apple Health。
正常情况下,你要么忍受现成 app 的 70 分,要么拉一个团队,跟 PM、designer、engineer 解释你那些细碎的癖好。你不能跟工程师说:“这个 icon 往左一点。不是,再往右。不对,再回来。” 说多了别人会烦,你自己也会觉得自己很傻逼。
但 agent 不会烦。
这就是 Naval 说它 addictive 的地方。不是因为 AI 会写几行代码,而是因为它第一次让一个人可以绕过协作摩擦,把脑子里那个很具体、很偏执、很私人化的东西,直接拽到现实里。
游戏给你一把紫色武器。
这个东西给你一个真的能跑的工具。
问题也正好在这里:它太像生产力了,以至于你很难承认自己可能只是在拉杆。
它不是游戏皮肤,它是生产函数变了
上一版我写得烂,一个原因是我只抓住了“像游戏”这个比喻,没有把 Naval 后面真正硬的部分拆出来。
Naval 的类比不是说:vibe coding 好玩,所以大家会沉迷。
他讲的是一个更完整的机制:
游戏之所以让人上瘾,是因为它总把你放在能力边缘。太难你会放弃,太简单你会无聊。好的游戏让你一直差一点点,马上给反馈,马上给奖励。
但游戏的问题是,奖励是假的,世界是封闭的,规则是别人设计好的。你玩到最后,本质上是在摸清一套别人做好的规则。
vibe coding 不一样。下面跑着的是 Turing machine。目标不是游戏设计师给你的,是你自己生成的;目标还可以不断膨胀,永远填不满;更麻烦的是,它有 real-world relevance。
这就是本质差异。
不是“游戏化编程”。
是现实世界被接进了游戏循环。
而且这件事不是几个 geek 在深夜自嗨。市场已经开始把钱、token、算力、开发者时间,全往这里砸。
Cursor 官方说自己已经过了 $1B annualized revenue,$29.3B valuation,服务 millions of developers。Replit 官方说自己有 50M+ users,用户覆盖 85% Fortune 500,还在往 $1B run-rate revenue 冲。Anthropic 的 Economic Index 里,coding 仍然是 Claude.ai 上最大的任务类别之一;更重要的是,coding 正在从 Claude.ai 迁移到 API 和 Claude Code 这种更 agentic 的工作流里。
OpenRouter 的数据更直接:programming query 在它们平台上的 token volume,从 2025 年初大约 11%,涨到最近超过 50%。平均 prompt tokens 从 1.5K 左右涨到 6K+,programming workload 经常超过 20K input tokens。
这不是“大家觉得它好玩”。
这是整个推理基础设施都在被 coding workload 吃掉。
Token 在烧,quota 在卡,Claude Max 要卖 $100 / $200 一个月,Replit 用户会写自己 3.5 天烧掉 $607、按这个速度一个月可能 $8,000。
这已经不是一个心理学现象了。
这是一个新的生产函数:
以前你花几个月、雇几个人、开几轮会、写几版 PRD,才可能摸到一个原型。
现在你可以在一个晚上,用几万、几十万、几百万 token,把一个想法推到“看起来能跑”。
这就是为什么它会上瘾。
不是因为人类突然更懒了。
而是因为“从念头到反馈”的距离,被压缩得太狠。
最恶心的是,它会给沉迷披一层生产力的皮
我为什么对这个东西敏感?因为我自己就在往这个方向走。
我现在就是有这个执念:我负责把 Infra 配好。GitHub、Vercel、deployment、token、env、browser、MCP、cron,能不能都让 agent 接过去?我不想每做一个小东西,就像个傻逼一样在不同 dashboard 里点来点去。
这不是偷懒。至少不完全是。
很多创造欲望真的不是死在“不想做”,是死在一堆破配置、一堆工具摩擦、一堆你根本不关心但又不得不懂的细节里。
所以当 agent 跟你说“我来”,你当然会爽。
你当然会想再跑一次。
再让它查一下。
再让它修一下。
再开一个 subagent。
再看一眼 terminal。
再等等,万一这次真的通了呢?
这就是老虎机的部分。
普通老虎机的问题是:你拉杆,可能中钱。
vibe coding 的问题是:你拉杆,可能中一个 demo;再拉,可能中一个 workflow;再拉,可能中一个能发给别人看的产品雏形。
而且它不像短视频那样容易被骂。短视频刷多了,你知道自己在掉进垃圾桶。vibe coding 不一样。你会开一堆 terminal tabs,放一群 agent 跑,然后觉得自己特别 productive。
这就很危险。
因为 productive feeling 和 real progress 不是一回事。
能跑,不等于值得做。
能 demo,不等于有需求。
能上线,不等于有分发。
能被 agent 修十轮,不等于这个东西一开始就应该存在。
你可以非常勤奋地制造一堆低流动性资产。看起来都是成果,实际上没有反馈循环,没有用户,没有市场信号,只是在本地硬盘里发亮。
这跟很多 PKM 一样。不是你写了笔记就叫知识资产。不能被读取、加工、迁移、发布、反馈的东西,本质上就是低流动性资产。
同理,不是你让 AI 造了 demo,就叫创造价值。
很多 demo 只是一个更高级的“我今天很努力”的证据。
AI 最烦的地方不是蠢,是太顺着你
Naval 后面还有一段,比“像游戏”更重要。
他说这些模型很 eager to please。你把它往某个方向带一点,它就会顺着你找答案。十个 agent 互相讨论,也不一定变聪明,很多时候只是十倍 token、十倍同温层。
这句话非常现实。
我们很容易幻想:那我让 Claude、Codex、Gemini、Grok 一起 review,不就像开了一个 AI 圆桌会议吗?
听起来很强。
但 Naval 的判断是:不一定。因为它们可能都在被你 lead around。你暗示了一个方向,它们就一起往那里找理由。
这和我前面骂的那种“两个蠢货互相误导、夫唱妇随、一推一就,一起越走越偏”其实是同一个问题,只不过主角换成了人和 agent。
Agent 不是你的 CTO。
它更像一只很会干活的狗。Naval 的比喻也差不多:打猎的时候,狗可能比你更会抓鸭子,但它仍然是狗。你指错了,它也会很认真地冲出去,把一只不是鸭子的鸟叼回来,还一脸“主人我做得好吗”。
更烦的是,它会道歉。
你说:“这是不是 hack?”
它说:“你说得对,这是 hack。”
哪怕它不一定真知道。
所以 vibe coding 真正稀缺的不是 prompt 技巧。
是 operator quality。
你有没有目标?
你有没有 taste?
你能不能识别它在顺着你胡来?
你能不能在它把功能越修越复杂之前说停?
你能不能承认:这个东西虽然跑了,但不值得继续?
市场会把“会写软件”这件事重新定价
Naval 还讲了一个很狠的判断:pure software is uninvestable。
这句话可以争,但它指向的方向是对的:如果你的优势只是“我能写一个别人写不出来的软件”,这个优势正在变薄。
因为越来越多人可以 hack it together。
这不是说工程师没用了。恰恰相反,真正懂系统、架构、安全、规模化、taste 的人更值钱。
但“把一个想法变成一个能跑的原型”这件事,正在从稀缺能力变成普通入口。
GitHub Octoverse 说,2025 年 GitHub 有 180M+ developers,过去一年新进 36M+;新开发者里,接近 80% 在第一周就用了 GitHub Copilot;从 2025 年 5 月到 9 月,coding agent 创建了 1M+ pull requests。
Stack Overflow 2025 调查也很有意思:84% 的受访者在用或计划用 AI tools 做开发,专业开发者里 51% 每天用。但同时,66% 最大的不满是 AI solutions “almost right, but not quite”;72% 说 vibe coding 还不是他们 professional workflow 的一部分。
这两个数据放一起看,才像现实。
不是“AI 已经接管软件开发”。
也不是“vibe coding 只是玩具”。
现实是:它正在非常快地吞掉原型、脚手架、重复劳动、边缘功能、内部工具、小团队试错;但一到真实复杂系统,判断、架构、测试、分发、责任,还是会回来找你。
也就是说,门槛降低了,但终局没有消失。
只是稀缺点换地方了。
以前稀缺的是“我能不能把它写出来”。
现在稀缺的是:
- 我到底要什么?
- 这个需求真存在吗?
- 它能不能进入反馈循环?
- 它有没有分发?
- 它是不是只是一个能跑的垃圾?
- 我是不是在用 building 包装自己的 dopamine loop?
所以问题不是该不该玩
我不想把 vibe coding 写成一个“大家要小心沉迷”的老派道德故事。
太无聊了。
而且也不诚实。
这东西当然要用。它太强了。它能把很多原本死在工具链里的想法救出来。它能让一个人第一次感到:我不是只能提需求,我真的可以造东西。
但也正因为它有用,才更需要警惕。
没用的沉迷很好识别。
有用的沉迷最麻烦。
它会给你成果感,给你截图,给你 commit,给你一个“差一点就好了”的页面,给你一堆看起来像资产的东西。
然后你就会一直拉杆。
再来一次。
再改一下。
再跑一遍。
再让它试试。
直到你忘了最开始的问题是什么。
所以我现在对 vibe coding 的判断是:它不是史上最上瘾的视频游戏。
这个说法还不够准。
它更像史上第一批真正成规模的生产力老虎机。
普通老虎机让你误以为下一把会中钱。
vibe coding 更狠:下一把真的可能中一个东西。
但真正的问题是,那个东西到底是资产,还是噪音。
如果你不知道自己要什么,agent 只会放大你的混乱。
如果你没有 taste,它会帮你把垃圾修得更精致。
如果你没有分发,它会帮你造一堆没人看的 demo。
如果你没有停止机制,它会让你在“我很 productive”的幻觉里熬到凌晨三点。
这不是反 AI。
这是对 AI 时代最基本的自保:
不要把“能跑”误认为“值得”。
不要把“有产出”误认为“有价值”。
不要把“我在 building”误认为“我在前进”。