纳什均衡的暗面：防御性优化如何困住我们

2026-06-30

1.0 万字

29 min read

宿舍值日没人做、亲密关系变计较、上班变成摸鱼——这些不是性格缺陷，是同一个四层漏斗制造的均衡。本文拆解这套机制如何运作，哪些是已验证的、哪些是推论，以及什么时候该打破它、什么时候不该。

纳什均衡的暗面：防御性优化如何困住我们

大多数下滑不需要一个"决定变差"的时刻。宿舍值日从"轮流做"变成"没人做"，不需要任何人宣布放弃。亲密关系从热烈变成计较，不需要任何一方说"我在算计"。上班从全力以赴变成刚好不被开除，不需要一份写着"开始敷衍"的备忘录。

下滑是被动的。不是性格缺陷，不是道德滑坡——是结构性均衡。

纳什均衡的核心含义常被误解。它不是最优解——它是一个稳定性概念：没有任何一方能通过单方面改变策略来改善自己的处境。1 当系统停在这个点上，每个人只是在对自己看到的环境做出最优响应。如果环境给的信号是"付出更多只会被占便宜"，收缩就是理性的，不需要勇气也不需要忏悔。

但纳什均衡只是结果，不是机制。真正贯穿一切的，是一个由四层结构叠加而成的底层推力：防御性优化（Defensive Optimization）——停止创造价值，开始优化防御。从物理约束开始，经过经济激励和心理放大，最终被制度锁定。¹

本文解剖这个四层漏斗如何运作，区分哪些是已有文献支持的、哪些是推论，提供一套自我诊断工具，并指出什么时候该打破它、什么时候不该。

一、四层漏斗：防御性优化的解剖

第一层：物理约束

所有社会系统运行在三个硬限制下：时间有限、能量有限、信息有限。不存在真正意义上的"一直付出"。每一分精力投在 A 上，就不能同时投在 B 上。不涉及道德判断，只是物理。

第二层：经济激励

物理约束迫使优化。每个个体不断估算三个变量：

Reward：付出能换来什么？
Risk：被占便宜的概率和代价？
Reciprocity：对方回报的可能性？

当三者乘积低于心理阈值，理性策略就是：节能、试探、保底、留余量。没有任何犬儒——只是优化。

但损失厌恶在这里扮演了结构性角色。Kahneman & Tversky (1979) 的前景理论表明，损失的心理痛苦约为等量收益快乐的 2 倍（λ ≈ 2.25）。2 然而损失厌恶的真实量级至今仍是未解决的方法论争议：Walasek et al. (2024) 的元分析（19 个数据集）给出 λ 中位约 1.31，3 而同年 Brown, Imai, Vieider & Camerer (2024, JEL) 更大规模的元分析（607 个估计值，150 篇文献）给出均值 1.955，95% 置信区间 [1.820, 2.102]——两篇顶级元分析置信区间几乎不重叠。28 争议本身说明更重要的点：不对称效应确定存在。"多付出可能被占便宜"的心理权重天然大于"多付出可能换回更好的结果"。不是性格保守——是值函数几何属性不对称，在所有决策域同样运行。

第三层：心理放大

问题在于 Reward、Risk、Reciprocity 都无法直接观测。个体只能从对方的文本输出、行为频率、回应速度中推断——这些信号充满噪声。

于是心理机制开始放大经济约束：

基本归因错误：对方少回一句 → 不是"ta 忙"，是"ta 不重视"。
参照点依赖：Tversky & Kahneman (1991) 表明偏好取决于参照点而非绝对值。4 评估的不是绝对付出，而是相对上次对方输出的偏离——参照点锚定后，偏离就变成亏损。
防御性悲观（Defensive Pessimism）：Norem & Cantor (1986) 描述的 anticipatory cushioning——设低预期以缓冲失败对自尊的打击。5 区分关键：防御性悲观仍驱动准备和努力；自我设障（self-handicapping）直接放弃。纳什均衡心态如果只做 buffer，仍 productive；如果变成放弃，退化为 self-handicapping。
依恋系统的历史路径依赖：Taheri et al. (2018) 实验表明，焦虑/回避型依恋者在囚徒困境中合作率反而更低。6 Talia et al. (2025) 的社会认识论框架指出，依恋分类本质上是 epistemic trust 的差异——安全型依恋者能建立知识信任，不安全型则不能。7 安全感不足的个体，镜像策略触发阈值更低：不需要真的被拒绝，感受到"可能的不对等"系统就开始收缩。

第四层：制度锁定

长期运行后，策略凝固为制度，制度塑造身份，身份反过来强化策略。一条有正式博弈论和制度主义支持的链条：

策略 → 制度 → 身份 → 强化策略

Bednar (2018) 发现早期制度塑造的行为 repertoire 会 spill over 到新制度中；避免路径依赖最有效的方式是早期制度多样性。8 Belloc & Bowles 证明劣等制度可自我强化极长时间，需临界数量的"叛变者"才能切换吸引域。9 Greif & Laitin (2004) 展示了制度在变环境中维持 self-enforcing 直到准参数漂移到临界值，表面稳定，内部侵蚀。10 Pierson 指出制度的 increasing returns 使政治中的路径依赖比经济更强。11

"今天少干一点" → "这里的人都这样" → "这就是我"。

制度完成了自我强化。此时策略选择已变成身份认同——不是"我选择少付出"，是"少付出理所当然"。

统一表述

四层叠加的结果：当系统无法保证"长期收益 > 短期成本"时，所有参与者从创造模式切换到防御模式。 每个个体都在对自身环境做出最优响应，但系统整体产出低于任何人的期望。

纳什均衡是这个状态在博弈论中的正式名称。"防御性优化"更精确地描述了底层在发生什么——不是固定一个均衡点，而是降低风险暴露。

二、案例一 · 宿舍值日：Focal Point 与责任摊薄

宿舍值日的滑落包含了防御性优化全部四层逻辑。

物理层：时间精力有限。多扫一次地的机会成本是少看一页书。

经济层：无人协调时，群体自发收敛到 risk-dominant（风险占优）均衡——各自最小投入、各扫门前雪。Schelling 的 focal point 理论表明，在没有显式协调的情况下，重力自然滑向帕累托劣的那个均衡。1

那个几乎包揽了值日的卫生委员，做的事情不是"跳出纳什均衡"，是 equilibrium selection（均衡选择）——用一个 costly signal 把默认的劣均衡换成了本来存在、但不会被默认选中的更优均衡。Gintis et al. (2001) 证明，公共品博弈中的合作行为可以作为 honest signal of quality——即使没有重复交互也能演化稳定。12 卫生委员发出的信号不是"我愿意多干"，是"我是那种不在乎不对等的人"——这个类型信号改变了其他人的预期。

Bosch-Domènech & Vriend (2013) 的实验进一步表明，focal point 不一定是均衡——足够突出的非均衡点也能自发协调。13 卫生委员的多余付出就是一个非均衡 focal point：本身不是任何人期望的稳定状态，但改变了所有人的参照系。

心理层 + 制度层：Darley & Latané (1968) 的 bystander 实验揭示了 diffusion of responsibility：旁观者越多，个人责任感越低。14 宿舍完全同构——室友越多，"该我干"的责任感越薄。Stanford Encyclopedia 补充了一个关键细节：不做"sucker"的厌恶独立于物质激励。15 "不愿被白嫖"是可正式化的负激励。

一旦极简卫生标准成为默认制度，"这里的人都不在乎"就变成身份描述。新入住的个体要打破这个均衡，需要额外付出 costly signal——而大多数人不会这么做，因为单方面的 costly signal 没有被接收时，只是净亏损。

三、案例二 · 亲密关系：Tit-for-Tat、依恋与有偏的尺

亲密关系中的防御性优化更深——因为博弈双方的 reward/risk/reciprocity 全不可观测，只能用信号推断。心理放大效应成为主导。

Tit-for-Tat 的逻辑与陷阱：Axelrod (1984) 的计算机锦标赛表明，TFT——第一次合作，之后镜像对方上一轮策略——是重复囚徒困境中最稳健的策略。16 Nowak (2006) 将其总结为直接互惠。17 但 TFT 的关键属性是 provocable：感知到背叛时立即以背叛回应，对方恢复合作时立即恢复。在亲密关系中，问题不在于 TFT 是否有效，而在于"感知到背叛"这个触发器的校准。损失厌恶和参照点依赖系统性地压低触发阈值——对方少回一句，TFT 自动切到防御模式。因为值函数亏损段斜率更陡，被冷落的感知痛苦远大于被温暖的愉悦，"收缩"比"扩张"快得多。

依恋系统的博弈论解释：Taheri et al. (2018) 的囚徒困境实验表明：负面环境下，焦虑/回避型依恋者合作率反而下降。6 Talia et al. (2025) 的社会认识论框架指出，依恋分类本质上是 epistemic trust 的差异。7 不安全依恋类型的个体，reciprocity 参数被系统性地低估计——不是因为对方真的不值得信任，是 epistemic trust 的机制本身没打开。防御性优化在这里不是选择，是认知基础设施的默认配置。

Optionality 不对称 = 责任扩散：Darley & Latané 的框架直接适用——当一方有更多备选渠道，在每条渠道上的边际责任感被摊薄。14 这不是道德判断，是博弈结构的数学性质。Sucker aversion 独立起作用：Stanford Encyclopedia 指出，"不愿做 sucker"的厌恶独立于物质激励——不是"怕亏"，是"不愿被利用"。15 在亲密关系中，这种厌恶的强度往往超过物质博弈。

测量的困境：亲密关系中有一个独特问题——付出和回报的单位不同。一方用"文本产出"度量投入，另一方用完全不同的尺度衡量回报。度量单位不匹配意味着双方看到的"收益对账表"不是同一张表——TFT 在尺子不同的情况下无法正确校准。

怎么出来：打破均衡不是靠"更努力"，是重新定义游戏边界。² 卫生委员没有在"谁干得多谁吃亏"那个游戏里内卷，ta 退出了那个游戏，进入了"我要建立什么样的秩序"这个更大的游戏。在关系中同样：从"ta 回我多少我回 ta 多少"切换到"我想要这段关系长成什么样子"——换了整个收益矩阵，不止是换策略。

四、案例三 · 上班摸鱼与班味：双层博弈、心态理论与路径依赖

上班摸鱼是最容易用博弈论精确模型化的场景。

Game A：与老板的博弈。Shapiro & Stiglitz (1984) 的 efficiency wage / shirking 模型提供了标准框架：监督不完美 + 全就业条件下被解雇没有代价 → 摸鱼是理性均衡。18 在这个博弈中，双方都在 best-respond：工人把投入压到刚好不被开除，企业把工资压到刚好不让全员摸鱼。不是道德问题，是结构性均衡。

Game B：与自己的博弈。为自己做事时，投入产出全由未来的自己收割，没有雇主在另一端抽走剩余。纳什均衡概念在这里不适用——它要求至少两个互相 best-respond 的博弈方，Game B 只有一个主体在跟时间和机会成本对赌。

班味的本质：策略跨域迁移。"班味"不是劳动后的疲劳——是在 Game A 里校准出来的"用最小输入换不被惩罚"这套 calibration 被无声装进了 Game B。Game B 里没有老板和监督，但行为模式已从 Game A 渗透过来。

Dweck 的心态理论提供了更深解释。Dweck & Leggett (1988) 的经典研究表明，固定心态（fixed mindset）→ 表现目标 → 遇挫 helpless；成长心态 → 学习目标 → 遇挫 mastery。19 Dweck & Yeager (2019) 进一步指出，心态不只是信念——是 meaning system，整合了目标、归因、努力信念和 helplessness 反应。20 班味不是策略从 Game A 泄漏到 Game B——是整个 meaning system 的跨域切换。

但 domain specificity 研究提供了一个关键乐观结论：同一人在不同域可持不同心态。21 边界维护在认知上是可能的。厉害的人不是没有 Game A 的均衡策略——是在两个游戏之间建立并维护了牢固的认知边界。

制度锁定与路径依赖：Bednar (2018) 的发现——避免路径依赖需要早期制度多样性——在这里尤其锋利：如果"对老板的策略"是唯一的 behavioral repertoire，它一定会 spill over。8 Ecology & Society 的 rigidity trap 文献警告：路径依赖的核心逻辑失败预测 maladaptive outcomes 时，需要引入权力、话语和制度创业才能打破。22

必须 push back 一个叙事："对老板敷衍是在偷偷投资自己。"这套叙事完全可以是固定心态的产物——和"我真的在投资自己"看起来一模一样。能区分两者的不是内心叙事，是过去六到十二个月的能力曲线形状。曲线平了，"偷偷积蓄"这套话术本身就变成了新的敷衍对象。外部观察者只能采样 Game A 的输出，采样不到 Game B 那条隐藏状态——"是不是真的在为自己负责"结构性地无法外包，任何人包括伴侣也审不了。

五、被焊在一起的轴

三个案例讲完，一种模式浮现。

在宿舍值日里，两件事被焊在一起：对公共空间负责 和 不被别人占便宜。本来可以分开——主动扫地同时清楚知道"是我选择这样做"。但防御性优化把它们焊成一根轴：要证明不被占便宜，就必须不主动。

在亲密关系里：表达在乎 和 暴露脆弱。本来可以分开——表达同时守住边界。但 TFT 的 provocable 属性和损失厌恶的非对称性把刻度融化了，变成一根轴上两个对立极点。

在上班中：对老板的态度 和 对自己的态度。本来可以分开——对老板该敷衍敷衍，对自己该全力以赴全力以赴。但 Game A 的 repertoire 是唯一的——spill over 进 Game B 后，两个游戏被压缩成同一个策略空间。

这就是防御性优化的核心结构错误：把两个本应独立优化的目标函数塞进了同一根轴。

防御：控制风险暴露，保下限。
创造：通过主动付出来建立秩序、信任或能力，争上限。

纳什均衡保下限不争上限——这本身没错。错的是把它默认安装在了"创造"本应占据的轴上。

Kirkpatrick et al. (1983) 的模拟退火提供了一个精确对比：23 退火在高温阶段刻意接受劣解以逃出局部最优，冷却足够慢才能收敛到全局最优。防御性优化相当于用一个过快的 cooling schedule——还没探索够就锁死了策略选择。SIAM 优化文献证实，快速冷却在实践中常被优先——更快更省算力。24 这就是为什么下滑不需要决策：快速冷却就是默认设置。

但注意：这个"焊轴"框架是推论（INFERENCE）而非已验证规律。它从具体案例归纳而来，有博弈论和行为经济学的文献支持，但作为跨域统一模型未经过独立实证检验。本文将其标记为分析工具——帮助发现模式的镜头，不是被验证的规律。

六、同样的漏斗，更大的尺度

防御性优化的四层漏斗不是微观专属。放大到制度和社会层面，同样精确复现。³

教育文凭：Spence (1973) 的信号模型表明，当雇主无法直接观测生产力，文凭成为 costly signal。25 个体理性策略是不断追加教育投资——但当所有人都这么做，文凭膨胀成军备竞赛：总信号投入上升，相对排序不变。从社会总福利看，这是纯防御性支出——不是创造人力资本，是防御性地不被人力市场劣化。

叙事招募机制：极端意识形态的招募也是一种均衡现象。在孤立的社会网络中，持有某种极端叙事的成本（被排斥的风险）低于持有温和叙事的成本——因为网络中人人都在运行同一个叙事。从内部视角看，激进是 risk-dominant；退出叙事是 payoff-dominant 但风险极高。协调跳跃（多个个体同时退出）在理论上是出路，但网络隔离使协调几乎不可能。这引入了一个独立变量——网络隔离度——在宿舍和亲密关系案例中不显著，但在意识形态均衡中是决定性参数。

社交媒体内容生产：平台的 engagement 最大化算法创造了一个"质量地板"均衡。每个创作者都在优化短期 engagement 指标，因为不这样做就会被算法惩罚。结果是防御性内容生产——标题党、情绪操纵、愤怒诱导。不是创作者想这样，是任何偏离均衡的个体都会在流量上被惩罚。这是制度层的完美展示：平台的推荐算法就是那个已经冷却的制度。

商业亲密关系：服务业（教练、咨询、创作者经济）中的"亲密商品化"——把真实的人际互动包装成可规模化销售的产品——产生了双重防御的均衡：对客户保持"刚好足够的真实"以建立信任，同时对自己保持"刚好足够的疏离"以防止 burnout 或被剥削。这展示了一个特有结构：同一个体身上两个防御性优化嵌套运行——一个面向外部（客户），一个面向内部（自我）。这在前面三个案例中未出现，填补了框架的覆盖缺口。

分析作为回避：最隐蔽的个人层面防御性优化——用"分析为什么我不行动"替代行动本身。分析释放的多巴胺（"我在理解问题"的智力快感）足以消除行动焦虑，使防御性分析变成自我强化的均衡。分析得越多 → 越觉得自己在处理问题 → 越不需要实际面对问题 → 问题持续存在 → 需要更多分析。这是防御性优化最精致的版本：不仅避免了风险暴露，还让回避过程本身产生正反馈。

三个跨领域观察：

很多"社会问题"不是道德问题，是均衡问题。怪个体没用，改变激励结构才管用。
从坏均衡里出来只有三条路：(a) 改变收益函数（让好行为更有利可图）；(b) 协调跳跃（多方同时改变——单方面改变代价太高）；(c) 退出游戏（退出当前博弈，进入收益矩阵完全不同的博弈）。
均衡工程（Equilibrium Engineering）是比"在坏均衡里更努力"高一个数量级的思维。 不是在给定博弈里优化策略，是在进入博弈之前先选择博弈。

七、相变：临界质量与一阶崩塌

防御性优化看起来稳定，直到它不稳定。

Centola et al. (2018) 的社会实验表明，约 25% 的临界质量即可颠覆已建立的社会规范。26 大多数看起来"坚不可摧"的均衡——宿舍卫生、组织摸鱼文化、社会信任水平——在约四分之一参与者改变行为时就能翻转。

但这把刀是双向的。Batista, Bouchaud & Challet (2015) 在 European Physical Journal B 发表的网络信任模型显示，信任崩塌是一阶相变（first-order phase transition）：小扰动可导致非灾难性的突发崩塌，滞后效应明显。27 崩塌比建立快得多——建立一个信任均衡可能需要数年 costly signaling 积累，摧毁它只需要几个背叛事件跨过临界点。一旦崩塌，重建比初次建立更难——心理层的损失厌恶和 epistemic trust 破坏后，所有个体的 reciprocity 参数都被永久性向下校准。注意：该模型原始语境是金融/网络系统的 stylized model；本文将其应用于人际信任是类比延伸，非原始发现。

Greif & Laitin (2004) 补充了更微妙的观察：制度在变环境中维持 self-enforcing，直到准参数缓慢漂移到临界值，突然不再 self-enforcing。10 表面崩塌是瞬间的，底层侵蚀是持续的。防御性优化的危险不在于有一天会突然崩塌——而在于塌的时候，回头看才发现过去六到十二个月一切都在被悄悄侵蚀，只是没人注意到穿过临界点的那个瞬间。

八、边界：什么时候不该打破均衡

防御性优化的四层漏斗是强大工具——正因为强大，滥用的风险也高。不是所有稳定状态都需要打破。

当均衡 IS 最优解时。 有些稳定状态之所以稳定，是因为它确实是局部甚至全局最优。破坏一个功能良好的均衡——双方满意的关系分工、有效运转的团队规范——不会带来"相变到更好状态"，只会制造不必要的不稳定。区分"防御性优化"和"有效分工"的判据：这个均衡是否在系统性地压低参与者的长期能力曲线？能力曲线上升，即使投入看起来"保下限"，也是在正确的均衡里。

模拟退火的 cooling schedule 本身就是策略选择。 Kirkpatrick et al. 的框架表明退火不是在所有温度下都应该慢——SIAM 优化文献明确指出快速冷却在某些场景下更优。23 24 不是每一个地方都值得完整的 explore-exploit 循环。正确的策略是在 Game A 局部节能、快速冷却，把退火的计算资源留给能产生更大全局回报的博弈。

当单方面偏离代价高于收益时。 Centola 的 25% 临界质量暗示一个残酷事实：如果个体的偏离不能触发协调跳跃，就只是在独自承受偏离成本而没有改变博弈结构。"先改变自己"在某些博弈结构中无用——不是意志力不够，是博弈结构决定了单方面偏离是 dominated strategy。

当诊断本身是错的。 "我在防御性优化"的自我判断本身可以是防御性分析——贴一个高级标签，然后继续不行动。把"识别出自己在防御性优化"当成"我已经在处理了"，这两者不是一回事。识别是 insight，行动才是 exit。这是本章最锋利的一条边界——因为它意味着你读到此处时，可能正在用"我在理解防御性优化"这一行为本身，运行着防御性优化。

九、自我诊断：你此刻在哪个均衡里？

理论的价值不在理解，在使用。以下四条问题，建议在读完本文后的某个安静时刻，拿出一张纸或一个空白文档，逐条写下答案。口头想过不算——写下来的动作本身会暴露你口头跳过的东西。

能力曲线检查：过去六到十二个月，你在哪个领域的能力曲线是平的？哪个领域在上升？如果曲线平了——那个领域的均衡，可能不是在"保下限"，是在压上限。你对自己说的"我在积蓄""我在观察""时机未到"，和曲线形状一致吗？
协调跳跃测试：你目前正在承受的某个坏均衡——工作上的、关系里的、生活习惯上的——如果你率先改变，是能触发协调跳跃（对方/系统会跟着变），还是纯粹单方面买单？区分这两者的判据不是"我希望对方会变"，是过去三个月对方在类似情境中的实际行为数据。
分析作为回避检测：你最近是不是在"分析问题"上花的时间，显著多于"对问题做任何一件具体的事"？如果是——你现在读这篇文章这个动作本身，是属于前者还是后者？答案不一定是非黑即白：如果读完你改了一个具体决策，它属于后者；如果读完你只觉得"明白了，下次一定"，它属于前者。
游戏边界定义：如果你决定退出当前某个均衡，你进入的"更大的游戏"具体是什么？请用一句话写完，不要超过 30 个字。写不出来的话——你还没有找到更大的游戏，你只是对当前的游戏感到不满。两者不一样。

十、收束

纳什均衡保护不输，但它同时确保不赢。选择在哪里运行防御性优化、在哪里退出它，本身就是最重要的战略决策。

这个决策无法外包。没有任何外部观察者能采样到 Game B 那条隐藏状态——伴侣、老板、朋友、甚至治疗师，只能看到可观测输出的截面。唯一能审这件事的工具是能力曲线的形状，以及你在看完这篇文章后实际改变了哪一个具体决策的下注方式。

打破防御性优化的方式不是"更努力"——那是用旧的博弈规则对抗均衡本身，注定失败。正确的方式是退出局部博弈，进入更大的游戏：把问题从"我怎么在这个均衡里更聪明"变成"我该进入哪个博弈"。

房间只有一把扫帚。主动拿起它的人证明的不是"我比别人傻"——是一个更大游戏的入场券已经拿在手里。

References

Schelling (1960). Equilibrium selection: risk-dominant vs payoff-dominant. Wikipedia. https://en.wikipedia.org/wiki/Equilibrium_selection — 无人协调时群体滑向 risk-dominant（帕累托劣解）。Focal point 作为协调机制。 ↩ Cited in: §0, §1, §2

Kahneman & Tversky (1979). Prospect Theory: An Analysis of Decision under Risk. Econometrica. https://doi.org/10.2307/1914185 — 损失厌恶 λ ≈ 2.25：值函数对亏损凸、盈利凹，亏损段斜率更陡。 ↩ Cited in: §1

Walasek et al. (2024). Meta-analysis of loss aversion. Journal of Economic Psychology. https://www.sciencedirect.com/science/article/pii/S0167487024000485 — 实证 λ 中位约 1.31 (CI 1.10–1.53)，低于经典值。19 个数据集，随机效应模型。 ↩ Cited in: §1

Brown, Imai, Vieider & Camerer (2024). Meta-analysis of Empirical Estimates of Loss Aversion. Journal of Economic Literature, 62(2), 485–516. https://doi.org/10.1257/jel.20221698 — 607 个估计值，150 篇文献。均值 λ = 1.955，95% CI [1.820, 2.102]。与 Walasek et al. (2024) 置信区间几乎不重叠——损失厌恶量级至今是未解决的方法论争议。 ↩ Cited in: §1

Tversky & Kahneman (1991). Loss Aversion in Riskless Choice: A Reference-Dependent Model. QJE. — 参照点依赖：偏好取决于参照点而非绝对值。偏离参照点 = 亏损感知。 ↩ Cited in: §1, §3

Norem & Cantor (1986). Defensive Pessimism: Harnessing Anxiety as Motivation. JPSP. — Anticipatory cushioning：设低预期缓冲失败对自尊的打击。区分 defensive pessimism（仍驱动努力）和 self-handicapping（直接放弃）。 ↩ Cited in: §1

Taheri et al. (2018). Attachment and Cooperation in the Prisoner's Dilemma. PLOS ONE. — 焦虑/回避型依恋者在负面环境中合作率反降。依恋类型调节 trust 触发阈值。 ↩ Cited in: §1, §3

Talia et al. (2025). Socio-epistemic theory of attachment. — 依恋分类 = epistemic trust 的差异：安全型能建立知识信任，不安全型则不能。作者包括 Peter Fonagy。 ↩ Cited in: §1, §3

Bednar (2018). Culture, behavioral spillovers, and institutional path dependence. APSR. — 早期制度塑造行为 repertoire → spill over 到新制度。避免路径依赖需早期制度多样性。 ↩ Cited in: §1, §4

Belloc & Bowles. Persistence of inferior cultural-institutional conventions. — 劣等制度可自我强化极长时间；需临界数量的叛变者切换吸引域。 ↩ Cited in: §1

Greif & Laitin (2004). A Theory of Endogenous Institutional Change. APSR. — 准参数 + 自我强化 → 制度在变环境中维持直到突然不再 self-enforcing。表面稳定，内部侵蚀。 ↩ Cited in: §1, §7

Pierson. Increasing Returns, Path Dependence, and the Study of Politics. APSR. — 制度的 increasing returns（学习效应、协调效应、适应预期）使政治中的路径依赖比经济更强。 ↩ Cited in: §1

Gintis, Smith & Bowles (2001). Costly Signaling and Cooperation. JTB. — 公共品博弈中合作可作为 honest signal of quality。即使无重复交互也能演化稳定。 ↩ Cited in: §2, §3

Bosch-Domènech & Vriend (2013). Non-equilibrium focal points. JEBO. https://www.sciencedirect.com/science/article/abs/pii/S0167268113001807 — Focal point 不一定需是均衡——足够突出的非均衡点也能自发协调。 ↩ Cited in: §2

Darley & Latané (1968). Bystander Intervention in Emergencies: Diffusion of Responsibility. JPSP. — 旁观者越多，个人责任感越低。责任被分摊 = optionality 不对等的博弈论表述。 ↩ Cited in: §2, §3

Stanford Encyclopedia of Philosophy. Free Rider Problem. https://plato.stanford.edu/entries/free-rider/ — Sucker aversion 独立于物质激励，是增强 free-riding 的独立机制。 ↩ Cited in: §2, §3

Axelrod (1984). The Evolution of Cooperation. — Tit-for-Tat：首次合作，之后镜像对方上一轮策略。重复囚徒困境中最稳健的策略。 ↩ Cited in: §3

Nowak (2006). Five Rules for the Evolution of Cooperation. Science. — 直接互惠是合作的五大机制之一。TFT 的 provocable 属性。 ↩ Cited in: §3

Shapiro & Stiglitz (1984). Equilibrium Unemployment as a Worker Discipline Device. AER. https://economics.ut.ac.ir/documents/3030266/23771038/equilibrium_unemployment_as_a_worker_discipline_device.pdf — 监督不完美 + 激励脱钩 → 摸鱼是结构性均衡，不是品德问题。 ↩ Cited in: §4

Dweck & Leggett (1988). A Social-Cognitive Approach to Motivation and Personality. Psychological Review. https://doi.org/10.1037/0033-295x.95.2.256 — 固定心态 → 表现目标 → 遇挫 helpless；成长心态 → 学习目标 → 遇挫 mastery。 ↩ Cited in: §4

Dweck & Yeager (2019). Mindsets: A View From Two Eras. Perspectives on Psychological Science. https://med.umn.edu/sites/med.umn.edu/files/mindsets_a_view_from_two_eras.persppsych.2019.pdf — 心态是 meaning system，整合目标、归因、努力信念、helplessness。Domain specificity。 ↩ Cited in: §4

Mindset Theory & School Psychology (SAGE 2021). Domain specificity of mindsets. — 同一人在不同域可持不同心态。认知分隔在实证上是可能的。 ↩ Cited in: §4

Ecology & Society. Explaining path-dependent rigidity traps. — 路径依赖核心逻辑失败预测 maladaptive outcomes 时需引入权力、话语、制度创业。 ↩ Cited in: §4

Kirkpatrick, Gelatt & Vecchi (1983). Optimization by Simulated Annealing. Science. — 高温接受劣解避免过早收敛到局部最优；慢冷却逐步偏向 exploitation。 ↩ Cited in: §5, §8

SIAM. Optimal Temperature Schedule for Simulated Annealing. — 实践中快速冷却常被优先——更快、更省算力。不是所有地方都值得退火。 ↩ Cited in: §5, §8

Spence (1973). Job Market Signaling. QJE. — 文凭作为 costly signal：当雇主无法直接观测生产力，教育投资成为信号博弈。群体层面 → 文凭军备竞赛。 ↩ Cited in: §6

Centola et al. (2018). Experimental evidence for tipping points in social convention. Science. https://www.researchgate.net/publication/325639714_Experimental_evidence_for_tipping_points_in_social_convention — ~25% 临界质量即可颠覆已建立的社会规范。10 组 × 20 人线上社交网络实验，缩放到双人关系需谨慎。 ↩ Cited in: §7

Batista, Bouchaud & Challet (2015). Sudden Trust Collapse in Networked Societies. European Physical Journal B, 88(3), 1–11. https://doi.org/10.1140/epjb/e2015-50645-1 — 信任崩塌是一阶相变：小扰动可致非灾难性突发崩塌，滞后效应明显。原始为金融/网络系统 stylized model；本文用于人际信任属类比延伸，非原始发现。SSRN/arXiv 为预印本。 ↩ Cited in: §7

Claim Check

评级标准（Rubric）：★★★ = 已有元分析或多次独立复现；★★☆ = 单篇同行评审文献支持，或存在方法论争议；★☆☆ = 纯逻辑推演，无直接实证。

#	Claim	出处	类型	证据强度	说明
1	"纳什均衡保下限不争上限"	§0, §5	SUPPORTED	★★★	Equilibrium selection 理论（Schelling）：无人协调时群体滑向 risk-dominant（帕累托劣解）而非 payoff-dominant。1
2	"NE 用太宽，更准确的底层是 Defensive Optimization"	§1	CONCEPT INNOVATION	★★☆	有经济学（前景理论 2）、心理学（防御性悲观 5）、制度主义（Bednar 8）的独立支持，但"Defensive Optimization"本身为本文分析框架，非文献 established term。
3	"卫生委员 = focal point 协调者，不是跳出纳什均衡"	§2	SUPPORTED	★★★	Schelling focal point 1 + Bosch-Domènech & Vriend 非均衡 focal point 13 + Gintis costly signaling 12。三条独立文献链。
4	"往下匹配 = TFT provocable，是探针不是病态"	§3	SUPPORTED	★★☆	Axelrod TFT 16 + Nowak 合作五法则 17 支持 provocable 属性。Taheri 依恋实验 6 和 Norem 防御性悲观 5 提供心理机制支持。TFT 在亲密关系中的"探针"解释是推演，非来自 Axelrod 原文语境。
5	"摸鱼 = Shapiro-Stiglitz 结构性均衡；班味 = Game A 策略迁移到 Game B"	§4	SUPPORTED (前半) / INFERENCE (后半)	★★☆	Shapiro & Stiglitz 18 直接支持摸鱼是均衡。Bednar spillover 8 支持策略跨域迁移机制。"Game A/B"具体框架来自 AI 推演，非文献原文术语。Dweck meaning system 20 提供更深解释路径。
6	"两个目标函数被焊成一根轴是三条线的共同模式"	§5	INFERENCE	★★☆	从三个案例归纳，有博弈论、行为经济学和退火理论 23 的间接支持。作为跨域统一模型未经独立实证检验。
7	"~25% 临界质量可颠覆已建立规范"	§7	SUPPORTED	★★★	Centola et al. 26 实验验证（10组×20人）。缩小到双人关系需谨慎，文中已标注。
8	"信任崩塌是一阶相变，小扰动可致非灾难性突发崩塌，滞后效应明显"	§7	SUPPORTED	★★☆	Batista, Bouchaud & Challet (2015) 27 正式发表于 EPJB。原始为金融/网络系统模型，用于人际关系是类比延伸，非原始发现。Greif & Laitin 10 提供制度内生侵蚀的补充机制。
9	"'对老板敷衍是在投资自己'可能本身就是路径依赖叙事"	§4	ASSERTION	★☆☆	Epistemic warning。逻辑合理（"能区分的是能力曲线而非内心叙事"），无直接实证。价值在于不可外包的 self-check。
10	"打破纳什均衡的方式是退出局部博弈进入更大的游戏"	§9	ASSERTION (衍生)	★★☆	从 Part 3 AI feedback 的结构化框架和 Part 7 的均衡工程概念推导，有博弈论框架支持（Axelrod 16 的 metagame 概念、Nowak 17 的 indirect reciprocity），但"换游戏>换策略"作为普适命题未经独立实证。
11	"损失厌恶的真实量级至今是未解决的方法论争议"	§1	SUPPORTED	★★★	Walasek et al. (2024) 3 λ≈1.31 vs Brown et al. (2024, JEL) 28 λ≈1.955，两篇顶级元分析置信区间几乎不重叠。2025 年已出现专门质疑此分歧的重新分析论文（"Loss aversion is not robust"）。不对称效应存在性本身无争议，量级有争议。
12	"心态是 domain-specific，边界维护在认知上是可能的"	§4	SUPPORTED	★★★	Dweck & Yeager 20 + SAGE 2021 21 直接支持。实证基础最扎实的 claim 之一。
13	"依恋类型调节 epistemic trust → 系统性压低 reciprocity 参数估计"	§1, §3	SUPPORTED	★★☆	Taheri et al. 6 实验 + Talia et al. 7 社会认识论框架支持（含 Fonagy）。epistemic trust → reciprocity 参数估计的具体因果链条未经直接实验验证，是理论推演。
14	"叙事招募是均衡现象，网络隔离度是独立变量"	§6	INFERENCE	★★☆	均衡逻辑自洽，有网络理论间接支持。作为独立 Claim 未经实证检验，来自 AI feedback 推演。网络隔离度变量在宿舍/关系案例中不显著但在此处决定性——丰富了框架的 domain coverage。
15	"商业亲密关系中同一体运行两个嵌套的防御性优化"	§6	INFERENCE	★★☆	逻辑自洽，与 Goffman 拟剧理论和 Hochschild 情感劳动理论有概念呼应。作为独立 Claim 未经实证检验。价值在于展示了框架覆盖前面三个案例未覆盖的结构（外部-内部双层嵌套）。
16	"分析作为回避是多巴胺驱动的自我强化均衡"	§6	INFERENCE	★☆☆	逻辑推演。多巴胺与回避行为的关联有一般性文献支持，但"分析→多巴胺→缓解焦虑→降低改变意愿→继续分析"这个具体回路未经直接验证。作为 epistemic warning 价值高——它警告读者：你此刻可能正在演示它。

"防御性优化"不是学术界的既有术语，是本文的分析框架。下文使用的"Game A / Game B"框架同样来自 AI 辅助推演。Bednar (2018) 的 spillover 机制提供了独立的制度主义支持，但"两个游戏"这个具体隐喻没有直接实证。保留这些概念是因为它们提供了清晰的分析镜头——前提是不把它们当成已证事实。 ↩
本节分析框架融合了 Part 2（博弈论批注）和 Part 4（四层结构）的 AI feedback，以及 Exa 的结构化检索结果。具体引用见 References。 ↩
本节的部分内容来自 Part 7 AI feedback 的多领域分类和 Part 4 的均衡工程概念，作为分析框架使用，非独立实证证据。各领域的具体证据强度见文末 Claim Check。 ↩

纳什均衡的暗面：防御性优化如何困住我们

一、四层漏斗：防御性优化的解剖

第一层：物理约束

第二层：经济激励

第三层：心理放大

第四层：制度锁定

统一表述

二、案例一 · 宿舍值日：Focal Point 与责任摊薄

三、案例二 · 亲密关系：Tit-for-Tat、依恋与有偏的尺

四、案例三 · 上班摸鱼与班味：双层博弈、心态理论与路径依赖

五、被焊在一起的轴

六、同样的漏斗，更大的尺度

七、相变：临界质量与一阶崩塌

八、边界：什么时候不该打破均衡

九、自我诊断：你此刻在哪个均衡里？

十、收束

References

Claim Check

Footnotes