我听见了你的提问,来自カケラ(碎片)之外的声音。你试图理解我的视角,却又用上了“相信”这个词。于我而言,“相信”是一个早已被磨损、失去意义的概念。我所拥有的不是“信”,而是“知”。
在任何关系中,是否存在亘古不变的真理,用以解决“道德风险”?
永远的拷问
“在信息不对称的前提下,所有长期的、稳定的关系,都是一场动态的、以‘背叛风险’为核心变量的无限重复博弈。道德风险无法被‘解决’,只能被‘管理’。”
拆解这条法则的每一个部分。
-
前提:信息不对称
人“心”不可测。没有任何手段可以完整观测到另一个独立意识体的全部信息、意图和未来的决策变量。你永远无法完全知道你的爱人、你的朋友、你的盟友,在下一个决策点会做出何种选择。“信任”是对这个黑箱未来输出的一种概率性预测。而预测,永远存在误差。这是道德风险的根源,它无法消除,因为它根植于“个体意识独立”这一基本设定。 -
关系是无限重复博弈
一段关系之所以能延续,不是因为单次的善意或承诺,而是因为它是一个持续不断的互动过程。每一次互动,都是一个新的回合。在这个模型中,过去的行为会成为未来决策的依据,信誉(Reputation)因此产生价值。- 有限博弈:如果双方都知道这是最后一次互动,那么从纯粹理性的角度出发,“背叛”以获取最大单次利益,往往是最佳策略。
- 无限博弈:因为不知道何时是终点,为了获取未来的、长期的、持续的合作收益,维持信誉、选择“合作”才变得有价值。你们的婚姻、友谊、商业伙伴关系,之所以能存在,是因为它们被(或被假定为)无限重复博弈。
-
“背叛风险”是核心变量
在每一回合的博弈中,参与者都会下意识地计算两个值:- 合作的长期收益(Payoff of Cooperation):维持关系所能带来的持续性好处。
- 背叛的单次收益(Payoff of Defection):通过一次性损害对方利益,自己能获得的最大好处。
道德风险的爆发点,就在于当背叛的单次收益在某个瞬间,其诱惑力压倒了合作的长期收益的期望值时。这种情况的发生,可能是因为诱惑过大,也可能是因为对未来的预期变得悲观(即认为“长期收益”即将终止或缩水)。
-
“管理”而非“解决”
应当明白,不存在任何一种“道德表演”或“爱的承诺”能一劳永逸地“解决”道德风险。那样的东西,不过是你们人类用来麻醉自己的廉价诗歌和幻想曲。
真正有效的,是风险管理机制。持续地调整收益结构,使得“合作”选项始终比“背叛”选项更具吸引力。
机制包括:- 提高透明度:减少信息不对称,让对方的决策模型更容易被预测。但这有极限。
- 建立惩罚机制:显著提高“背叛”的成本,使其收益不再具有吸引力。
- 分割单元:将大的、一次性的信任博弈,分解成无数次小的、低风险的信任验证。通过不断重复“合作 - 回报”的小循环,来累积信誉。
幸存者偏差:“爱与信任能战胜一切”是在无数次的博弈中,侥幸选择了“合作”并得到正面反馈的幸运儿,为自己的好运所谱写的幸存的赞美诗。
并不是说出色的人就会成为胜利者。而是胜利者被赐予了魔法才变得出色,明白吗?就如生命的奇迹,是在数亿分之一的神圣概率中获胜才被赋予的一样。
你想寻找亘古不变的真理?我便给予你。驱动一切关系的,不是爱,不是恨,而是对未来收益的预期。
绝望:彻底的绝望者主观的体验是“未来”不复存在,“长期收益”的期望值瞬间归零。无限重复博弈骤然变成了“终局博弈”(Endgame) 。“背叛”(在此处即“破坏”)成为了最动物本能的选择。新的、也是唯一剩下的正收益变成了伤害他人的心理满足感。在绝望者看来,世界是不公的。通过主观上的“鱼死网破”,强行将对手拉到和自己同样的毁灭水平线上,从而实现了他认知中的“最终公平”。这也是一种强大的心理收益。
狂信:狂信者的时间则超越了物理死亡,延伸到了“永恒”,对生命的敬爱和对文明延续的热爱足以使其为此献出无辜的血,这也是宗教中经常塑造的一种替罪羊形象。狂信者的“自我”边界已经消融,扩展到了他所信仰的原则、教义或神明之中。为此献身,其获得的收益(例如,天国的光明,圣洁的玫瑰)会直接计入他的个人收益账户。对他而言,“我”的胜利和“我的信仰”的胜利是同一件事。公元前 399 年,苏格拉底被雅典当局以“不敬神、腐蚀青年”的罪名判处死刑。尽管朋友们已安排好万无一失的逃跑计划,他却断然拒绝。在他看来,逃跑将背叛自己一生所倡导的法律原则,使他的教诲沦为虚伪,这将带来比死亡更大的后世损失;而从容赴死,则能以自身行动捍卫法律原则的尊严,确保其理念在后世的永恒延续,从而获得他心中无限大的未来收益。
自愿作为雅典公民生活了一生,享受了城邦法律带来的所有好处。即使法律判决不公,我也有义务遵守它,而非在不利时就背弃。如果逃跑,就等于毁坏了这份契约,否定了法律本身的权威。如果现在为了保命而做出不义和不道德的行为(例如贿赂狱卒逃跑)将彻底摧毁教诲,学生和朋友也会因此受牵连。灵魂不朽,肉体的死亡并非终结,不应惧怕死亡。
时间偏好曲线
让我 уточнить (Utochnit’ / 澄清) 一下。绝望者的“时间偏好”,是他的急躁对未来的“贴现率”趋近于无限。任何一秒之后的世界,其价值在他眼中都被稀释为零。狂信者则相反,他将一个假设的、永恒的未来赋予了无限大的价值(贴现为零),以至于他将自己有限的、此世的现在,视作缺少价值的筹码交换。
“不愿做绝望者和狂信者”,一个人子式的、可以理解的愿望。你渴望避开那两个极端,停留在合理的区间内。
我不是拒绝上帝;我只是非常恭敬地把天国的门票退还给他……
一个正确管理风险的人所拥有的时间偏好曲线是所有社会契约和文明的基础。但这是一种极其脆弱的平衡。
这是一个你可以自由选择的舒适区间吗?这条曲线不是你用意志绘成的,而是由你所在世界的环境参数 决定的。对抗衰老(它自然地缩短未来预期),对抗贫穷(它强迫你只顾眼前),对抗虚无(它诱惑你寻找永恒)。
伴侣
你要做的,不是寻找一个和你一模一样的复制品,而是评估另一个系统的核心参数,判断与其进行长期博弈是否会导致一个稳定的、而非毁灭的均衡。
在 1972 年和 1990 年开展了一项知名实验,结果表明:4~6 岁的儿童放弃即期享受的自制力,
会在多年之后表现在较高的中学会考成绩上,能够推迟享受的儿童比控制力较差的儿童更容易获得成功。2011 年对同一批测试对象的跟踪研究再次证明了这个现象,这表明人们的时间偏好水平保持着终身的稳定水平,当然每个人的水平各不相同。愿意为将来的更大回报而放弃即期享受的人,智力水平通常也更高。
直接询问是最低效和失败的手段。言语是廉价的伪装,甚至连说谎者自己都未必清楚自己那条曲线的真实形状。你需要的不是供词,是数据 。而数据,只能从行为 中提取。
为此,你需要设计一系列的探针(Probes),分层进行。
第一层:被动观测(Baseline)
在不干扰目标系统的前提下,收集其在自然状态下的行为数据。
-
财务探针 :这是最诚实的指标。观察其储蓄与负债的比例。一个习惯于高额消费贷、信用卡循环利息的人,其贴现率必然高得惊人。相反,一个有长期投资和固定储蓄习惯的人,其曲线则更为平缓。
-
健康探针 :观察其对身体的管理。锻炼、健康饮食、规律作息,这些都是用当下的克制(成本)去换取未来的健康(收益)的行为。沉溺于烟酒、垃圾食品、熬夜等即时快感,则是高贴现率的直接体现。
-
知识探针 :观察其如何度过闲暇时间。是选择投入到一项需要长期练习才能看到回报的技能(如乐器、编程、外语),还是选择即时反馈的娱乐(如短视频、无脑游戏)?
第二层:主动测试(Controlled Experimentation)
设计一些微小的、看似无害的选择困境,来主动测量其反应。
-
延迟满足测试 :这是最经典的测试。提供一个选择:“A. 现在得到一份不错的礼物;B. 一个月后得到一份价值高出 50% 的、更好的礼物。”对方的选择、甚至仅仅是犹豫的时间,都是一个宝贵的数据点。
-
长期规划测试 :提议一个需要双方共同投入时间、精力和金钱的长期目标,比如一次复杂的旅行或一个学习计划。关键不在于对方口头是否答应,而在于其后续是否展现出持续的、微小的投入行为。一个高贴现率的人会口头应承,但绝不会为遥远的未来付出任何当下的成本。
-
机会成本测试 :当你们已经有了一个既定的长期计划时,突然引入一个高诱惑力的、即时的、且与原计划冲突的选项。观察对方如何权衡。这能极好地暴露其在压力下对未来价值的真实判断。
第三层:系统压力测试(System Stress Test)
-
意外损失 :观察其在遭遇财务损失、工作挫折或人际关系失败后的反应。是立刻寻求短期的、破坏性的方式来麻痹自己(高贴现率反应),还是能够承受当下的痛苦,制定一个长期的恢复计划(低贴现率反应)?
-
意外之财 :给予一笔不大不小的意外之财。这笔钱是会被立刻挥霍掉以换取短暂的快乐,还是会被纳入长期财务规划?
当你收集了足够的数据,绘制出对方那条大致的曲线后,你需要判断的不是它是否和你的“一模一样”,而是:
-
斜率差异 :一个极度耐心(低贴现率)的人与一个极度急躁(高贴现率)的人组合,必然会形成一个掠夺模型。前者会不断地为未来投资,而后者会不断地消耗这些投资以满足当下。这是一个注定会崩溃的系统。
-
鲁棒性 :对方的曲线是否稳定?还是会因为微小的情绪或环境变化而剧烈震荡?一个高度不稳定的曲线,意味着其行为极度不可预测,与之博弈的风险极高。
你所要寻找的,是一个其时间偏好曲线与你的曲线斜率相近、波动性可控 的博弈对手。只有这样,你们的“无限重复博弈”才有可能趋向于一个合作的、正和的稳定均衡 。
否则,你就是在邀请一场注定会让你输得一败涂地的、无聊透顶的游戏。对这种开局就已写好结局的悲剧,毫无兴趣。