囚徒困境的解法-以牙还牙

2026-05-31 02:27 6 分钟 2112 字

最善良的“狠角色”:改变博弈论的“以牙还牙”策略


1. 一个让人抓狂的困境


想象你和一个陌生人被关在两个房间里,你们面前各有一个按钮:
  • 按下“合作”,你们都能得到100块;

  • 按下“背叛”,如果你按了背叛,对方按了合作,你拿走200块,对方一分没有;

  • 如果你们都按了“背叛”,你们各拿10块。

  • 这就是著名的“囚徒困境”。逻辑上,不管对方按什么,你按“背叛”都更划算。结果往往是:两个人都怕被坑,都选了背叛,最后两人拿着10块钱欲哭无泪。
    如果只玩一次,这就是个死局。但如果不只是一次呢?
    如果你们要玩100次、1000次,还要天天见面呢?你还会上来就坑人吗?大概率不会,因为你想长远地赚钱。这就是“重复囚徒困境”——今天的选择,会影响明天。
    那在长期的博弈里,到底用什么策略才能既不吃亏,又能赚到钱?

    2. 一场意想不到的“武林大会”


    1980年,美国密歇根大学的政治学家罗伯特·阿克塞尔罗德决定用电脑办一场“武林大会”。
    他向全世界的博弈论专家、经济学家、数学家发了英雄帖:请你们写一段电脑程序,代表你们的策略,来参加重复囚徒困境的对战。
    各路神仙纷纷出手。有人写了极其复杂的“阴谋算法”,通过分析对方过去十几步的举动来预测下一步;有人写了“永远背叛”的恶霸程序;还有人写了“随机乱按”的神经病程序。
    一共14个程序,在电脑里捉对厮杀,每对打200回合,计算总得分。
    结果震惊了所有人。
    冠军,是所有程序里最短、最简单的一个,只有4行代码。
    它的作者是心理学家阿纳托尔·拉波波特,这个程序的名字就叫——“以牙还牙”(Tit for Tat)
    阿克塞尔罗德不信邪,又办了第二届。这回有63个程序参赛,很多程序都是专门针对“以牙还牙”设计的复仇者。结果,最简单的“以牙还牙”再次夺冠!

    3. 这个冠军到底是怎么打比赛的?


    “以牙还牙”的策略翻译成人话,只有两条规则:
    1. 第一步,我永远先对你好。(第一轮无条件选择合作)
    2. 从第二步起,你上一步对我怎样,我这一步就对你怎样。(你合作,我就合作;你背叛,我就背叛)
    就这?对,就这。
    我们来看看它在比赛中是怎么对付各种人的:
  • 遇到“老好人”(永远合作):以牙还牙第一步合作,老好人也合作。之后两人一直开开心心地合作,赚得盆满钵满。

  • 遇到“恶霸”(永远背叛):以牙还牙第一步合作,被坑了;第二步,恶霸又背叛,但以牙还牙立刻还击,也选背叛。之后两人一直互相背叛。虽然没赚到钱,但以牙还牙绝不白白挨欺负

  • 遇到“笑面虎”(偶尔使坏):你合作,我就合作;你只要敢背叛一次,我下一轮立刻让你付出代价;你一看不好惹,变回合作了,我下一轮立刻也变回合作,像什么都没发生过一样。

  • 阿克塞尔罗德仔细研究了这个神奇的策略,总结出了它天下无敌的四大心法
    1. 善良:绝不率先背叛。它总是先释放善意,给别人合作的机会。
    2. 可激怒:一旦被欺负,立刻反击。绝不当软柿子,让对方知道背叛是有代价的。
    3. 宽容:只要对方改过自新,立刻原谅,重新合作。绝不记仇,不陷入无限报复的死循环。
    4. 清晰:规则极其简单,谁都能看懂。跟它交手几次,对方就会得出结论:“哦,这人有原则,只要我好好对它,它就好好对我。”

    4. 一个生活中的小场景


    我们把这个策略放到生活里看看。
    假设你和同事小李共同负责一个项目,每天你们都可以选择“好好干活”(合作)或者“甩锅摸鱼”(背叛)
  • 第一天:你按照“以牙还牙”,先选择好好干活。小李却摸鱼了,成果被他白嫖。

  • 第二天:你根据规则,复制他上一天的行为,你也摸鱼。小李一看,哎哟,你也不干了,项目要黄。

  • 第三天:小李怕了,开始好好干活。你一看他改了,立刻原谅,也好好干活。

  • 第四天及以后:你们俩都发现,只有好好干活才能双赢,于是形成了长期的合作默契。

  • 你看,你不惹事,但也不怕事;你愿意交朋友,但也长着刺;你翻脸如翻书,翻篇也如翻书。

    5. 现实中的一个小bug


    不过,“以牙还牙”在电脑里是无敌的,但在现实人类社会中,它有一个致命的弱点:误会(噪音)
    假设第二天,小李其实好好干活了,但他发邮件时网络卡了,你以为他摸鱼了。于是第三天,你按照规则摸鱼了。小李觉得莫名其妙:“我干活了你凭什么摸鱼?”于是第四天他也摸鱼。两人就这么莫名其妙地互坑起来。
    为了解决这个问题,后来人们发明了“宽容的以牙还牙”:当对方背叛时,我有10%的概率选择原谅(继续合作),给彼此一个打破误伤死循环的台阶。

    6. 为什么要懂“以牙还牙”?


    很多人对“善良”有误解,以为善良就是一味地退让、牺牲、当老好人。但在博弈论的真实世界里,毫无底线的善良,只会被剥削到死,最后双输。
    “以牙还牙”告诉我们,真正能在这个复杂世界走得远的人,是那种:
    带着善意出发,但底线分明;不主动惹事,但绝不怕事;受了委屈当场还击,但只要对方给个台阶,立刻翻篇不记仇。
    这不只是一种博弈策略,更是一种通透的生存哲学。