最善良的“狠角色”:改变博弈论的“以牙还牙”策略
1. 一个让人抓狂的困境
想象你和一个陌生人被关在两个房间里,你们面前各有一个按钮:
这就是著名的“囚徒困境”。逻辑上,不管对方按什么,你按“背叛”都更划算。结果往往是:两个人都怕被坑,都选了背叛,最后两人拿着10块钱欲哭无泪。
如果只玩一次,这就是个死局。但如果不只是一次呢?
如果你们要玩100次、1000次,还要天天见面呢?你还会上来就坑人吗?大概率不会,因为你想长远地赚钱。这就是“重复囚徒困境”——今天的选择,会影响明天。
那在长期的博弈里,到底用什么策略才能既不吃亏,又能赚到钱?
2. 一场意想不到的“武林大会”
1980年,美国密歇根大学的政治学家罗伯特·阿克塞尔罗德决定用电脑办一场“武林大会”。
他向全世界的博弈论专家、经济学家、数学家发了英雄帖:请你们写一段电脑程序,代表你们的策略,来参加重复囚徒困境的对战。
各路神仙纷纷出手。有人写了极其复杂的“阴谋算法”,通过分析对方过去十几步的举动来预测下一步;有人写了“永远背叛”的恶霸程序;还有人写了“随机乱按”的神经病程序。
一共14个程序,在电脑里捉对厮杀,每对打200回合,计算总得分。
结果震惊了所有人。
冠军,是所有程序里最短、最简单的一个,只有4行代码。
它的作者是心理学家阿纳托尔·拉波波特,这个程序的名字就叫——“以牙还牙”(Tit for Tat)。
阿克塞尔罗德不信邪,又办了第二届。这回有63个程序参赛,很多程序都是专门针对“以牙还牙”设计的复仇者。结果,最简单的“以牙还牙”再次夺冠!
3. 这个冠军到底是怎么打比赛的?
“以牙还牙”的策略翻译成人话,只有两条规则:
1. 第一步,我永远先对你好。(第一轮无条件选择合作)
2. 从第二步起,你上一步对我怎样,我这一步就对你怎样。(你合作,我就合作;你背叛,我就背叛)
就这?对,就这。
我们来看看它在比赛中是怎么对付各种人的:
阿克塞尔罗德仔细研究了这个神奇的策略,总结出了它天下无敌的四大心法:
1. 善良:绝不率先背叛。它总是先释放善意,给别人合作的机会。
2. 可激怒:一旦被欺负,立刻反击。绝不当软柿子,让对方知道背叛是有代价的。
3. 宽容:只要对方改过自新,立刻原谅,重新合作。绝不记仇,不陷入无限报复的死循环。
4. 清晰:规则极其简单,谁都能看懂。跟它交手几次,对方就会得出结论:“哦,这人有原则,只要我好好对它,它就好好对我。”
4. 一个生活中的小场景
我们把这个策略放到生活里看看。
假设你和同事小李共同负责一个项目,每天你们都可以选择“好好干活”(合作)或者“甩锅摸鱼”(背叛)。
你看,你不惹事,但也不怕事;你愿意交朋友,但也长着刺;你翻脸如翻书,翻篇也如翻书。
5. 现实中的一个小bug
不过,“以牙还牙”在电脑里是无敌的,但在现实人类社会中,它有一个致命的弱点:误会(噪音)。
假设第二天,小李其实好好干活了,但他发邮件时网络卡了,你以为他摸鱼了。于是第三天,你按照规则摸鱼了。小李觉得莫名其妙:“我干活了你凭什么摸鱼?”于是第四天他也摸鱼。两人就这么莫名其妙地互坑起来。
为了解决这个问题,后来人们发明了“宽容的以牙还牙”:当对方背叛时,我有10%的概率选择原谅(继续合作),给彼此一个打破误伤死循环的台阶。
6. 为什么要懂“以牙还牙”?
很多人对“善良”有误解,以为善良就是一味地退让、牺牲、当老好人。但在博弈论的真实世界里,毫无底线的善良,只会被剥削到死,最后双输。
“以牙还牙”告诉我们,真正能在这个复杂世界走得远的人,是那种:
带着善意出发,但底线分明;不主动惹事,但绝不怕事;受了委屈当场还击,但只要对方给个台阶,立刻翻篇不记仇。
这不只是一种博弈策略,更是一种通透的生存哲学。