在博弈论的所有案例和模型中,“囚徒困境”无疑是最著名的,甚至可以说,不谈“囚徒困境”,我们就无法谈博弈论。
但是“囚徒困境”并不是诺伊曼的发明。1950年,数学家塔克在担任斯坦福大学客座教授期间,给一些心理学家做讲演时,用两个囚犯的故事,对当时专家们正研究的一类博弈论问题做了形象化的解释。从此以后,类似的博弈问题便有了一个专门的名称—“囚徒困境”。“囚徒困境”在经济学、伦理学、社会学、政治学、哲学乃至生物学等学科中,获得了极为广泛的应用。
由于应用广泛,“囚徒困境”的版本很多,并不断被完善和严密。现在被普遍使用的“囚徒困境”大致是这样的:
甲、乙两个人一起携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有其他重罪,但没有证据。于是分别进行审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,就要受到严惩。当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):
如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;如果两人都招供,则两人都会因罪名各判10年。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带着奖赏出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
为什么聪明的囚犯,却无法得到最好的结果?两个人都招供,对两个人而言并不是集体最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供好得多。
“囚徒困境”这个问题为我们探讨合作是怎样形成的,提供了极为形象的解说方式,产生不良结局的原因是因为囚犯两人都基于自私的角度开始考虑,这最终导致合作没有产生。
“囚徒困境”确实揭示了自私对合作的破坏作用,但是正如“有一利必有一弊”这句话,“囚徒困境”给我们带来的也并不全是坏消息。
当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。
“囚徒困境”是一些非常普遍而有趣的情形的简单抽象化,可以说是理性的人类社会活动最形象的比喻。它准确地抓住了人性的不信任和需要相互防范这种真实的一面。从个体的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果。当你身处类似“囚徒困境”这样的同时行动的博弈中,你的最佳策略是什么?决定胜负的因素又是什么?双方的策略选择往往是有迹可遁的,并形成某种“定式”,即均衡。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。