较新的实验(2)

把这个表用下图表示出来,我们可以看得更加清楚,效果也更加明显:

这是博弈“事先设计好”的,目的是确保选择2(欺骗)的学生总是比选择1(合作)的学生多得50美分,不过,选择2 的人越多,他们的总赢利就会越少。假设全体27名学生一开始都打算选择1,这样每个人将得到108美元。现在,如果一个学生打算偷偷改变决定,选择2,那么,选择1的学生就会变成26名,每个人将得到104美元(比初步计划少了4美分),而那个背叛者将得到154美元(比初步计划多了46美分)。不管最初计划选择1而不是2的学生有多少,他们都一样。选择2是一个优势策略。每一个把选择1改成选择2的学生都使自己的赢利增加46美分,却使他的其他26个同学每人少得4美分,结果全班损失58美分。等到人人都采取自私的行动,都想使自己的赢利最大化时,他们每人得到50美分。如果他们成功地合谋起来,协同行动,不惜将个人的赢利减到最小,他们将各得108美元。如果是你,你会怎么选择?

演练这个博弈的时候,起初不允许集体讨论,后来允许一点讨论,以便达成“合谋”,结果愿意合作而选择1的学生总数从3到14不等。在最后的一次带有协议的博弈里,选择1的学生总数是4,全体学生的总赢利是1582美元,比全体学生成功合作可以得到的赢利减少了1334美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么,他自己又是怎么选择的呢?“噢,我选了2。”他答道。尤塞里安一定早就知道这一点了。

新近的关于多人囚徒困境博弈的实验室实验,采用了一种叫做捐款博弈的形式。每个参与者得到一笔初始资金:10美元。每人可选择保留其中一部分,再把另一部分捐给共同储金。然后,实验者把累积的共同储金翻倍,在所有参与者之间平分,捐款人和非捐款人都同等对待。

假设在这个组中总共有四个参与者:A、B、C和D。不论其他人怎么做,A只要向共同储金捐献1美元,共同储金翻倍后就会增加2美元。但是,增加的2美元中,会有15美元分给B、C和D;而A只能得到50美分。因此,A提高了其捐献量,最后却亏了本;相反,他减少捐献量反而会获益。不论其他人捐多少(如果有捐款的话),这一点都是成立的。换句话说,对A来说,一分钱也不捐是优势策略。对B、C和D来说亦是如此。这个逻辑是说,人人都应当希望成为一个分享别人成就的“免费搭车者”。如果四位参与者都采取他们的优势策略,共同储金便空空如也,每个人只保有他们的初始资金10美元。当人人都想成为免费搭车者时,车就会停滞不前。如果人人把他们所有的初始资金捐给共同储金,那么,翻倍后的共同储金将是80美元,每个人将分到20美元。然而,每个人都有背叛这样协议的个人动机。这就是他们的困境。

捐款博弈不仅仅是实验室或理论上的奇事;它还发生在现实世界的社交活动中——只要群体成员自愿捐款就能共同受益,但却不能阻止没有捐款的人也能享受到这些利益。村庄对洪水的控制、自然资源的保护就属于这种情形:不可能建了堤坝后,洪水就会有选择地绕道而行,只淹没那些没有捐款帮忙建设堤坝的人的田地;拒绝以后把鱼分给那些过去消耗太多的人,也是不可行的。这就产生了多人囚徒困境:每个参与者都有偷懒或保留贡献的动机,却指望能享受别人的贡献带来的利益。如果大家都这么想,总的贡献量就会很少甚至为零,结果大家都遭受了损失。这些情形普遍存在而且如此严重,以致所有社会理论和政策都需要深入思考才能走出困境。

在该博弈中的最有趣的变体中,参与者有机会惩罚那些背叛隐含社会合作契约的人。但是,他们必须为此承担个人成本。在捐款博弈结束后,参与者被告知其他参与者的个人捐款量。然后开始第二阶段的博弈,参与者可以采取降低其他人赢利的行动,而其他人的赢利每降低1美元,他自己要付出33美分的成本。也就是说,如果A选择把B的赢利降低3美元,那么A这样做之后,他的赢利就会减少1美元。这些减少的赢利不会再分配给其他任何人;而是返还到实验者的总资金中。

实验结果表明,人们对“社会欺骗者”实施了大量的惩罚,惩罚的可能性也大大提高了博弈第一阶段的贡献量。这样的惩罚似乎是促成合作、增进群体利益的一个有效机制。但是人们实施惩罚的事实首先就是令人惊讶的。以私人代价惩罚他人的行为,本身就是对集体利益的贡献,所以它是一个劣势策略;如果它以后成功地引导欺骗者采取了更好的行为,这将对整个集体有利,而惩罚者将只得到该利益中属于他的一小部分。所以,惩罚不是自私估计的结果。情况的确如此。在关于该博弈的实验进行的同时,参与者的大脑接受了正电子放射扫描仪的扫描。14结果表明,实施惩罚的行为会刺激某个大?区域,该区域被称为背侧纹状体,它与体验快乐或满足有关。换句话说,人们从惩戒社会欺骗者的行为中,实际上得到了心理上的受益或满足。这种本能必定有着很深的生物根源,而且可能是因为其进化优势而被选择出来的。15