一段小小的历史(1)
一段小小的历史
对于这个涵盖了经济、政治和社会诸多活动的囚徒困境博弈,理论家们当时是如何构造和命名的呢?这要追溯到博弈论学科早期的历史。作为博弈论先驱之一的哈罗德•库恩(Harold Kuhn)在1994年诺贝尔奖颁奖典礼的专题讨论会上,讲述了下面的故事。那是1950年春天,埃尔•塔克(Al Tucker)在斯坦福大学学术休假,由于办公室紧缺,他住进了心理学系。有一天,一位心理学家敲开了他的房门,问他正在做什么。塔克回答:“我正在研究博弈论”,心理学家就问他能否就他的研究举办一次研讨会。为了那次研讨会,塔克发明了“囚徒困境”作为博弈论、纳什均衡以及与之伴随而来的非社会意愿均衡的例子。作为一个真正富有创意的例子,囚徒困境博弈激发了许多学术论文乃至几本巨著。其他人的说法则略有不同。据他们所说,囚徒困境的数学架构早在塔克之前就形成了,这可以归功于两位数学家,即就职于兰德公司(美国冷战时期的智囊团)的梅里尔•弗勒德(Merrill Flood)和梅尔文•德雷希尔(Melvin Dresher)。塔克的才华在于,他发明了这个故事来阐释数学原理。之所以称它为一种才华,是因为它的展示方法可以形成或者打破一种思想;一种令人难忘的展示方法能够传播开来,并被大多数思想家更好更快地吸收,而一种乏味枯燥的展示方法可能会被人忽略、遗忘。
∷一个直观的展示
我们用一个商业实例,来提出表示和求解该博弈的方法。彩虹之巅(Rainbows End)和比比里恩(BBLean)是两家互为竞争对手销售服装的邮购公司。每年秋天,它们都要打印出其冬季产品目录单,并邮寄出去。且每家公司都必须遵守其产品目录上印刷的价格。由于产品目录的准备时间比邮购窗口开放的时间长得多,因此,两家公司必须在不知道对方价格的情况下,同时做出定价决策。它们很清楚,产品目录是给一些共同的潜在顾客看的,而这些顾客很聪明,他们不断追求低廉的价格。
这不仅包括了从中国供应商那里购买衬衫的成本,也包括运送至美国的运输成本、出口税以及存货成本和订单履行成本。换句话说,总成本包括所有与该产品相关的成本。这样规定的目的是为了全面度量经济学家所谓的边际成本。两家公司的产品目录上通常都重点突出一件几乎完全相同的商品,如高档格子衬衫。对每家公司而言,该衬衫的单位成本为20美元。它们估计,如果它们都对这种商品定价80美元,那么,每家公司将销售出1 200件衬衫,这样,每家公司都将得到(80-20)×1 200=72 000美元的利润。而且,事实证明,这个价格能使它们的共同利益最大:如果两家公司合谋起来,统一定价,那么80美元是使他们的联合利润最大化的价格。
这两家公司还估计出,如果其中一家公司把价格降低1美元,而另一家的价格保持不变,那么降价的公司将得到额外的100名顾客,其中80名是从另一家公司转移过来的顾客,20名是新顾客。他们可能决定买下价格较高时未买的衬衫,也可能从当地购物中心的某个商店转移到这家公司。因此,每家公司都有动机制定低于对方公司的价格,以得到更多的顾客;我们给出这个故事的主要目的在于,找出这些动机是如何影响双方的行动的。
首先,我们假设每家公司只有两个价格选择:80美元和70美元。如果一家把它的价格降至70美元,而另一家公司仍然定价80美元,那么,降价者将得到额外的1 000名顾客,而另一家则失去800名顾客。这样,降价者售出 2 200件衬衫,而另一家的销售量降到400件;降价者的利润为(70-20)×2 200=110 000美元,而另一家公司的利润为(80-20)×400=24 000美元。
这个规定,尤其是只有两种可能的价格选择这个假设,只不过是为了以尽可能简单的方式,构造出这类博弈的分析方法。在以后的章节,我们将允许公司有更大的价格选择自由。
托马斯•谢林在区分哪个赢利属于哪个参与者时,发明了这种用同一个表格表示两个参与者的赢利的方法。他用过分谦虚的笔触写道:“假如真有人问我有没有对博弈论做出一点贡献,我会回答有的……我发明了用一个矩阵反映双方赢利的方法。”事实上,谢林提出了很多在博弈论中至关重要的概念——聚焦点、可信度、承诺、威胁与承诺、颠覆,等等。在接下来的章节中,我们将会经常引用他和他的研究成果。如果两家公司都把价格降至70美元,结果会怎么样?如果它们都降价1美元,虽然现存的顾客数量不变,但它们各自都得到了20名新顾客。这样,当它们都把价格降低10美元时,就能各自在原先1200件的基础上多销售200件。即每家公司的销售量是1 400件,获得的利润为(70-20)×1 400=70 000美元。
我们希望能够直观地展示?利润结果(即公司在博弈中的收益)。但是,我们无法运用第2章中的博弈树来做到这一点。因为在这里,两个参与者是同时行动的。参与者在采取行动时,都不知道对方做了什么,也预料不到对方将如何回应。相反,每个人都要考虑对方同时在想什么。这种想对方之所想的做法的一个出发点是,列出双方所有同时选择组合的所有结果。因为每家公司各有两个价格选择:80美元或70美元,所以总共存在四个这样的组合。我们可以用一种由行和列组成的类似电子表格的形式简单地把它们表示出来,通常我们称之为博弈表或者赢利表。彩虹之巅(简称RE)的选择表示在行中,比比里恩(简称BB)的选择表示在列中。在这四个单元格中的每个单元格,我们都展示了与每个RE行选择和BB列选择相对应的两个数字——衬衫的销售利润,单位是千美元。在每个单元格中,左下角的数字属于行参与者,右上角的数字属于列参与者。在博弈论术语中,这些数字称为赢利。同时,在这个例子中,为了清楚地区分哪些赢利属于哪个参与者,我们把这些数字用两种不同的阴影表示出来。
一般来说,对参与者而言,赢利数字越高越好。有时则不然。比如对接受审讯的囚徒而言,赢利数字指的是监禁的期限,因此每个参与者都希望数字更小。同样的情况也适用于赢利数字代表排名时,在那里,1是最佳结果。当你观察一个博弈表格时,你应该先弄明白该博弈的赢利数字的含义。在“求解”这个博弈之前,让我们先来观察并强调一下该表格的一个特性。比较一下这四个单元格中的赢利组合。对RE而言较好的结果,并不总是意味着对BB而言是较坏的结果,反之亦然。具体地说,它们在左上角的单元格中的赢利,都优于它们在右下角单元格中的赢利。这种博弈无须分出胜者和败者;因为它不是零和博弈。我们在第2章也曾经指出,查理•布朗投资博弈不是零和博弈,我们在现实生活中遇到的大多数博弈也不是零和博弈。在很多博弈中,比如囚徒困境博弈,主要问题在于如何避免出现两败俱伤的结果,或者如何促成双赢的结果。