“幸存者”的策略(1)

“幸存者”的策略

哥伦比亚广播公司的《幸存者》节目以许多有趣的策略博弈为特征。在《幸存者:泰国》的第六集中,由两个小组或两个部落参与的游戏,无论在理论上还是在实践上,都不失为一个向前展望、倒后推理的好例子。4在两个部落之间的地面插着21支旗,两个部落轮流移走这些旗。每个部落在轮到自己时,可以选择移走1支、2支或3支旗。(这里,0支旗代表放弃移走旗的机会,是不允许的;也不允许一次移走4支或4支以上的旗。)拿走最后1支旗的一组获胜,无论这支旗是最后1支,还是2支或3支旗中的一支。5输了的一组必须淘汰掉自己的一个组员,这样,该组在以后的比赛中的能力就会削弱。事实证明,这次损失在这种情况下非常致命,因为对方部落的一个成员将继续参加比赛,争夺100万美元的最终奖金。因此,找出比赛的正确策略一定非常有价值。

这两个部落名为Sook Jai和Chuay Gahn,由Sook Jai先行动。它一开始拿走了2支旗,还剩下19支。在继续读下去之前,先停下来想一想。如果你是Sook Jai部落的成员,你会选择拿走多少支旗?

把你的选择记下来,然后继续往下读。为了弄明白这个游戏应该怎么玩,并且把正确策略与两个部落实际上采取的策略进行比较,注意两个十分有启迪性的小事件通常很有用。第一个小事件是,在游戏开始前,每个部落都有几分钟时间让成员们讨论。在Chuay Gahn部落的讨论过程中,其中一个成员泰德•罗格斯(Ted Rogers)——一个非裔美国软件开发人员,指出:“最后一轮时,我们必须留给他们4支旗。”这是正确的:如果Sook Jai部落面临着4支旗,他们只能移去1支、2支或者3支旗,与此相对应,Chuay Gahn部落在最后一轮中分别移去剩下的3支、2支或1支旗,最终Chuay Gahn部落在游戏中取胜。实际上,Chuay Gahn部落确实得到并正确地利用了这一机会:在面临6支旗时,他们拿走了2支。

但是,还有另外一个有启发性的小事件。在前一轮,就在Sook Jai从剩下的9支旗中拿走3支返回后,他们中的一个成员斯伊•安(Shii Ann)——一个好辩的、能言善道的、很为自己的分析能力感到自豪的参赛者,突然意识到:“如果Chuay Gahn现在取走2支旗,我们就糟了。”所以,Sook Jai刚才的行动其实是错误的。他们本应该怎样做呢?

斯伊•安或者Sook Jai部落的其他成员本来应该像泰德•罗格斯那样推理,除了实践在下一轮给对方部落留下4支旗这一逻辑推理之外。你怎样才能确保在下一轮时给对方留下4支旗呢?方法是在前一轮中给对方留下8支旗!当对方在8支旗中取走3支、2支或1支时,接下来轮到你时,你再相应地取走3支、2支或1支,按计划给对方留下4支旗。所以,Sook Jai本来可以只在剩下的9支旗中取走1支,从而扭转局面。虽然斯伊•安的分析能力很强,但为时已晚!或许泰德•罗格斯有着更好的分析洞察力。但确实是这样吗?

Sook Jai怎么会在前一轮面临9支旗呢? 因为Chuay Gahn在前一轮中从剩下的11支旗中取走了2支。泰德•罗格斯的推理本来应该再倒后一步。Chuay Gahn本来可以取走3支旗,留给Sook Jai 8支旗,这样,Sook Jai就会面临输掉比赛的局面。

同样的推理可以再倒后一步。为了给对方部落留下8支旗,你必须在前一轮给对方留下12支旗;要达到这个目的,你还必须在前一轮的前一轮给对方留下16支旗,在前一轮的前一轮的前一轮给对方留下20支旗。所以,Sook Jai本来应该在游戏开始时只取走1支旗,而不是实际上取走的2支。这样的话,Sook Jai就可以在连续几轮中分别给Chuay Gahn留下20支、16支……4支旗,确保取胜。

是不是在所有博弈中,先行者总是能确保取胜呢?不是。如果在旗子游戏中,开始时的旗子是20支而不是21支,那么后行者一定获胜。另外,在一些博弈中,比如3×3的连环游戏,每个参与者都可以通过正确的策略确保打成平手。

这两个核心人物的命运也很有趣。斯伊•安在下一集时又一次严重判断失误,并因此出局,在16个参赛者中排名第10。泰德显得更加冷静,或许在某种程度上也更有技巧,他在倒数第五集时出局。现在来考虑一下Chuay Gahn部落在第一轮应该选择多少支旗。他们面临着19支旗。如果他们当时充分地利用了倒后推理的逻辑,他们就本应该取走3支旗,给Sook Jai留下16支旗,也就踏上了必胜之路。在比赛中局,无论对方在哪一个点犯了错误时,接下来轮到的那个部落都可以抓住主动权,从而获胜。但是很遗憾,Chuay Gahn也没有很完美地玩好这个游戏。

下面的表格对博弈的每个决策点上的实际行动和正确行动进行了对比。(“不行动”表示若对手的行动是正确的,那么任何行动选择都必然失败。)你可以看到,除了Chuay Gahn在面临着13支旗时的选择是正确的之外,几乎所有的选择都是错误的。而当时Chuay Gahn一定是偶然选对的,因为在下一轮面临11支旗时,他们本应该取走3支旗,却只取走了2支。部落移动前旗子数拿走的旗子数获胜应取走的旗子数Sook Jai2121Chuay Gahn1923Sook Jai1721Chuay Gahn1513Sook Jai1412Chuay Gahn1311Sook Jai121不移动Chuay Gahn1123Sook Jai931Chuay Gahn622Sook Jai43不移动Chuay Gahn111

在你苛刻评价这两个部落之前,你必须意识到,即使学会怎样玩一个非常简单的博弈,也是需要时间和经验的。我们已经在课堂上让各组学生玩过这个游戏,结果发现,常青藤联盟的一年级学生需要玩三次甚至四次后才能进行完整的推理,并且从第一步行动开始就一直采取正确的策略。(顺便问一下,当时我们叫你选择的时候,你选择了多少支旗?你是如何推理的?)顺便提一句,人们似乎通过观察别人玩博弈比自己玩博弈学得更快;也许这是因为作为一个观察者比作为一个参与者更容易把游戏看做一个整体,并冷静地对其进行推理。

为了加深你对推理逻辑的理解,我们给你提供了我们的第一个“健身之旅”——你可以练习一下这些问题,以此磨炼你对策略思维的运用技能。答案请参阅本书健身之旅题解。

既然你已通过这些练习而深受鼓舞,那我们就继续来考察整个博弈课堂中普遍存在的策略问题吧。

博弈何以能完全逆推可解?

21支旗博弈的一个特殊性质有助于该博弈完全可解,那就是它不存在任何不确定性:不论是某些自然的机会元素,还是其他参与者的行动和能力,或者是他们的实际行动,都不具有不确定性。这似乎是很容易得出的结论,但仍需要详细阐述。

首先,在博弈的任何一个决策点处,当轮到一个部落行动时,该部落清楚地知道当时的情况,也就是还剩下多少支旗。而在许多博弈中,存在一些纯偶然的元素,这些元素是自然产生的或者由概率之神决定。例如,在许多卡片游戏中,当一个玩家做出选择时,他并不确定其他人手中持有的是什么牌,虽然其他人先前的举动可能会露出一些蛛丝马迹,他可以据此推断他们手中的牌。在接下来的一些章节中,我们的例子和分析将会涉及一些包含这种自然机会元素的博弈。