第十章 无赖预测

一个3月的晚上,几个男人和女人站在悉尼歌剧院外俯瞰海滩的平台上。时值悉尼的夏末,但男人们都穿着外套。女人们更耐热,但行动受到高跟鞋的限制。

他们都是来享受精致生活的。很快,他们就会听一群肥胖的男人和女人唱几个小时的俄罗斯歌剧。许多热衷歌剧的人都看上去在J·P·摩根或别的金融机构工作,这种地方的员工与属于别人的大量财富打交道,这使他们不断感到要用某种精致的方式(比如红酒和歌剧)释放生活的压力。但我不是去欣赏新精致主义(neosophisticates)的,我去是为了看一眼悉尼歌剧院,它出现在所有澳大利亚的旅游宣传册上。确实,它很引人注目,尽管它看上去是那种为了打动别的建筑师而造的建筑。

晚间在悉尼这处叫做岩石区的宜人地方散步是一种朝圣。虽然澳大利亚人以为他们建造了一座使他们的天空风景线与众不同的杰出建筑,但实际上只是建造了显示着人类预测、计划和把握对未来的未知知识失败的纪念碑——我们对未来整体上的低估。

澳大利亚人实际上建造的是标志人类认知自大的符号。事情的经过是这样的。悉尼歌剧院原计划造价700万澳元,在1963年初开放。最终它的开放晚了10年,虽然规模比原先的设计小,却花费了近1.04亿澳元。虽然世界上不乏更为严重的计划失败,或者预测失败(比如一切重大历史事件),但悉尼歌剧院提供了计划及预测困难在美学(至少是美学理论)上的例子。歌剧院的例子将是我们在本章节讨论的后果最不严重的认知扭曲(它只涉及钱,而且没有导致无辜的人流血),但它是最具象征意义的。

本章有两个主题。首先,我们在自以为拥有的知识方面非常自大。我们当然知道不少,但我们有一种内在的倾向,以为我们比实际上知道得多一点,正是这一点会不时招致严重的麻烦。我们会看到如何在你自己身上找出甚至衡量这种自大。

其次,我们会讨论这种自大对所有行为,包括预测的影响。

我们究竟为什么如此喜欢预测?更糟糕也更有趣的是:为什么我们不提我们在预测方面的记录?为什么我们看不到我们在(几乎)所有大事件上的预测失败?我把这称为无赖预测。

凯瑟琳的情人之谜

让我们讨论一下我所说的认知自大,即我们面对知识局限性的自大。确实,我们的知识在增长,但它受到自信增长的威胁,它增长了我们的知识,同时也增加了疑惑、无知和自负。

有一间挤满人的屋子。随机选择一个数字,这个数字可以代表任何东西:乌克兰西部精神错乱的股票经纪商的比例,在英语中含有字母r的几个月份中本书的销量,商业类图书编辑(或作者)的平均智商,俄国女皇凯瑟琳二世的情人数量,等等。让屋子里的每一个人独立地为这个数字估计一个可能的范围,并且他们要相信自己的估计有98%的可能性是正确的,2%的可能性是错误的。也就是说,不论他们的估计是什么,大约2%的可能性不在他们估计的范围之内。例如:

“我98%地确信拉贾斯坦的人口在1500万~2300万之间。”

“我98%地确信俄国女皇凯瑟琳的情人数量在34~63之间。”

你可以数数多少人的估计是错误的,从而了解人的本性。每100人当中应该不超过两人估计错误。请注意,受试者(你的受骗者)可以任意设定估计范围:不是你在评价他们的知识,是他们对自己的知识做出评价。

现在来看实际结果。与生活中的许多事一样,结果是人们没有预料到的、突然的,也是意外的,需要一段时间才能消化。据说,注意到这一点的研究者艾尔伯特(Albert)和雷法(Raiffa)本来在寻找别的更为乏味的结果:在不确定性条件下,人们在决策中如何估计可能性(学者称之为“校准”)。结果使这两位研究者迷惑:预料中2%的错误比例在实际上接近45%!更能说明问题的是第一批受试者包括哈佛商学院的学生,一群并不以谦虚或内省著称的人。后来对其他人群的研究反映出更多的谦虚,或者较少的自大。看门人和出租车司机非常谦卑。政客和公司管理者,啊……我后面再谈他们。

我们对自己的知识是不是自信过头了22倍?看来是的。

这一实验被重复了数十次,测试过来自不同地区、职业和文化背景的人,几乎所有经验心理学家和决策理论家都在自己的课堂上做过这一实验,以向他们的学生展示人类的这个大问题:我们还不够智慧,我们的知识不值得信赖。预期中2%的错误率通常实际上达到15%~30%,取决于不同的人群和相关问题。

我也测试了自己,毫无疑问,我也失败了,即使我有意识地谨慎设定了很宽的估计范围,但我们将会看到,这种低估恰好是我所从事的职业的核心。这种偏差似乎存在于所有文化中,包括那些崇尚谦虚的文化,吉隆坡与黎巴嫩艾姆云的测试结果恐怕不会有很大的不同。有一天下午,我在伦敦做了一次演讲。在去往演讲地点的路上,我一直在脑子里打底稿,因为出租车司机“寻找拥堵地点”的能力超出了平均水平。我决定在演讲时做一个快速实验。

我请听众猜一猜作家翁贝托·埃克的图书馆里有多少书。60名听众中,没有一个人的猜测范围宽到包括这个实际数字(2%的错误率变成了100%)。

这次实验或许有些失常,但相关数量越超出常规,错误率越高。有趣的是,这群听众的估计分为高低两极:有的估计2000~4000册,有的估计30万40万册。正确答案是3万册。

确实,明白这个测试意图的人能够给出安全的估计,即把范围设为零到无穷大,但这就不是“校准”了,这个人的估计什么信息也不包含,因此也不能给决策者提供信息。在这种情况下还不如更诚实地说:“我不想玩这个游戏,我一点概念也没有。”

发现反例是不足为奇的,有的人会走向相反的方向,高估自己的错误率:你的表兄可能说话格外谨慎,或者你的大学生物学教授表现出不正常的谦卑。我在这里讨论的行为倾向是针对平均水平而言,而不是某一个人。在平均水平周围总有许多偏离者,也就必然会导致反例。这些人属于少数,并且,由于他们很难获得重要地位,他们在社会中的影响力也不大。

认知自大有双重影响:我们高估自己的知识,低估不确定性(也就是低估未知事物的范围)。

这一认知扭曲的影响不仅仅限于知识领域:你只需要看看周围人的生活,几乎所有与未来有关的决策都受到它的影响。人类长期以来始终低估未来偏离我们最初看到的过程的水平(这更加剧了其他具有复合影响的偏差的影响)。一个明显的例子就是离婚。几乎所有离婚的人都知道1/3~1/2的婚姻是失败的,而当他们自己结婚时并没有预见到这样的结果。当然,“我们不会”,因为“我们相处得很好”(好像其他结婚的人相处得不好似的)。

我要提醒读者,我不是在测试人们知道多少,而是在评估人们实际上知道的与他们以为自己知道的之间的差别。我想起当我决定从商时,我母亲为我构想的赚钱办法只是出于玩笑。我母亲虽然不一定不相信我的能力,但对我表现出来的信心出言讽刺,她为我找到了一个赚大钱的办法。怎么赚?知道怎样以我的实际价值购买我,并以我认为我值的价钱卖出我的人能够赚一笔很大的差价。虽然我不断让她相信我隐藏在自信外表下的谦虚和不安全感,虽然我不断告诉她我会自我反省,她还是怀疑我。不管反省还是不反省,直到我在写这本书的时候,她仍然开玩笑说我的想象有一点超出我自己本身的价值。

再谈黑天鹅盲

上述简单测试表明了人类低估意外事件,即黑天鹅现象的固有倾向。我们习惯于以为每10年发生一次的事只会每100年发生一次,而且我们知道正在发生什么。

这种错误估计还有更微妙的地方。实际上,意外不只是被低估,还被错误估计,而两个方向的错误估计都有可能发生。我们在第六章看到,人们也会高估非正常事件或某些特定的非正常事件(比如在情感性画面进入他们脑海时),这也正是保险公司赚钱的原因。因此,我的一般观点是,这些事件很容易被错误估计,其中大部分为严重低估,少部分为严重高估。

事件发生的可能性越低,估计错误就越严重。到目前为止,在前面讨论的实验中,我们只考虑了2%的错误率,但假如你看一看事件概率为百分之一、千分之一或百万分之一的情况,估计的错误率会变得巨大。事件概率越小,人们的认知自大越严重。

请注意我们的一种特殊直觉判断:即使我们生活在大事件很少发生的平均斯坦,我们仍然会低估极端事件,我们会认为它们离我们更遥远。即使面对符合高斯分布的变量,我们仍会低估我们的错误率。我们的直觉是一个子平均斯坦,但我们并不生活在平均斯坦。我们每天需要估计的数字主要属于极端斯坦,也就是说,它们具有集中性,受到黑天鹅现象的影响。

猜测与预测

对一个信息不完整或信息缺失的不具随机性的变量(比如凯瑟琳二世的情人数量)的猜测,与对一个随机变量:(比如明天的失业率或明年的股票市场情况)的预测是没有区別的。从这个意义上讲,猜测(我不知道但别人可能知道的事情)与预测(还没有发生的事情)是同一回事。

为了进一步理解猜测与预测之间的联系,假设你需要估计的是一个不那么有趣但对某些人而言非常重要的问题,比如下个世纪的人口增长率、股市回报率、社会保障金赤字、石油价格或者20年后巴西的环境状况,而不是凯瑟琳女皇的情人数量。或者,假如你是叶夫根尼娅的出版商,你可能需要估计书的未来销量。我们现在进入了危险领域:大部分从事预测的专业人士同样受到上述智力折磨。而且,专业从事预测的人比非专业人士受到影响的程度更大。

信息对知识有害

你可能想知道学习、教育和经验如何影响人的认知自大,在以上测试中受过教育的人与其他人相比会得到怎样的分数(以出租车司机米哈伊尔为基准)。你会对答案感到惊奇:分数取决于职业。我将首先讨论那些处于预测行业的“掌握信息”的人相对于其他人的优势。

我曾拜访过一位在纽约某家投资银行工作的朋友,在他那里看见一个情绪激动、有“宇宙之主”派头的人走来走去,耳朵上戴着头戴式耳机,右边支出来一个麦克风,使我在与他20秒的谈话中看不到他的嘴唇。我问我的朋友为什么那个人要如此装备。“他喜欢与伦敦保持联系。”他回答。当你受雇于人,因此依赖于他人的评价时,显得忙碌能帮助你在结果不确定的环境中邀功。显得忙碌能够加强人们对结果与你的作用之间的因果关系的判断。对于那些鼓吹自己的“存在”与“领导”在公司业绩中的作用的大公司CEO们更是如此。我没有听说过谁研究他们用于谈话和接受琐碎信息的时间有多大有效性,也没有几个作者有勇气质问CEO在公司成功中究竞有多大作用。

我们来讨论一下信息的一个主要影响:妨碍知识。

亚里士多德·奥纳西斯(Aristotle Onassis)或许是第一个被附属化的企业巨头,他最初的成名是因为他的富有,以及对财富的展示。作为来自土耳其南部的希腊难民,他来到阿根廷,靠进口土耳其烟草大赚了一笔,然后成为船运巨头。当他与美国总统约翰·F·肯尼迪的遗孀杰奎琳·肯尼迪结婚时,他遭到了谩骂,因为他使伤心欲绝的歌剧演员玛丽亚·卡拉斯把自己关在一间巴黎公寓中等死。

如果你研究了奥纳西斯的一生——这正是我年轻时做过的——你会发现一件有趣的事:传统意义上的“工作”不属于他的范畴。他甚至没有一张办公桌,更不要说办公室。他不仅是交易者,这确实不一定需要办公室,他还掌管着一个船运帝国,他必须进行日常管理。他的主要管理工具是一个笔记本,其中包含所有他需要的信息。奥纳西斯一生努力融入名流阶层,并追求(和收集)女人。他通常在中午醒来。如果需要法律建议,他会在凌晨两点把他的律师们召集到巴黎的某个夜总会。据说他有不可抗拒的魅力,这有助于他利用他人。

让我们放下那些奇闻逸事。将奥纳西斯的成功与他的特有方式联系起来可能会有“被随机性愚弄”之嫌。我或许永远不知道奥纳西斯到底是有能力还是有运气,虽然我确信他的魅力为他打开了方便之门,但我可以通过针对信息与知识之间关系的经验研究对他的方式做严格检验。所以,对于“日常经营的琐碎知识可能是无用的,甚至是有害的”这一说法,是可以间接而有效地加以检验的。

把一张模糊的消火栓图片给两组人看,模糊到使他们无法认出图片上是什么。对其中一组,分10次逐步提高图片的清晰度,对另一组分5次提高清晰度。在某个使两组人看到相同清晰度图片的时候停下来,请他们说出看到的是什么。经过较少中间步骤的那一组可能更快地辨认出消火栓。这意味着什么?你提供的信息越多,他们就会形成越多假设,他们的结论就越糟糕。他们看到了更多的随机噪点并将其当成了信息。

问题是,我们的思维是有惯性的:一旦形成一个观点,我们就很难改变,所以那些推迟形成观点的人更有利。当你以糟糕的证据为基础形成观点时,你会很难解释与这些观点矛盾的后续信息,即使这些新信息更明显、更准确。有两个机制在起作用:我们在第五章讨论的证实偏差,以及信念坚持偏差,即坚持不改变已有观点。请记住,我们把思想当做财产,所以很难舍弃它们。

消火栓实验最早出现于20世纪60年代,之后被重复过数次。我还用信息数学研究过这一效应:人们对于经验现实的细节知识了解越多,看到的噪点(也就是那些奇闻逸事)就越多,就可能把它们错当成真实信息。请记住我们是受情感影响的。每小时收听广播新闻比阅读周刊糟糕得多,因为较长的时间间隔能够过滤掉一些信息。

1965年,斯图尔特·奥斯坎普(Stuart Oskamp)向临床心理医生提供了一系列档案,每份档案都提供了关于患者的更多信息,但心理医生的诊断能力并没有随着信息的增加而提高。他们只是对最初的诊断更有信心。确实,人们不会对1965年的心理医生有太高期望,但这些结果似乎在各个学科都是一致的。

最后还有一个说明问题的实验,心理学家保罗·斯洛维克让赌马者从88个他们认为对计算胜率有用的变量中做出选择。这些变量包括各种各样关于历史赛马结果的统计信息。赌马者先得到10个最有用的变量,然后对赛马结果做出预测。然后他们再得到10个变量,再做出预测。信息的增加并没有增加预测的准确性,只不过他们对预测的信心极大地提高了。信息被证明是有害的。我一生中大部分时间都在“越多越好”这样的庸俗观念中挣扎。多有时候是好的,但并非总是如此。知识的危害性在我们对所谓专家的研究中能够显露出来。

专家问题,可悲的虚有其表

到目前为止,我们还没有质疑过专业人士的权威,而只是质疑他们对自己知识的有限性做出评价的能力。认知自大并不排除技能的存在。一个管道修理工几乎总会比顽固的评论员更懂得管道修理。一个疝气外科医生在疝气方面的知识几乎不可能比胃癌知识少。但另一方面,专家对概率却处于无知状态,而且你比专家更了解这一点。不论任何人告诉你任何事,对专家思考过程的错误率提出疑问都是有好处的。不要质疑他的过程,只要质疑他的自信。(作为一个被医生骗过的人,我学会了谨慎,并且我号召所有人谨慎:如果你带着某种病症走进一个医生的办公室,不要听他讲你患的不是癌症的概率。)

我会分别讨论如下两种情况:温和的情况,在拥有(某种)能力情况下的自大,和严重的情况,自大而没有能力(虚有其表)。对于有些行业,你懂的比专家还多,但你却为他们的观点付钱,而不是他们付钱请你听他们胡说。这是哪些行业呢?

变与不变

关于所谓的专家问题有大量文献,它们对专家的能力做出了实证检验。但结果最初看来有点令人疑惑。一方面,保罗·米尔(Paul Meehl)和罗宾·道斯等研究者否认专家的能力,他们告诉我们“专家”是最接近骗子的人,他们的思考能力比只使用一个变量进行计算的计算机好不了多少,他们的直觉妨碍了他们的思考,并使他们变得盲目。(举一个只使用一个变量的例子,流动资产与流动负债的比率比大多数信用分析师的作用更大。)另一方面,大量文献表明,许多人能够凭借直觉打败计算机。哪一个是对的?有些学科的确存在真正的专家。我们考虑下面这几个问题:你愿意让某报纸的科学记者还是有执照的脑外科医生为你做脑部手术?另一方面,你愿意听某个“著名”学院,比如沃顿商学院毕业的金融博士还是某报纸的商业版作家对经济做出预测?虽然对第一个问题的回答非常明显,但对第二个问题不是?我们已经认识了“技术”和“知识”的区别。

心理学家詹姆斯·尚蒂(James Shanteau)研究了哪些学科有真正的专家,哪些学科没有。请注意这里的证实问题:如果你要证明没有专家,那么你需要找到一个专家无用的领域。你也可以以同样的逻辑证明相反的观点。但有一个问题:有的领域专家是起作用的,有的领域则无法证明存在特定技能。这些各是什么情况呢?

是专家的专家:牲畜检验员、宇航员、飞机试驾员、土壤检验员、国际象棋大师、物理学家、数学家(研究数学问题而非经验问题)、会计师、谷物检验员、图像分折员、保险分析师(研究钟形曲线统计问题的)。

不是专家的专家:证券经纪商、临床心理医生、精神病医生、大学招生官员、法官、顾问、人事官员、情报分析师(虽然花了那么多钱,但美国中央情报局的历史表现很令人遗憾)。我还要加上我自己分析文献的结果:经济学家、金融预测者、金融学教授、政治科学家、“风险专家”、国际清算银行员工、国际金融工程师协会的傲慢成员以及个人金融咨询师。

很简单,因变化而需要知识的事物,通常是没有专家的,而不变的事物似乎会有专家。也就是说,与未来有关,并且其研究是基于不可重复的过去的行业通常没有专家(天气预测以及从事短期物理活动,而非社会经济活动的行业除外)。我并不是说任何从事未来预测的人都不能提供有价值的信息(如我之前指出的,报纸能够非常准确地预测剧院开门的时间),而是说那些无法提供具有可见价值信息的人通常从事预测行业。

认识这一点的另一个角度,就是看到变化的事物通常易于受黑天鹅事件的影响。专家就是一群习惯“筛选”的思维狭隘的人。在筛选不导致错误的情况下,因为黑天鹅事件的影响很小,专家会表现不错。

进化心理学家罗伯特·特里弗斯(Robert Trivers)是一个有着非凡洞察力的人,他有不一样的答案。(凭惜他在努力进入法学院期间形成的思想,他成为自达尔文以来最有影响力的进化思想家。)他用自欺来解释。在存在古老传统的领域,比如掠夺,我们非常善于通过衡置力量对比预测结果。人类和黑猩猩能够立即感知对立的双方哪边处于上风,对是否发动袭击抢夺物资和配偶做出成本收益分析。一旦发动袭击,你会使自己进入忽略额外信息的错觉思维状态——在战斗中最好避免摇摆。另一方面,与偷袭不同,大规模战争不属于人类天性,我们是新手,所以我们经常错误估计它们的持续时间,而高估我们的相对实力。回忆一下人们对黎巴嫩战争持续时间的低估。参加世界大战的人以为它只是一场小争端。越南战争、伊拉克战争以及几乎所有现代战争都是如此。

你不能忽视自我欺骗。专家的问题在于他们不知道自己不知道什么。知识的缺乏与对你所掌握的知识的错觉是相伴而行的,你在知识减少的同时也变得对自己的知识更加满意。

而且,我们不是做范围预测,而是喜欢做精确预测,也就是相信自己预测精确数字的能力。

怎样笑到最后

我们还可以从交易活动中研究预测错误。我们数理专家掌握着大量经济和金融预测数据,从宏观经济变量的一般数据,到电视“专家”和“权威”的预测数据。这类数据的充足性以及我们用计算机处理它们的能力使得这个问题对经验主义者毫无意义。假如我是一名记者,或者一名历史学家,我评价起这些口头预测的有效性来就会困难得多。你无法用计算机处理口头评论,至少没那么容易。而且,许多经济学家会犯一种天真的错误,那就是针对许多变量提出许多预测,这使我们形成了一个关于经济学家和变量的数据库,让我们能够看出哪些经济学家比其他经济学家优秀(没有很大差别)或者是否存在一些他们较为擅长预测的变量(唉,没有)。

我处于一个非常近距离地观察我们的预测能力的位置。在我全职从事交易的日子里,每周一两次,我的电脑屏幕会在早上8点半闪现美国商务部、财政部或其他值得尊敬的大机构公布的数字。我一直不明白这些数字是什么意思,也一直看不出有花精力弄明白它们的必要。所以,我不会对它们有任何兴趣,只除了一点,那就是人们非常热衷于这些数字,热情地谈论它们的隐含意义,大做预测。这些数字包括消费者价格指数(CPI)、非农业从业人数(就业人数的变化)、先行经济指标指数(Index of Leading Economic Indicators),耐用品销量、国内生产总值(最重要的一个)以及许多其他依出现时机不同而制造不同兴奋水平的指标。

这些数据贩子让你能够了解“顶尖”经济学家的预测,他们是为J·P·摩根和摩根士丹利这类令人敬畏的大机构工作的(穿西装的)人。你会看到这些经济学家夸夸其谈,以一种雄辩而肯定的语气大谈理论。他们大部分人赚7位数的收入,俨然一副明星的派头,他们背后则有成群的研究员处理数据和预测结果。但这些明星足够愚蠢,竟会在大庭广众之下大谈这些预测数字,让他们的子孙能够看到并评价他们的能力。

更糟糕的是,许多金融机构每到年底都会发行名为《200X年展望》的书,对来年做出预测。当然,他们不会检查他们之前的预测在事后的准确性。公众不进行下面这个简单的测试就购买这些预测则更为愚蠢——虽然这个测试很简单,但很少有人做过。一个简单的实证检验就是把这些明星经济学家与一个假想的出租车司机(就像第一章中的司机米哈伊尔)做比较:假想一个对比对象,他把最近公布的数字当做对未来的最佳预测,而他本人什么也不知道。接下来你只需要把明星经济学家的错误率与假想的对比对象做比较。问题在于,当你被各种故事弄得晕头转向时,你会忘记做这个测试的必要性。

重大事件出人意料

预测的问题更为微妙。它产生的原因主要在于我们生活在极端斯坦,而非平均斯坦。我们的预测者可能更善于预测常规事物,而不是非常规事物,这就是他们预测失败的原因。你只需要犯一次对长期趋势的预测错误,比如错误地预测利率从6%到1%的长期变化(2000~2001年的实际情况),你就会使所有接下来的预测都无法修正你的累积错误。重要的不是你预测正确的频率,而是你的累积错误有多大。

预测的累积错误在很大程度上来自大的意外事件。不但经济、金融和政治预测无法预测它们,这些预测还羞于提及任何非常规的事,而事实上重大事件几乎总是非常规的。而且,如我们将在下面看到的,经济预测者习惯于互相重复观点,而不是接近未来的真相。谁也不愿意突出自己。

由于我的测试是非正式的,以商业和娱乐为目的,是供我自己消遣,而不是为发表而设计的,下面我将引用其他研究者更为正式的结果,它们经历了漫长的发表过程。我惊异于人们对这些行业的有用性做了如此少的反省。针对三个行业存在一些正式测试,但不多:证券分析、政治学和经济学。在未来几年毫无疑问会有更多测试,也许没有,因为这类论文的作者或许会被他们的同事排挤。在近100万份政治学、金融学和经济学论文当中,只有极少部分对这些知识在预测方面的作用提出质疑。

像牛一样结群

一些研究者研究了证券分析师的工作状况和态度,结果很令人吃惊,尤其是他们的认知自大。塔德乌什·蒂什卡和皮耶·捷隆卡把他们与天气预测员做了比较,发现他们的预测能力更差,但对自己的技能更为自信。出于某种原因,在预测失败之后,这些分析师的自我评价并没有降低他们的错误率。

2006年6月,我去巴黎拜访让·菲利普·鲍查德时,曾向他哀叹这类研究的稀少。他是一个孩子气的人,看上去年纪只有我的一半,实际上却只比我年轻一点,我半开玩笑地将这归因于物理之美。实际上他并不是严格意义上的物理学家,而是一名数理科学家,运用统计物理学方法研究经济变量,这一领域由贝诺特·曼德尔布罗特在20世纪50年代末开创。该学科不使用平均斯坦的数学,所以他们似乎对真理感兴趣。他们完全在主流经济学和商学院金融学之外,他们在物理和数学院系谋得一席之地,并常常在证券公司同样谋得一席之地(交易员雇用经济学家很少是为了自己的消遗,而是为了给不那么精明的客户讲故事)。与穿西装、编造理论的经济学家不同,他们使用经验方法来观察数据,并且不使用钟形曲线。

鲍查德拿出一篇令我吃惊的研究论文,是一个在他指导下的暑期实习生刚刚写完的,并且即将发表。这篇论文仔细研究了证券分析师的2000项预测。研究结果是这些证券公司的分析师什么也没预测,一个随便把某一期的数字当做对下一期预测的人也不会比他们做得更糟糕。但分析师们掌握了各家公司的订单、未来合约、计划支出,所以这些信息优势应该能够帮助他们打败某个只看过去数据而没有进一步信息的无知预测者。更糟糕的是,这些预测者的预测错误比单个预测之间的平均差异大,这表明存在结群现象。正常情况下,单个预测之间的平均差异应该与平均预测错误一样大。但为了理解他们如何保住工作,以及为什么他们没有出现严重的崩溃现象(体重减轻、行为怪异或者酗酒),我们必须看一看菲利普·泰洛克的研究。

我“几乎”是对的

泰洛克研究了政治和经济“专家”。他让不同的专业人士判断某个特定的时间范围内(大约5年之后)一些政治、经济和军事事件发生的可能性。他一共获得了大约27000份预测,涉及近300名专业人士,经济学家占样本的近1/4。这项研究表明,专家的错误率是估计水平的很多倍。他的研究揭示了一个专家问题:一个人拥有博士学位或学士学位是没有区别的。发表文章众多的教授相对于记者没有任何优势。泰洛克发现的唯一正常事实就是名望对预测的消极影响:拥有高度名望的人比没有名望的人预测得更糟糕。

但泰洛克并不是只想掲示专家的实际预测能力(尽管该研究在这一点上相当具有说服力),而是更希望解释为什么专家们没有意识到他们不太擅长本行,也就是说,他们是如何编造故事的。这种不自知是存在某种逻辑的,主要是信仰维护,或者对自我评价的捍卫。于是他更深入地研究了他的受试者为事件编造事后解释的机制。

下面这个例子揭示了一般的思维缺陷。这些“专家”具有偏向性:当他们正确的时候,他们将之归功于他们的洞察力和专业能力;当他们错误的时候,他们要么怪具体形势超出常规,要么根本不知道自己错了,还继续编故事。他们很难承认自己的知识有限。但我们的所有行为都有这种特点:我们体内有一种维护自我评价的东西。

人类在对随机事件的认识上容易犯不对称的错误。我们把成功归因于能力,把失败归因于在我们控制之外的事物,比如随机性。对好结果我们感到有功劳,对坏结果却不感到有责任。这使我们以为我们在谋生的领域比其他人都在行。94%的瑞典人相信他们的驾驶技术在瑞典司机中排在前50%,84%的法国人认为他们的调情技巧进入全法国前50%。

这种不对称性的另一个结果是,我们以为自己不同于那些没有这种不对称性思维的人。我已经提过结婚者对未来的不现实预期。想一想有多少家庭对未来进行筛选性假设,他们把自己锁在牢固的房产中,以为会在那里生活一辈子,而不知道人们过稳定生活的记录很糟糕。他们难道没有看见那些衣冠楚楚的房地产经纪人开着漂亮的德国轿车到处转吗?我们是非常漂泊不定的,比我们计划的不稳定得多,而且不得不如此。想一想有多少突然失去工作的人料到了这一点,即使只提前几天,或者想一想有多少瘾君子在一开始是打算长期吸毒的。

泰洛克的实验还提供了另一个教训。我之前已经提过,他发现许多大学明星或者“顶尖刊物的撰稿人”,并不比普通的《纽约时报》读者或记者更善于发现世界的变化。这些过于专业的专家们通常无法通过他们自己领域里的测试。

泰洛克根据评论家以赛亚·伯林(Isaiah Berlin)提出的分类方法,将预测者分为两类,刺猬与狐狸。在伊索寓言中,刺猬只知道一件事情,而狐狸知道许多事情,生活中需要这两类人。许多预测错误来自刺猬,它们在观念上只拥抱一个低概率而影响巨大的事件,从而落入叙述谬误的陷阱,被一个可能的结果蒙蔽,而无法想象别的结果。

由于叙述谬误,我们更容易理解刺猬,他们的观点听起来很不错。名人中有大量刺猬存在,因此名人比其他人的平均预测能力更差。

我在一段很长的时间内避免接触媒体,因为每当记者听到我的黑天鹅理论时,都会让我预测未来具有影响力的事件。他们希望我预测这些黑天鹅事件。出于某种奇怪的巧合,我在2001年9月11日前一周出版的《随机致富的傻瓜》一书中提到了一架飞机撞入我所在的办公楼的可能性,所以人们很自然地请我解释“我是如何预测的”。我没有预测,那只是巧合。我不是假装圣哲!我最近还收到一封电子邮件,请我列出即将发生的10件黑天鹅事件。大部分人没有理解我所说的具体错误、叙述谬误和预测问题。与人们所以为的相反,我并不是在建议所有人都成为刺猬,而是希望人们成为思想开放的狐狸。我知道历史将被低概率事件主宰,但我不知道到底是什么事件。

现实?有什么意义?

我在经济学刊物中没有找到泰洛克式的正式全面的研究。但是,我也没有找到鼓吹经济学家进行可靠预测的能力的论文。于是我浏览了能够找到的经济学论文和论文草稿。它们并没有提供具有说服力的证据来证明经济学家有预测能力,即使他们有一定的能力,他们的预测至多只会比随机预测好一点点,但没有好到对重要决策有帮助的程度。

关于学术方法在现实中的作用,最有意思的测试来自斯派罗斯·马克利达基斯。他把一部分时间花在管理竞争上,那是一种使用计量经济学的“科学方法”进行的预测竞争,计量经济学是一种把经济学理论与统计方法相结合的学科。简而言之,他让人们对现实生活做出预测,并对他们的准确性做出评价。这就是他的一系列“马氏竞争”,在米歇尔·海本的帮助下,他于1999年完成了第三次,也是最近一次竞争实验。马克利达基斯与海本得出一个令人沮丧的结论——“统计学上高深与复杂的模型不一定能比简单模型提供更为精确的预测”。

我在从事数理工作的时候有过完全相同的体验,整晚在计算机上进行复杂数学运算的科学家很少能比使用最简单的预测方法的出租车司机预测得更准。问题在于我们只看到这些方法奏效的少数情况,而几乎从不注意它们数量更为庞大的失败。我不断问那些愿意听我说话的人:“嗨,我是来自黎巴嫩艾姆云的毫不复杂也不糊涂的人,我不能理解为什么人们认为那些需要计算机整夜运行但不能帮助我更好地做出预测的东西是有价值的。”我从这些人那里得到的全部回答都与艾姆云的地理和历史有关,而从未得到一个和他们的专业沾边儿的回答。再一次,你看到了叙述谬误的影响,只不过现在你看到的不是新闻故事,而是更糟,你看到的是有俄罗斯口音的“科学家”在后视镜中观察事物,用方程式描述事物,并拒绝向前看,因为那会使他头晕目眩。计量经济学家罗伯特·恩格尔本来是一位具有魅力的绅士,但他发明了一种非常复杂的统计方法,取名GARCH,并因此获得诺贝尔奖。没人测试过它对现实生活是否有效。更为简单朴素的方法比它有效得多,但无法带你去斯德哥尔摩领奖。在斯德哥尔摩存在专家问题,我会在第十七章谈到。

在几乎一切领域,复杂方法对现实都不适用。另一项研究对博弈论的实践者进行了分析,其中最著名的人物是约翰·纳什,因电影《美丽心灵》而出名的患精神分裂症的数学家。不幸的是,尽管博弈论在学术上很有魅力,并获得了媒体的大量关注,其实践者还是不比普通大学生更擅长预测。

还有一个问题,一个更令人烦恼的问题。马克利达基斯与海本后来发现,他们的研究提供的强大经验证据被理论统计学家忽视了。而且,他们遭遇了对他们的实证检验成果的巨大敌意。“相反,统计学家把精力放在建造更为高深的模型上,而不考虑这类模型是否能够更为准确地预测现实生活。”马克利达基斯和海本写道。

人们或许会碰到下面这个观点:经济学家的预测可能会招致使其无效的反馈(这被称为卢卡斯评判,名称取自经济学家罗伯特·卢卡斯)。假设经济学家预测将发生通货膨胀,而根据这些预测,美联储做出反应,使通货膨胀降低。因此你无法向在其他领域那样对经济学领域的预测做出准确性评价。我同意这一观点,但我不认为这是经济学家预测失败的原因。世界对他们的学科而言太复杂了。

当一名经济学家未能预测到意外事件的发生时,他通常会提到地震或革命,声称他不是从事大地测量学、大气科学或政治学的,而不是把这些学科纳入他的研究并承认他的学科不是孤立存在的。经济学是最孤立的学科,它是最少引用本学科以外观点的学科!它也或许是目前拥有市侩学者最多的学科,这些市侩学者涉猎不广泛,也不具备天然的好奇心,思维封闭,最终会导致学科的分裂。

“除此以外”都很好

我们用悉尼歌剧院的故事作为预测讨论的起点。现在我们要讨论人性中的另一个特点:计划者会犯一种系统性错误,它是人性与世界或组织结构复杂性混合作用的结果。为了生存,各种组织需要让自己和别人相信它们有一个“愿景”。

计划失败是因为人们具有筛选性思维,即忽视计划之外的不确定性来源。

典型的情景是这样的:乔,一名非虚构类作家,得到一份出书合同,交稿日期定在从现在开始的两年以后。书的内容很简单:作家沙尔曼·拉什迪(Salman Rushdie)的传记,乔已为此收集了大量信息。他甚至追踪了拉什迪的全部前女友,预见到会与她们有非常愉快的面谈。离两年期限还有三个月的时候,他打电话向出版商解释,他需要推迟一小段时间。出版商已经料到这种情况,他对作者推迟交稿已经习以为常。出版公司现在有些退缩,因为书的内容已经出人意料地失去了公众的兴趣,公司原以为公众对拉什迪的兴趣会保持在很高水平,但它实际上已经逐渐消失了,或许是因为伊朗人出于某种原因不再对他感兴趣。

让我们看一看传记作者低估写作所需时间的原因。他根据自己的时间表制订计划,但他犯了筛选性错误,没有预见到某些“外部”事件可能发生,从而延缓他的进度。这些外部事件包括2001年9月11日的灾难,这耽搁了他几个月;去明尼苏达州照顾生病的母亲(她最终康复了);以及许多别的事件,比如与女友分手(但不是与拉什迪的前女友)。“除此以外”,一切在他的计划之内,写书的事一点也没有偏离时间表。他对不能按时交稿不感到负有责任。

意外对计划产生单边影响。想一想建筑商、论文作者和承包商的历史记录。意外几乎总是产生一个方向的结果:更高的成本和更长的完成时间。只在很少的情况下,比如帝国大厦,你会看到相反的结果:更低的成本和更短的时间,这些情况是真正的意外。

我们可以通过实验和重复性检验来确定这种计划错误是否是人类本性的一部分。研究者已经对学生做过测试,让他们估计完成研究项目所需的时间。在一次有代表性的测试中,他们把一群人分为两组,乐观的和悲观的。乐观的学生估计26天,悲观的学生估计47天,而实际的平均完成时间是56天。

乔的例子并不极端。我选它的原因是它涉及的是可重复的、常规性的任务,对这类任务,我们的计划错误会小一些。对于具有较大非常规性的计划,如军事入侵、全面战争或者某件全新的事,计划错误会急剧上升。实际上,任务越具常规性,你预测得越准确。但在现代环境下,总有非常规的事情。

人们许诺在较短的时间内完成任务是有动机的,是作者为了赢得出书合同,或者是建筑商为了得到首付款好去度假。但即使不存在低估完成时间(或成本)的动机,人们仍然会犯计划错误。我已说过,我们的思维太狭隘了,无法考虑时间偏离我们预测的可能性,而且,我们太过专注于相关任务内部的失误,而不考虑外部不确定性,即“未知的未知”,或者说那些我们没有读过的书的内容。

还存在一种愚人效应,它产生于我们在思维上对模型外风险的忽视,或者说只专注于我们所知道的。我们从一个模型内部观察世界。想一想,大多数延迟和超额预算来自不被计划考虑的意外因素,也就是说,它们出于模型之外,比如罢工、断电、车祸、坏天气或者火星人入侵的谣言。这些妨碍我们计划的小黑天鹅事件是我们没有考虑到的。它们太抽象了,我们不知道它们的具体形式,无法以一种显得聪明的方式谈论它们。

我们并不真正擅长制订计划,因为我们不懂未来,但这不一定是坏消息。只要记住我们的这些缺陷,我们就可以制订计划,只是需要勇气。

技术之美:Excel表格

在不远的过去,比如前计算机时代,预测是模糊而定性的,人们必须努力运用想象,而想象未来情景是非常艰难的。人们要用铅笔、橡皮、大量纸张和巨大的废纸篓来完成这项工作,此外会计师还要对繁复而进展缓慢的工作充满热情。简而言之,预测是一项费力、不讨人喜欢和充满自我怀疑的工作。

但随着电子数据表的出现,情况改变了。当你把一张Excel表格交给一位计算机老手的时候,你就会毫不费力地得到无限期的“销售预测”!一旦预测被放在一页纸或电脑屏幕上,或者更糟,被放在PowerPoint演示文件中,这一预测就有了自己的生命,失去了它的模糊和抽象性,变成哲学家所称的具体的东西。它拥有了新的生命,成为可见的事物。

我的朋友布赖恩·欣奇克利夫提出了下面的观点:或许,正是因为人们可以轻易地在电子数据表格里通过公式来预测未来,才使得那些预测大军信心十足地进行更长期限的预测(同时进行筛选性假设)。多亏了这些强大的计算机程序,我们这些不知如何处理知识的人成了糟糕的计划者。与大部分商品交易员一样,布赖恩是一个思想尖锐的人,有时表现出残酷而痛苦的现实主义。

这其中似乎存在一种经典的思维机制,叫做锚定。通过设想一个具体数字,你降低了对不确定性的不安,然后你“向它下锚”,就像在真空中抓紧一个物体。这种锚定机制是不确定性心理学的鼻祖丹尼·卡尼曼和阿莫斯·特沃斯基在早期对启发式思维和认知偏差的研究中发现的。研究是这样进行的。卡尼曼和特沃斯基让受试者启动未来之轮。受试者首先看轮子上的数字,他们知道数字是随机的,然后估计加入联合国的非洲国家的数量。轮子上的数字较小的受试者估计了一个较小的数量,数字较大的受试者估计了较大的数量。

类似地,让某人告诉你他的社会保障号码的最后四位数,然后让他估计曼哈顿牙医的数量。你会发现,通过提醒他一个4位数的数字,你会诱导出一个与之相关的估计结果。

我们在头脑中形成参照点,比如销售预测,然后开始基于它构造信念,因为把一个观点与一个参照点进行比较比在绝对的环境下对它进行评价所需的思维努力更小。(系统1在起作用!)我们无法在没有参照点的情况下思考。

所以在预测者头脑中设置一个参照点能够带来奇妙的结果。在讨价还价过程中设置起点是一样的道理:你先提出一个较高的数字,如“这所房子要卖100万美元”,买方会说“只能85万”——议价过程将取决于初始报价。

预测错误的特点

与许多生物变量一样,寿命属于平均斯坦,也就是说,它只具有温和的随机性。它不具有突破性,因为我们越老,活下去的机会越小。根据保险表格,在发达国家,新生女婴的寿命为大约79岁。在她的79岁生日,假设她具有平均健康水平,她的预期寿命还有10年;90岁时,她可能还能活4.7年;100岁时还能活2.5年;119岁时,假如她奇迹般地活了这么久,她还剩下大约9个月。随着她逐渐活过预期死亡日,预期的余下寿命会越来越短。这是钟形曲线随机变量的主要特点。对余下寿命的条件期望随着年龄的增长而降低。

对于人类的计划和冒险活动,又是另一番情形。如我在第三章所述,它们通常是具有突破性的。对于属于极端斯坦的突破性变量,你会看到截然相反的结果。假设一项计划预期在79天内完成,这里的天相当于上述新生女婴的年。在第79天,假如计划还未完成,那么人们预测它还需要25天;但在第90天,假如计划还未完成,它会还需要58天;在第100天还需要89天;在第119天还需要149天;在第600天,如果计划还未完成,你会预测它还需要1590天。如你所见,你等待的时间越长,你预期还要继续等待的时间就越长。

假设你是等待回到故乡的难民。每过去一天,你离回去的那一天就越远,而不是越近。建造下一座歌剧院的情况是一样的。如果预期需要两年时间,而三年后你还想知道何时完工,就不要指望它在很短的时间内竣工。如果战争平均持续6个月,而你的战争已经持续了两年,那么问题的解决大概还需要几年。阿拉伯与以色列的冲突已经持续60年,而且还在继续,但在60年前它被认为是一个“小问题”。(请总是记住一点,在现代环境下,战争会比计划中持续更久并且会死更多人。)另一个例子:假设你给你最喜欢的作者写了一封信,你知道他很忙,并且回信需要两周时间。如果三周后你的邮箱仍然是空的,就不要指望明天有回信,平均还需三周才会有。如果三个月后还是什么也没收到,你就不得不准备好再等一年。每一天都会使你更接近死亡,更远离收到回信的日期。

这种可测性随机现象微妙而极具影响的特点是非常反直觉的。我们通常会错误理解这种极大偏离常规的现象。

我将在第三部分更深入地讨论可测性随机现象的特点,但允许我现在就指出它们是我们错误理解商业预测的关键。

不要穿越(平均)4英尺深的河流

公司和政府的预测还有一个容易辨认的错误:他们不为预测的情形附加可能的错误率。即使不存在黑天鹅现象,这种遗漏也是错误的。

我曾经在华盛顿特区的伍德罗·威尔逊中心为政客们做过一次演讲,让他们知道我们在预测方面的局限性。

到场的人非常有涵养。我对他们讲的东西违反了他们相信和维护的一切,我完全沉浸在我的过激观点中,但他们看上去很温和,与那些极具进攻性的商界人士不同。我为自己的进攻性姿态感到不好意思。很少有人提问。组织这次演讲并邀请我的人一定对他的同事开了一个玩笑。我就像一个激进的无神论者,在一群主教面前夸夸其谈,而且没有使用委婉说法。

但有些听众对我的言论产生了共鸣。一个匿名者(他受雇于政府机构)在演讲后私下告诉我,2004年1月,他的部门预测25年后的石油价格为每桶27美元,比当时的石油价格只高一点。6个月后,即2004年6月前后,石油价格翻了一倍,他们不得不将预测修改为54美元(在我写下这些文字时,石油价格为每桶近79美元。)他们没有想过即使他们的预测如此快和显著地存在错误,进行第二次预测也是荒谬的,以至于他们应该对预测这件事本身提出某种质疑。而且他们在预测25年后的事情!他们也没有想过有一种叫做错误率的东西需要考虑。

不考虑错误率的预测显示出三种谬误,都来自同样对不确定性本质的错误理解。

第一种谬误:可变性问题。第一个错误在于太看重预测,而不关心它的准确性。但对于计划的目的而言,预测的准确性比预测本身重要得多。我对这一点进行如下解释。

不要穿越一条平均4英尺深的河流。如果我告诉你某个遥远的目的地的温度预计为21摄氏度,预期误差为4摄氏度,你会带上不同的衣物。我们的决定更多依赖于结果的可能范围,而不是预计的最终数字。为一家银行工作期间,我见过人们在不考虑任何不确定因素的情况下预测公司的现金流。去看看股票经纪商使用什么方法预测10年后的销量来调整他们的估值模型;去看看分析师如何预测政府赤字。去银行或证券分折师的培训课程,看看他们如何教受训者进行假设。他们不会教你对那些假设估计错误率,但它们的错误率比预测本身更显著!

第二种谬误在于没有考虑随着预测期限的加长,预测效力会降低。我们没有认识到近期未来和远期未来之间的差别。但只通过简单的反省测试就能看出,预测效力随时间的推移而降低,甚至不需要借助科学论文,而且关于这个课题的论文是非常少的。想一想人们在1905年对未来20年的预测,不论是经济方面还是技术方面。1925年与预测中的有多接近?一个具有说服力的例子是乔治·奥韦尔的《一九八四》。或者看一看1975年对新千年的预测。有许多预测者想象之外的事件和技术发生,人们预计发生的更多的事没有发生。我们的预测错误向来巨大,所以,我们大概也没有理由认为我们突然处于更有利的位置,能比我们的祖先更准确地预测未来。官僚主义者的预测更多是为了释放压力,而不是做决策。

第三种谬误或许是最严重的,它在于对被预测变量随机性的错误认识。由于黑天鹅现象,这些变量可能会出现比所预测的乐观得多或悲观得多的结果。回忆一下我和丹·戈尔茨坦所做的关于直觉的领域特殊性的测试,我们在平均斯坦一般不会犯错误,但在极端斯坦会犯严重的错误,因为我们没有认识到稀有事件的影响。

这意味着什么?即使你认同某项预测,也必须考虑现实中严重偏离这一预测的可能性。这种偏离或许会受到不依赖稳定收入过活的投机者的欢迎,然而,承受风险能力有限的退休者禁不起这种意外。我要运用河水深度的观点,进一步说明在制定政策时估计范围的下限(即最糟情况)才是重要的,最糟情况比预测本身重要得多。当人们不能接受糟糕的情况时,这一点尤其重要。但人们现在的措辞习惯不允许提到坏情况,完全不能提。

人们常说智者能够预测未来,或许真正的智者是那些知道自己不能预测未来的人。

换一份工作

当我质疑预测者的工作时,通常得到两种反应:一种是,“应该怎么办?你有更好的预测方法吗?”另一种是,“假如你那么聪明,让我看看你自己的预测”。实际上,人们通常以傲慢的姿态提出第二个问题,旨在显示实践者和“行动者”相对于哲学家的优越性,他们通常不知道我从事证券交易。如果说每天从事这种不确定性实践有什么好处的话,那就是你不需要听官僚主义者的任何废话。

我的一名客户问我有什么预测。当我告诉他我没有预测时,他感到恼怒,并决定终止我的服务。人们有一种缺乏反省的习惯,就是让公司回答一些问卷表,填写他们的“展望”。我从来不做展望,也从来不做专业预测,但至少我知道我无法预测,并且一少部分人(我所关心的人)把这当做一种优点。

有些人提供不负责任的预测。当被问到为什么要预测时,他们回答:“嗯,人们付钱让我们这样做。”

我对这种人的建议是:换一份工作。

这个建议并不难:除非你是奴隶,我想你对职业选择多少是有些控制力的。否则这就会成为一个道德问题,而且很严重。我无法把那些仅仅因为“这是我的工作”而进行预测,并且非常清楚自己的预测根本无效的人称为有道德的人。

任何因为预测而对他人造成伤害的人都应该被称为傻瓜或骗子。有些预测者对社会造成的损害比罪犯更大。求求你们了,不要戴着眼罩开学校班车。

在肯尼迪机场

在纽约肯尼迪机场,你能看到很多墙上摆满杂志的巨大报刊亭。它们通常是由来自印度次大陆的彬彬有礼的家庭经营的(只包括父母,孩子都在医学院)。那些墙面向你展示了一个“眼观六路”的人要想“了解正在发生什么”而必须拜读的全部文献。我很想知道要把这些杂志逐一读完需要花费多少时间,钓鱼和摩托车杂志除外(但必须包括八卦杂志,你也得找点乐趣)。半生的时间?一生的时间?

第十章 无赖预测 - 图1

那些向我们告知未来的人总是让我们上当。在这张画中,算命者正在偷受害者的戒指。

图10-1 卡拉瓦乔(Caravaggio)的《算命者》

不幸的是,并非所有这些知识都能帮助读者预测明天会发生什么。实际上,它还可能降低你的预测能力。

这是预测问题的另一个方面:预测的固有局限性,与人性没有多大关系,而是来源于信息本身的特性。我已经说过,黑天鹅现象有三个特点:不可预测、影响重大、事后可解释。下面我们来讨论不可预测性。

《随机致富的傻瓜》一书的中文版已由中信出版社于2007年出版,——编者注

虽然预测错误总是达到可笑的地步,商品价格却一直是愚人的圈套,看一看美国官方在1970年所做的预测(得到美国财政部长、国务卿、内政部长和国防部长的批示):“外国原油在1980年的标准价格很可能下降,并且在任何情况下都不会出现大幅上涨。”石油价格在1980年之前上涨了10倍。我只是奇怪现在的预测者是不是缺乏好奇心,或者是否故意无视预测错误,还有一个不正常现象:高石油价格导致高存货,石油公司空前赚钱,石油公司管理人员获得巨额奖金,因为“他们干得非常不错”——看上去他们在通过刺激石油价格上涨赚钱。

关于凯瑟琳的情人数量,我还欠读者一个回答:她实际上只有12个情人。