第六章
经济预测:经济学家为什么没有预测到 2008 年经济危机?
政治选举预测总是被报道存在误差幅度,这让我们看到了其中的不确定性。大多数时候,经济预测都是以单一的数字呈现出来,比如,经济政策下月将会创造 150 000 个就业机会,2013 年的国内生产总值(GDP)将会增长 3%,原油价格将提高到每桶 120 美元,诸如此类。
这些数字会让人觉得这些经济预测惊人地准确。于是,各类报刊常会在报道中对经济预测出现的微小误差表现得大惊小怪:
“失业率意外剧增至 9.2%,引发市场阵痛。”
《丹佛邮报》,2011 年 7 月 9 日
如果你看过那篇字号超小的文章,就会发现这个“意外”的结果是,失业率的确达到了 9.2%,而不是经济学家此前预测的 9.1%。如果 0.1%的误差就足以上头条新闻,看来这些预测通常必须做到非常可信才行。
然而,经济预测最多不过是一个生硬的工具,很少能提前几个月预知经济的转折点。实际上,更常见的情形是这些预测甚至连已经开始且正在进行中的经济衰退都无法“预言”。最近的 3 次经济衰退——1990 年、2001 年和 2007 年经济衰退——都是这样的情形,衰退明明已经开始,但大部分经济学家却不乐意承认,直到最后才确认这一点。
对美国经济这样复杂庞大的事物进行预测,是一项极具挑战性的工作。这些预测的实际表现和人们对它们的看法之间存在着巨大的差距。
一些经济预测者不愿意让人们知道这一点。与其他大多数学科的预测者一样,经济预测者将不确定性视作仇敌——威胁其名誉的仇敌。他们没有对不确定性做出准确的预测,而是武断地认为预测模型中的不确定性降低了,但在现实生活中,他们却无法提高预测的质量,这样做也无法改进真实世界中的预测。一旦洪水来袭,我们将毫无准备。
不可忽视预测中的不确定性
1997 年 4 月,北达科他州大福克斯市的北雷德河河水泛滥,河水漫过了市镇的堤坝,涌进市内长达 3.2 公里。尽管没有人员伤亡,但该城市 5 万居民几乎都得撤离,清理工作的费用高达几十亿美元,城市中 75%的房屋遭到了破坏或损毁。
与飓风和地震不同,大福克斯市的洪水本来是一场可以避免的灾难:这座城市的防洪石堤本该用沙袋加固,泛滥的洪水也本该被引流到人口稀少的地区——引流到农田里去,而非学校、教堂或住宅区。
大福克斯的居民其实在灾难发生的几个月前就意识到洪水的威胁了。那年冬天,平原地区的降雪格外多,美国国家气象局在积雪开始融化时就预计到会有径流,他们预言雷德河的河水最高会涨到 14.9 米深,接近历史最高纪录。
只是还有一个小问题,大福克斯的那些堤坝当初是按照可抵御深达 15.5 米的洪水的标准建设的,而这次的预测(14.9 米)哪怕出现很小的失误,都会酿成大祸。
结果,雷德河的水位涨到了 16.5 米深。不管怎么说,美国国家气象局的预测都称不上完美,但是,提前两个月做出的预测,出现约 1.6 米的误差也是合情合理的,这样的预测在历史上比比皆是。结合美国国家气象局以往对洪水预测的准确率来看,预测中的误差幅度约为±2.7 米,这便意味着堤坝被冲毁的概率为 35%。
问题是,美国国家气象局明显是刻意对公众隐瞒了预测中的不确定性,只是一味地强调水深将达 14.9 米这一预测结果。负责此次洪灾预测工作的预测者后来告诉那些研究人员,如果自己的观点中传达出任何含有不确定性的信息,他们都担心公众会因此对预测失去信心。
实则不然,如果预测者这样做了,公众反而能准备得更充分——尽可能地加固堤坝、将洪水引流以抵御这次洪灾。然而,若是让民众自行决定,许多人就会深信根本没什么可担忧的(几乎没人购买洪水保险)。气象专家毫无保留地预测此次洪峰为 14.9 米,似乎是在暗示人们,此次洪水的最大深度就是 14.9 米,分毫不差,15.5 米高的堤坝足以保护公众的安全。有些居民甚至将 14.9 米的预测值解读为洪峰可能达到的最大值。
图 6–1 洪水预测的误差幅度
有这样一个被引用了无数次的笑话:一位统计学家趟过一条平均水位不足 1 米深的河时,竟被淹死了。此次洪灾,美国国家气象局的预测模型给出的水位平均值是 14.9 米,但水位只要稍高一点,就会淹没整个城镇。
自此以后,美国国家气象局开始逐渐意识到向公众准确、诚实地传达不确定性的重要性。然而,其他领域的预测者几乎都没有秉持这种态度,在预测经济运行状况时尤其如此。
经济学家都是理性的吗?
现在,我们来回忆一下 2007 年 11 月都发生了什么事情。那是经济大衰退正式来临的前一个月,房地产市场已经出现明显的危机迹象:房产止赎率上涨了 1 倍,全美的抵押贷款机构全都濒临破产。信贷市场也出现了不祥的预兆。
费城联邦储备银行推出的一项关于“专业预测人员情况调查”(以下简称“调查”)的季度民调显示,很多经济学家认为经济衰退不大可能发生,相反,他们预期经济仍会缓慢增长,只不过略低于 2008 年 2.4%的平均增长率。他们还认为,发生严重经济衰退的概率几乎为零,殊不知当时一场严峻的经济衰退即将上演。
这项“调查”的独特之处在于,它要求受访的经济学家明确地指出经济发展的方向及可能产生的结果。正如我在本书中一直强调的那样,概率性思考是科学预测必不可少的组成部分。假设在你掷两个骰子之前,我让你说出所有可能出现的情况,正确的答案绝不会是一个单一的数字,而是列举出所有可能出现的数字以及各个数字出现的概率,如图 6–2 所示。假设从长远来看,每个数字出现的概率都与你的预计一致,尽管掷出数字 7 的可能性最大,但也未见得就能始终掷出这个数字,掷出数字 2 或 12 的概率也是同样大的。
“调查”要求受访的经济学家对 GDP 和其他经济变量进行预测时,也要考虑到概率问题,比如,估算 GDP 的可能值是 2%~3%还是 3%~4%。图 6–3 显示的是 2007 年 11 月,经济学家对 GDP 做出的预测:
图 6–2 预测结果的概率分布:投掷两个骰子可能出现的各种结果
图 6–3 预测结果的概率分布:美国 GDP 的真实增长水平(2008 年)
我在前面提到过,“调查”中受访的经济学家认为,2008 年 GDP 最终会实现约 2.4%的增长,略低于长期增势。这是一个非常糟糕的预测:2008 年金融危机爆发后,美国的 GDP 非但未增,实际上还缩减了 3.3%。更可笑的是,这些经济学家对其糟糕的预测竟然还满怀信心,他们认为,整个 2008 年经济出现缩水情况的概率不会超过 3%,GDP 缩减 2%的概率也只有 2‰,实际上,当年的 GDP 确实缩减了 2%。
的确,长期以来,很多经济学家对于自己预测经济发展趋势的能力都太过自信。在图 6–4 中,我标出了 1993~2010 年这 18 年间所有“调查”对 GDP 增长率的预测值。图中的竖条代表的是经济学家给出的预测区间中 90%的范围。
图 6–4 GDP 增长率预测:90% 的预测区间与实际情况对照表·
一个预测区间包含一系列由预测提供的有可能出现的结果,很像民调中的误差幅度。比如,90%的预测区间应该对现实生活中可能出现的结果实现 90%的覆盖率,而剩下那 10%的无关紧要的情况会被分配到预测区间的边缘位置。如果这些经济学家的预测如其所言,十分准确,那么预测区间里 GDP 增长率的实际数值十有八九是不会下跌的,或者说 18 年里只有两年 GDP 会出现下跌。
但实际上,GDP 的实际数值在 18 年里 6 次跌出了这些经济学家的预测区间,可以说这些预测的错误率足有 1/3。另一项研究将这些数据追溯到 1968 年,也就是这项“调查”的起始年,得到的结果更加糟糕:GDP 增长率的实际数值有 1/2 都跌出了预测区间。这就不能说是那些经济学家的运气不好了,而是他们从根本上夸大了其预测的可信度。
在现实生活中,当一群经济学家预测 GDP 时,90%的预测区间可以跨越约 6.4%的真实 GDP 增长率(相当于误差幅度为±3.2%),这要基于预测的实际表现,而非经济学家的一面之词。
当你从新闻中得知,明年的 GDP 将会增长 2.5%,这就意味着 GDP 很可能会以 5.7%的高比率轻松增长,当然也有可能下降 0.7%——一次严重的经济衰退。那些经济学家只能做到这种程度了,而且他们在预测方面似乎也没有什么进步。有这样一则笑话,经济学家对近期发生的 6 次经济衰退进行预测,结果正确预测的次数达到 9 次,这则老生常谈的笑话似乎有点儿道理。一项真实的统计数据表明,20 世纪 90 年代,在全世界 60 次经济衰退中,经济学家提前一年预测到的衰退只有两次。
就这一点而言,经济学家并非特例。这样的做法已成为预测行业的行规:那些专家既不擅长诚实地描述预测中的不确定性,对这种做法也不大感兴趣。过度自信的预测体现出的这种特性在其他许多领域也显露出来,包括医学研究、政治科学、金融学以及心理学。不论是靠人的判断进行预测(如菲利普·特罗克等政治科学家的预测案例),还是用统计模型进行预测,似乎都能找到过度自信的影子。
但是经济学家犯了这种错误后,也许无法像其他领域的专家那样总能找到借口。首先,他们的预测不仅过度自信,而且现实意义也不大,比如在预测实际 GDP 增长率时,误差很大,即经济学意义上的回旋余地很大。其次,有组织地预测 GDP 增长率这类变量的活动已经持续好多年了,可以一直追溯到 1946 年的美国利文斯顿调查,这些结果保存完好,可供人们免费参阅。收集人们对我们所作预测的反馈信息是改进预测的一种方式,也许也是一种基本方式。与大多数其他行业的专家相比,经济预测者能得到更多的反馈,但他们却并没有以此矫正过度自信的倾向。
经济学难道不应该成为研究人类理性行为的领域吗?当然,你可能可以理解其他领域的专家,比如人类学家,在进行预测时会表现出偏向性,但绝不希望经济学家这样。
然而,这其实只是这个问题的一部分。那些经济学家相当了解理性,这意味着他们也相当了解我们的动机是如何发挥作用的。如果他们做出带有偏向性的预测,就说明他们没有多强烈的动机去做出好的预测。
相关的两个经济变量未必互为因果
考虑到上述预测者的跟踪记录,我最想找到的经济学家只有一种:他愿意坦承预测工作并非易事,而且坦承自己的预测很容易出错。而我恰好找到了一位——简·哈祖斯,他是全球性投资银行高盛集团的首席经济学家。
近几年来,可以说哈祖斯至少比他的竞争对手更可信。2007 年 11 月,当大多数经济学家仍旧认为不可能出现经济衰退时,哈祖斯写了一份颇具挑衅意味的备忘录,标题为“举债经营带来的损失:抵押贷款违约为何事关重大”,这份备忘录警告人们,数百万名房产拥有者拖欠抵押贷款,引发信贷市场和金融市场的多米诺骨牌效应,造成数万亿美元的损失以及一场可能非常严重的经济衰退。事实证明,备忘录中提到的大部分情况都实实在在地发生了。同时,哈祖斯及其团队还迅速地降低了他们对危机后经济奇迹般复苏的可能性的估值。2009 年 1 月,美国通过了经济刺激方案,一个月后,美国白宫宣称,截止到 2009 年年底,失业率将降至 7.8%,而哈祖斯则预计,失业率会升至 9.5%(十分接近实际数字 9.9%)。
哈祖斯,一个成熟中略带忧伤的德国男人,在入职高盛 8 年后,于 2005 年成为公司首席经济学家,即使对大银行持怀疑态度的人,对他也会心存敬意。保罗·克鲁格曼曾经这样对我说:“(简·哈祖斯)为人友善,我希望高盛总裁劳埃德·布兰克费恩不要对简和他的团队横加干涉。”在谈到对美国经济走势的预测时,哈祖斯总是很谦逊。
我在纽约西街高盛公司明亮的办公室里与哈祖斯会面时,哈祖斯说:“说起这个问题,谁心里都没有底。商业世界的事极难预料,想要弄懂经济这种复杂的有机组织是非常难的。”
在哈祖斯看来,经济预测者面临着三大基本挑战。第一,单纯依靠经济统计数据,很难判断起因和结果。第二,经济始终都在变化,某一经济周期的经济运行状况无法被用来解释未来经济的发展。第三,经济学家以往的预测如此糟糕,那么他们作预测时所参照的数据也好不到哪里去。
美国政府每年公布的数据,与经济指标直接相关的有 4.5 万个,而私人数据提供者要追踪高达 400 万个统计数据。一些经济学家忍不住想要把所有数据都混合在一起,并给一般的数据穿上优质的“外衣”。第二次世界大战之后只出现了 11 次经济衰退的情况,如果一个统计模型试图解释这 11 次衰退带来的后果,就必须从 400 万个数据中选择数据,由此得出的许多相关性都将会带有欺骗性。(这是过度拟合的又一个经典例子——将噪声误认为是信号——在本书前面的内容中,这个问题发生在地震预测者身上。)
想象一下,当你拥有像电话簿一样厚的一摞经济数据时,自己会变得多么富有创造力。比如,美国橄榄球超级杯大赛的冠军队伍曾一度是经济预测中非常有名的“领先指标”。从 1967 年的第一届超级杯大赛到 1997 年的第 31 届超级杯大赛,当来自原美国国家橄榄球联盟(NFL)的队伍赢得比赛时,那么股市就会平均上涨 14%,而如果是来自原美国职业橄榄球联盟的队伍赢得比赛时,那么股市就会平均下跌 10%。
1997 年之前的 31 年里,有 28 年该指标都正确地“预测”了股市的走向。从理论上来看,统计学标准测试可以表明这种相关关系绝非偶然,是偶然的可能性只有 470 万分之一。
然而事实上,这种关系的出现只是巧合。最终,这一指标的表现还是退步了。1998 年,原美国职业橄榄球联盟的丹佛野马队赢得了美国橄榄球超级杯大赛,按照惯例,这应该是一个不好的预兆,然而,这次股市非但没有下跌,反而在网络公司的强势带动下上涨了 28%。2008 年,原美国国家橄榄球联盟的纽约巨人队奋力直追,外接手戴维·泰里大放异彩,打乱了新英格兰爱国者队夺冠大卫轮胎队的计划,然而,新英格兰爱国者队的失利并没能阻止房地产泡沫的破灭,这次房市崩溃导致股市暴跌了 35%。事实上,自 1998 年以来,每次原美国橄榄球联盟的队伍赢得超级杯大赛时,股市非但不会下跌,反而会有约 10%的上涨幅度,与传说中这一指标的预测走势截然相反。
为何一个本来失败概率只有 470 万分之一的指标会一败涂地?出于同样的原因,尽管美国的全国性彩票强力球彩票的中奖概率达到 1.95 亿分之一,但每隔几周还是会有人中奖。对于所有买彩票的人来讲,中奖概率都是相当小的,但数百万张彩票一经出售,总会有人走运中奖。同样的,在世界上数百万统计指标中,有一些恰好与股票价格、GDP、失业率有很大的相关性。如果不是超级杯的冠军,就可能是乌干达的鸡肉产量。这种关系仅仅是一个巧合而已。
尽管那些经济学家可能并不会真的把美国橄榄球超级杯大赛的结果当成领先指标,但他们还是说服自己去相信其他类型的变量——所有与经济意义沾边儿的事物都算——也可以成为提前几个月预测经济衰退或复苏的重要“领先指标”。曾有一家预测公司吹嘘自己对 400 个领先指标了如指掌,远远超过了哈祖斯所说的包含大部分经济事物在内的二三十个领先指标。其他预测者则把一些相对晦涩的指标,如预订量和提货量的比率,高价卖给那些半导体公司。有这么多经济变量可以选择,其中有些变量一定可以将噪声拟合进历史数据。
想要找到能识别信号的变量就更难了,一个经济周期中作为领先指标的变量经常会成为下一个经济周期的滞后指标。2003 年《公司》杂志中的一篇文章提到的 7 个所谓的领先指标,都曾成功地预测了 1990 年和 2001 年的经济衰退。但其中只有两个指标——房价和临时雇工——能够使人们感知到 2007 年开始的经济衰退。其他指标,如商业贷款,直到 2008 年,即经济衰退开始一年以后,才开始显现出下跌的趋势。
即使人人都看好的“领先指标”也存在问题。“领先指标”由经济咨询商局发布的 10 个经济指标合成。在经济衰退几个月前,“领先指标”就已经普遍地降低了,但它给出的基本上都是假警报,包括 1984 年最臭名昭著的那次,当时这个指数连降了 3 个月,预示着经济衰退,然而经济非但没有衰退,反而以 6%的增长率快速发展。有些研究甚至声称,“领先指标”在实际生活中,根本不具备任何预测作用。
哈祖斯对我说:“真正具有预测性的变量几乎不存在,想要弄明白哪些是因果关系,哪些属于相关性,是很困难的。”
大多数人都听说过这句格言:“相关性并不是指因果关系。”两个变量之间存在统计学关系,并不代表两者互为因果。比如,冰淇淋的销量和森林火灾是两个相关变量,因为两者都会在炎热的夏季出现,但两者之间没有因果关系:当你买了一盒哈根达斯冰淇淋时,并没有点燃蒙大拿的灌木丛。
然而,这一概念表达起来容易,应用起来却十分困难,在理解经济领域的因果关系时尤其如此。比如,哈祖斯注意到失业率一直被视为滞后指标,有时也确实如此。经济衰退之后,许多企业在对经济的前景恢复信心之前,不大可能雇用新员工,因此失业人员要经过很长一段时间才能重返工作岗位。但是,失业率也可以成为衡量消费需求的领先指标,原因是失业人员对新产品和服务的购买力很低。经济衰退期间,经济发展可能陷入这样的恶性循环:在消费需求上升之前,企业不会雇用新员工,失业的消费者就买不起企业的产品,这样又会导致消费需求不足。
消费者信心是另一个捉摸不定的变量,总会变来变去。有时,消费者是最先发现经济预警信号的群体之一,而有时他们又是最后觉察到经济复苏的群体之一,因为一直以来,经济衰退实际上早就结束了,但公众却认为经济仍然处于衰退期。于是,对于消费者信心是领先指标还是滞后指标这个问题,经济学家仍存有争议,判断标准也许要视经济运行所处的周期决定。另外,由于消费者的信心会对消费行为产生影响,在经济预期和实际经济情况之间,可能会有各种各样的反馈环(反作用)。
或许经济预测和经济政策之间的反馈环问题更严重。比如,如果预测到一场经济衰退即将发生,那么美国政府和美联储可能就会采取行动降低风险,或者减少损失。这样就会产生一个问题,那就是像哈祖斯这样的预测者既要预测政治决策,又要预测经济决策,而对美国这种国会拥有的支持率仅为 10%的国家,这无疑是一个挑战。
然而,问题会进一步加剧。正如 1976 年诺贝尔经济学奖获得者罗伯特·卢卡斯指出的那样,经济模型以历史数据作为依据,这些数据一部分来自方针决策,而这些决策在当时是适用的。因此,只知道现在的政策制定者想要做什么是不够的,还需要对尼克松政府执政期间的财政和货币政策有所了解。由伦敦政治经济学院教授提出的“古德哈特定律”认为,政策制定者一旦锁定一个特定变量,这个变量就会逐渐失去其作为经济指标的价值。比如,如果美国政府人为地上调房价,房价会上涨,但房价就不再是衡量整体经济是否健康的指标了。
从逻辑的角度来看,这有点像观察者效应(常被误认为海森堡的不确定性原理):一旦我们开始测量某物,它的行为就会发生改变。大多数统计模型都是依托这一概念建立的,输入和输出分别是自变量和因变量,彼此之间泾渭分明,但在经济领域中,两者却混在一起、乱作一团。
变化莫测的经济
即使经济学家可以解决这些问题,他们仍然需要应对动态的目标。美国和全球的经济一直在发展,不同经济变量之间的关系会随着时间的推移发生改变。
比如,历史上 GDP 增长率和工作岗位增加率两者之间一直保持着一种合理的密切联系,经济学家称之为“奥肯定律”(或奥肯法则)。1947~1999 年的经济长期繁荣期内,工作岗位增加率通常是 GDP 增长率的 1/2,所以,如果 GDP 的增长率为 4%,那么工作岗位的增长率就为 2%。
这一关系至今仍旧存在——GDP 增长得越多,工作岗位也增长得越多,但它们之间的动态关系似乎有所改变。前几次经济衰退过后,工作岗位的新增数量寥寥无几,比经济长期繁荣期的新增岗位数量少很多。比如,2009 年经济刺激方案出台后,根据奥肯定律,GDP 的增长速度已足够创造约 200 万个工作岗位,而实际上,这一时期工作岗位的数量不但没有增加,反而减少了 350 万个。
这种变化意味着什么,经济学家对此总是争论不休。包括哥伦比亚大学的杰夫瑞·萨克斯在内的经济学家做出的最消极的解释是,GDP 增长和工作岗位增加之间的关系反映出美国经济许多严重的结构问题,比如,来自别国的竞争不断加强,服务业和制造业之间的不平衡状态,人口老龄化问题,中产阶层萎缩,还有越来越高的国家债务。在奥肯定律下,美国进入了一个全新的非正常状态,如果不进行根本上的改变,这些问题会更加严重。萨克斯告诉我,“我们低估了全球变化对美国变化的影响。国际上的工作岗位都转移到了中国,新兴市场确实动摇了美国经济。”
更大的问题是,21 世纪初的经济波动是否更能代表长期的经济发展状况——也许经济长期繁荣一直是表面现象。1947~1999 年的 50 多年时间里,经济处于衰退期的时间只占整个时间段的 15%,但 1900~1945 年这 45 年里,衰退期所占时间的比例为 36%,是繁荣期所占时间的两倍还多。
尽管大多数经济学家认为,我们在稳定经济周期方面已经取得了一些进步,但我们或许只是很幸运地躲过了更多的问题。这一点在 1983~2006 年这段时间尤为明显,衰退期只占整个时间段的 3%,所以这一时期有时也被称作“大缓和”时期,是经济长期繁荣期的一个子集。但是,经济增长依靠的大多是激增的政府和消费者债务,还有各种资产价格泡沫。再先进的经济也没有神授的权利可以使自身按照“大缓和”时期的增长率发展:20 世纪 80 年代,日本经济的年增长率为 5%,而此后的增长率仅为 1%。
2007 年的经济大衰退危害如此之深,让那些预测人员和政策制定者感到措手不及,原因或许也在于此。他们不但未能解释“大萧条”这样的重大事件,有时还会根据“大缓和”时期的经济状况调整他们的预测。事实上,从历史角度来看,“大缓和”时期不过是非主流现象罢了。
负责制定利率的美国联邦公开市场委员会(FOMC),每年依法需要向美国国会公布宏观经济预测至少两次。到 2007 年年末,比起私有企业的预测者,FOMC 在某些方面的预测更准确,比如他们公布的 GDP 增长预测就略胜一筹,这就使得那些私有企业在 2007 年年底之前,先后 4 次降低利率预测值。
然而,在 FOMC 于 2007 年 10 月底召开的一次长时间的会议中,仍未提及“经济衰退”这个词,即使是在讨论经济问题时,也没有提到。FOMC 在措辞上十分谨慎,尽管这样,“经济衰退”还是可能通过使用“经济下降的危险”这类词体现出来。但是,FOMC 不认为会发生经济衰退(他们预测经济走势仍会呈增长状态),而且也没有迹象表明他们愿意直面当时正处在严峻的经济衰退期的现状。
出现这种情况的一部分原因可能是,为了做出准确的预测,FOMC 参考了“大缓和”时期的数据。FOMC 成员对一篇记录了 1986~2006 年经济预测表现的论文有些过度依赖。只关注近几年的预测表现所带来的问题就是,这些预测包含的经济波动太少,只有发生在 1990~1991 年和 2001 年的两次较为缓和的经济衰退。论文作者提醒人们:“用 20 世纪 80 年代中期的数据估计现在的不确定性,就是在含蓄地假设‘大缓和’时期之后的平静状态会一直持续到未来。”这是一个十分糟糕的假设。FOMC 正是因为忽视了那些出现严重经济衰退的年份,才得出 2007 年不会出现严重的经济衰退这一结论。
一个预测者永远都不应该忽视数据,在研究经济衰退或是美国总统选举这样的少有事件时尤其如此,因为这类事件可供参考的数据并不多。忽视数据通常表明预测者过于自信,或是在对自己的模型进行过度拟合——不是为了使预测更加准确,而是为了炫耀。
在这个特殊案例中,经济学家的预测准确性并没有明显提高。在图 6–5A 中,我将“调查”中 GDP 增长的预测水平与 1968~1985 年(这些都是 FOMC 注意过但又忽略掉的年份)的实际增长数字作了对比,你会发现,这一时期确实有很多经济波动,如 20 世纪 70 年代中期和 80 年代初由通货膨胀导致的经济衰退。这些结果并没有让预测者完全沮丧,原因在于预测结果和实际结果之间有着密切关联。
如果对 1986~2006 年的 GDP 增长情况做一个同样的对比图(如图 6–5B),情况正好相反。大部分数据点,不论是有关 GDP 的预测值还是实际数值,都紧密地聚集在年增长率为 2%~5%的狭窄区域里,因为这一时期经济波动非常小,预测的平均误差小于之前的那个时期。然而,经济中存在一定程度的可变性,如 1990~1991 年或 2001 年较为缓和的经济衰退,这份预测确实没有很好地抓住这一点——实际上,这份预测结果与实际结果之间几乎没有半点关联。没有迹象表明经济学家对经济的预测越来越准确,相反,由于经济运行平稳,他们的工作暂时变得更加轻松,这就好比檀香山的气象预报员的工作要比布法罗的预测者容易得多。
图 6–5A 1968~1985 年 GDP 预测结果与实际 GDP 对比图
图 6–5B 1986~2006 年 GDP 预测结果与 GDP 实际结果对比图
有时你会听说,抛开数据的另一个原因就是,你正在试图解决的问题发生了根本性的转变。有时,这些论断在某种程度上是说得通的:美国经济在不断发展,也会经历周期性的结构转变(最近,制造业主导的经济正在向服务业主导的经济转变)。经济不是棒球,棒球比赛总是遵循同样的规则,而经济规则不会一成不变。
问题是,你永远都不会知道下一个转变什么时候会出现,也不会知道这个转变会使经济变得更加波动还是更加平稳,更加强大还是更加脆弱。如果一个经济模型是建立在“没什么大变化”的前提条件之上,那么这个经济模型就毫无价值可言。但是,预测这些转折点的出现实非易事。
经济数据中充满噪声
经济预测者面临的第三大挑战是,他们的原始数据质量不高。我在前文曾经提到,经济预测者在进行预测时,很少公开自己的预测区间,或许是因为这样做会降低公众对他们的专业知识的信任度。哈祖斯说:“经济预测者为什么不公开预测区间呢?因为他们怕出丑。我认为就是这个原因,他们怕出丑。”
然而,不仅经济预测中存在着不确定性,经济变量本身也具有不确定性。大多数经济数据序列都需要修正,统计数据一经公布,修正工作可能长达数月甚至数年。修正工作有时是十分庞杂的。美国政府对 2008 年第四季度 GDP 增长的估计就是这样一个不算体面的例子,最初公布 GDP“仅”下降了 3.8%,现在又改为当时经济的降幅将近 9%。如果白宫这些经济学家对经济漏洞的实际大小有所了解,他们就会在 2009 年 1 月强烈推行更大的经济刺激方案,或者他们会意识到问题的严重性,从长计议,而不是试图速战速决。
此类错误相当普遍。1965~2009 年,美国政府对 GDP 的季度增长率的初始估值最终得到修正,平均变动幅度为 1.7%。这只是一个平均变化,而每个季度的变动幅度仍然较大,最初 GDP 的季度增长率估值的误差幅度为±4.3%。这就意味着,即使政府最初报告说经济会出现超常增长,可实际上经济有可能正处于衰退期,反之亦然。比如,1977 年,美国政府公布第 4 季度美国经济增长了 4.2%,但这个数字后来被修正为–0.1%。
所以,我们还是应该同情经济预测者。预测经济发展趋势实属不易,但如果连经济预测从何处着手都不知道的话,那就难上加难了。
经济是一个动态系统,不是一个方程式
经济学家与气象预报员面对的挑战或许有些可比性,他们都面临着以下两个基本问题。
第一,经济与大气一样,是动态系统。不同事物之间互相作用,这些系统都处于永久的运动当中。在气象学中,这个问题非常明显,因为天气系统符合混沌理论。从理论上讲,巴西的蝴蝶扇动一下翅膀,就会在美国得克萨斯州引起一场龙卷风。在经济领域中也存在着大致相同的情况,日本海啸或是长滩港口工人罢工也会影响到某个得克萨斯人是否能找到工作。
第二,气象预报受某些不确定的初始条件的约束。气象预报总是采用一种或然说的表达方式(“降雨概率为 70%”),之所以采用这种方式,并不是因为天气本身存在随机性,而是因为气象学家认为他们对初始条件的测量不够精确。天气预测模型(由于符合混沌理论)对初始条件的变化极为敏感。同样的,在经济预测中,初始数据的质量通常都非常差。
然而,气象预报仍是本书中真正成功的预测例子之一。由于人与机器的通力合作、更好的数据收集方法和一如既往的辛勤工作,不论是飓风轨迹预测还是日间高温预测,都比一二十年前准确多了。
对于经济预测来说,还不能那么自信。对经济预测的任何幻想,都会被经济学家在金融危机之前所犯的重大错误打破。
如果气象学家也像经济学家一样遇到一些初始条件不明的动态系统问题,他们会用大量的自然科学知识来补救。像龙卷风这类天气现象,其物理属性和化学属性没有那么复杂,但这并不是说龙卷风很容易预测,而是对于龙卷风的形成和消散的原因,气象学家有着深刻的认识。
经济学更偏向于人文科学。尽管经济学家对于控制经济运行的基本体系有着相当正确的理解,然而,经济运行中各种情况的因果关系仍然模糊不清,在经济泡沫期和经济恐慌期时尤其如此,因为此时的经济系统中充斥着人为因素决定的反馈环。
尽管如此,如果对经济学家来说辨别因果关系很难的话,尝试一下总好过放弃。比如,再次仔细考虑一下哈祖斯在 2007 年 11 月 15 日写下的这番话:
抵押贷款可能造成的损失所引发的宏观经济风险要远远超出公认的水平……这种宏观经济的后果可能会相当戏剧化。如果负债经营的投资者看到贷款的总损失达到 2 000 亿美元,他们可能就会把借款相应地缩减 2 万亿美元。这是一个很大的打击……显而易见,这样的打击会引发严重的经济衰退,或是长期的经济萎靡。
哈祖斯还写道,因为房地产泡沫的影响,房价已经超出了消费者的购买能力,所以许多消费者用长期的大额贷款买了房,其中很多人已经停止还贷了,而这样很有可能造成极大的贷款损失。负债经营的程度会使问题复杂化,导致信贷市场和金融业出现更大面积的瘫痪。所以说,这样的打击足以引发严重的经济衰退。
这正是金融危机爆发的原因。哈祖斯的预测是正确的,他给出的理由也是合理的,不仅解释了金融危机爆发的起因,还预测出金融危机带来的影响。哈祖斯将这一因果关系链称作“故事”。这是一个与经济有关的故事,即使这个故事可能是一个数据导向的故事,但也是根植于真实世界的故事。
相反,如果你只把经济当作一系列变量和方程式,而没有看到其深层结构,那就很容易把噪声当成信号,误认为自己(还有那些轻信的投资者)正在做出准确的预测,而实际上你的预测并不准确。看看哈祖斯的竞争对手——美国经济周期研究所(ECRI)是怎么做的。
2011 年 9 月,ECRI 预测到近期可能会出现“双底衰退”(亦称“双谷衰退”),ECRI 认为,“决策者无法阻止这次双底衰退。你认为这就是经济不景气吗?好戏还在后头呢”。在对 ECRI 总经理拉克什曼·阿楚坦的采访中,他认为经济衰退如果还未开始,那么马上就会开始了。对此说法,他们是这样解释的:
ECRI 的经济衰退预测不是仅仅基于一两个领先指标,而是基于很多特定的领先指标,包括美国的长期领先指标、低迷期的周领先指标还有其他短期领先指标。实际上,那些最可靠、最让人期待的指标现在的集体表现,和完全衰退期的最高峰时的表现一样。
上面的解释包含了很多术语,可唯独缺乏切实的经济内容。ECRI 的故事与数据有关(仿佛是数据本身引起了经济衰退),却与经济无关,他们似乎还引以为荣。在 2004 年出版的一本书中,他们这样建议客户:“你不必为了安全驾驶而去了解汽车引擎如何工作,同样,你也无须为了准确地阅读这些评估标准而去了解经济领域的庞杂繁复。”
进入大数据时代之后,这样的说法越来越常见。有了这么多信息,谁还需要理论呢?但在预测行业中持有这样的态度绝对是错误的,尤其是在数据如此杂乱的经济领域。有了理论支持,或者至少对其根源进行更加深入的研究之后,统计学推理就会变得更具说服力。比如,2011 年 9 月,在欧洲出现债务危机时,对经济持悲观态度是合情合理的,但 ECRI 并不这么认为,它们拥有大量的随机变量,这些变量误把“相关性”当成了“因果关系”。
的确,ECRI 的预测似乎标志着一个经济转折点,但却是朝着积极的方向转变。在 ECRI 发出经济衰退预测的 5 个月后,标准普尔公司的赢利率达到 21%,同时,2011 年第 4 季度 GDP 不但没有陷入衰退,反而实现了 3%的平稳、健康增长。ECRI 采取了缓兵之计,并“澄清”说它们的预测一直延伸到 2012 年,尽管这与它们最初的说法根本就不沾边儿。
经济预测中不可避免地会存在偏见
如果你想进行经济预测,最好的选择就是查看平均预测或群体预测,而不是求助于某个经济学家。我对“调查”的研究显示,群体预测总是比个体预测更准确,在预测 GDP 增长、失业率和通货膨胀这三个方面,群体预测比个体预测的准确率分别高出 20%、10%和 30%。通过研究许多领域的预测结果,人们发现几乎所有的群体预测都优于个体预测。
然而,虽说群体预测优于个体预测这一观念已成为重要的经验性规律,可是当预测与事实有很大的出入时,这一观念有时就会成为蹩脚的借口。群体预测是由个体预测组成的,如果个体预测的质量提高了,群体预测的质量也会提高。另外,在现实生活中,经济群体预测的质量也很差劲儿,所以还有很大的提升空间。
大多数经济学家作预测时,会在一定程度上依赖自己的判断,而不是依据统计模型输出的信息进行预测。考虑到数据是那么杂乱,这种做法或许是有益的。波士顿联储前副总裁斯蒂芬·K·麦克内斯曾经进行过一项研究,他发现根据统计学预测方法对人为的判断进行调整会使预测的准确率提高约 15%。20 世纪七八十年代计算机开始广泛使用时,人们普遍认为统计模型能够“解决”经济预测问题。但是,改进的技术无法掩盖对经济领域理论认识的缺乏,只会让经济学家更加快速、更加煞费苦心地将噪声误认为是信号。看似前景不错的预测模型在某些方面一败涂地,最后惨遭淘汰。在其他领域,比如那一时期的地震预测,也会遭遇这样的状况。
援引某个人为判断也会带来潜在的偏见。人们在进行预测时,会倾向于使预测满足自己的经济动机或政治信仰。人们或许太过自负,即使事实和环境要求他做出改变,他也不愿对自己的预测进行修正。哈祖斯告诉我:“我认为人们绝对有这样的倾向,急切地希望事情能按照自己希望的方式发展下去。”
是否有经济学家更擅长把握这种权衡的度?预测出上一次经济衰退的经济学家是不是也可以预测出下一次经济衰退?这个问题有一个非常有趣的答案。
用于评判预测技能的统计测试,在应用于“调查”时给出了否定的结果。也就是说,从这份调查中,人们似乎找不到证据证明某些经济学家总是比其他同行出色。然而,对另一个小组——“蓝筹经济调查报告”——的研究却总能给出肯定的结果。经济预测中显然少不了运气的成分,暴躁或是顽固的经济学家偶尔也会做出正确预测。但是对“蓝筹经济调查报告”的多项研究发现,长期来看,某些经济学家似乎确实要比其他同行略胜一筹。
这两份调查有什么不同呢?“专业预测人员情况调查”是匿名操作的:每位经济学家随机分配一个身份标识号码,他们在不同的调查中会一直使用这个号码,但是不会暴露自己的身份和职业。而在“蓝筹预测调查报告”中,每个人的预测都标有其姓名和曾经获得的荣誉。
当预测结果标有自己的名字时,你的动机就会发生改变。比如,如果你在一家名不见经传的小公司工作,你的那些大胆预测就会备受重视,不管这个预测是准确的还是离谱的,你都会受人关注,这是合情合理的。而像高盛这样的大公司,为了能达成一致意见,预测反而会比较保守。
事实上,在“蓝筹经济调查报告”中,已经发现了这个特点:名气越小,作预测时就越不怕冒险。一项研究把这一现象称为“合理偏见”。即使知道这个预测十分冒险,你还是会为“大比分”放手一搏,这样做是可以理解的。反过来,如果你已经声名鹊起,即便自己手头的数据要求你做出大胆的预测,你可能也不愿意做出过于大胆的预测。
这两种对声誉的关注都有可能使你远离做出最诚实、最准确的预测这一目标,甚至还会使群体预测更加糟糕。整体来看,在对 GDP 增长率和失业率的预测上,“专业预测人员情况调查”的匿名参与者略优于参与“蓝筹经济调查”的那些名誉至上的受访者。
克服预测偏见的两种选择
如果说做出失败的预测是合乎情理的,那么这些预测肯定是在一些用户的纵容下做出的。正如一些政治专家以向党派支持者提供虚假消息为生一样,经济领域的投机者也因其特有的经济思想而拥有一定的市场。(有时,经济预测也有明确的政治意图,比如,从历史上看,不论是民主党还是共和党执政,白宫提供的经济预测通常都是最不准确的。)
然而,经济预测的风险要比政治预测高得多。正如罗伯特·卢卡斯所言,经济预测与经济政策之间的界限十分模糊,一个不准确的预测可能会使现实中的经济状况变得更加糟糕。
技术进步还是有望提高经济预测的准确度的。例如,谷歌的搜索流量就可以作为预测失业率这样的经济数据的领先指标。
在位于加利福尼亚芒廷维尤的谷歌总部,公司的首席经济学家哈尔·瓦里安对我说:“在我们看来,是否领取了失业保险中的最初赔偿,这一指标能够很准确地预测失业率,也能准确地预测经济活动。如果你在某一家公司上班,公司里即将裁员的谣言不胫而走,人们就会纷纷开始搜索‘失业人员救助办公室在哪里’、‘我该如何申请失业救助’等词条,从而更早地预测出申请失业救济的失业人数了。这算是一个领先指标。”
经济学和其他领域的预测历史显示,如果受到人类偏见的影响,技术进步也许就无法提高预测水平,而迄今为止鲜有迹象表明经济预测者已经克服了自身偏见,比方说,那些经历过“经济大衰退”的经济预测者似乎就没有刻意控制个人偏见。看看 2011 年 11 月“调查”对 GDP 增长做出的预测(图 6–6),你就会发现其中显示出的过度自信倾向仍然和我们在 2007 年看到的一样,那些预测者对经济运行的上升和下行态势的预测都估计不足,按照他们预测的历史准确性来看,这次的预测错得有些离谱。
我们永远都无法彻底摆脱偏见,但是如果想减少这些偏见,我们有两个基本选择。一种是“供应性”选择,即为准确的经济预测创造市场。另一种是“需求性”选择,即减少对不准确且过度自信的预测的需求。
图 6–6 预测的概率分布:美国 GDP 的真实增长水平(2012 年)与历史预测误差对比图
乔治梅森大学的经济学家罗宾·汉森是供应性选择的支持者。我曾经在弗吉尼亚北部的一家摩洛哥餐厅与汉森共进午餐,这是他最喜欢的地方之一。汉森刚过 50 岁,尽管头顶脱发严重,但是看上去很年轻,也有些古怪。他打算死后把自己的头冷冻保存起来。除了供应性选择之外,汉森还支持被他称为“法达奇政府”(一种在一定程度上受投机市场控制的理论上的政府形式)的系统,在该系统中,为政治决策拍板的是预测市场,而不是政治家。汉森显然并不惧怕挑战传统观点,他写过一篇题为“战胜偏见”的博文供读者思考,文化禁忌、思想观念或者错位动机,究竟是哪个因素限制了人们做出最佳决定的能力呢?
服务员端来我们的食物时,汉森对我说:“我认为最有趣的问题是,我们为预测付出的努力其实是多么微乎其微,即使对于那些我们认为十分重要的事情也是一样。”
他继续说道:“在一个工商管理学硕士学院,你看到的管理者都是大决策者的形象或科学决策者的形象,他们每天忙于电子数据表和统计测试,权衡各种各样的选择。但是,现实中的管理人员所做的大多是管理团队和维持项目计划免遭终结等工作。如果他们组织各方协作完成一个项目,在最后时刻,预测结果突然变得起伏不定,而你却不能在最后关头放弃这一项目,不是吗?”
后来,汉森还说道:“即使是专业学者,对收集预测跟踪记录也没有多大兴趣——他们对做出准确的预测不感兴趣。还有一个更为基本的问题,那就是我们的社会需要专家,但不怎么需要准确的预测。”
为了解决这一缺陷,汉森一直力挺那些预测市场—可以让人们在某一特定的经济或政策结果上投下赌注的一些系统,如以色列是否会与伊朗交火,或是气候变化会导致全球气温升高多少。对于这些问题,汉森的观点十分明确:预测市场能够保证我们在作预测时获得实实在在的经济利益,而不仅是在同行面前“赚面子”。
在本书后面的内容中,我们会再次对预测市场进行讨论。预测市场其实不是什么“万灵药”,尤其是在我们误认为它们无所不能的时候更是如此。但是正如汉森所言,预测市场至少可以通过整理人们的动机来改善预测质量。
预测市场最基本的应用可能,就是对 GDP 增长率和失业率等宏观经济变量进行预测。我们有各种直接或间接的方法预测通货膨胀、利率和物价波动,但是对于 GDP 增长率,却还没有大的预测市场。
或许也有人会关注这样的预测市场:近年来,普通股与宏观经济风险之间的联系越来越密切,因此,可以找到降低二者潜在风险的办法。预测市场也可以为决策者提供实时信息,主要是不断更新的 GDP 增长率预测。人们对预测市场有了更多选择,如打赌 GDP 会增长 5%还是下降 2%,这对那些过度自信的预测者是一个不小的打击,而同时人们在预测经济时,也会得到更加可靠的关于不确定性的估值。
而另外一种解决方案——需求性选择要求我们必须成为更好的预测用户。在经济预测领域,这也许就意味着,我们应该把更多的目光投向像哈祖斯这样实实在在地探寻经济实质的人的身上,而不应关注那些将各种领先指标混在一起冒充预测专家的骗子;还可能意味着我们应该更加关注经济指标和经济预测中的噪声。与政治预测一样,GDP 增长率的初始预测值在公布时也应该提到其误差幅度。
从更广义的角度来看,在预测中表现出的自信并不能代表预测的准确度,相反,这两者经常成反比。在经济领域或其他领域中,当我们阻止预测者对我们周围世界的内在风险给予百分之百的重视时,就会埋下巨大的风险。