第十二章
温室效应:未来 10 年,全球气温会上升还是下降?
1988 年 6 月 23 日,美国国会山异常燥热。前一天下午,华盛顿国家机场的温度约为 37.8 摄氏度,初夏的气温就达到这么高的温度这几十年来还是第一次。美国国家宇航局的气候学家詹姆斯·汉森一边擦去额头上的汗珠(因为此时参议院能源委员会听证室的空调竟然不合时宜地坏了),一边告诉美国民众说,这样的高温天气可能还会持续几天,请大家作好准备。
科学家们曾经预测到温室效应会使地球升温,这一理论早已为人们接受。汉森说,温室效应开始在气温记录中制造明确无误的信号:自 20 世纪 50 年代起,全球气温已经上升了 0.4 摄氏度,而这种升温现象不可能是自然变异导致的。汉森说:“气温自然出现同等上升幅度的概率仅约为 1%,因此,人们可以有 99%的信心宣称这一时期气候变暖的趋势仍在继续。”
汉森预测高温天气会频繁造访华盛顿和其他一些城市,如奥马哈,这种天气变化已“明显得人人可见了”。他建议改良气象预测模型,但气温趋势及其变化原因是显而易见的。汉森说:“没时间闲聊了,有充分证据表明温室效应已经来势汹汹了。”
这场听证会距今已差不多有 25 年了,当时就“全球变暖”所提的问题,有些也可以用来对本书提到的其他领域进行提问,比如,迄今为止人们作的预测是好是坏?科学家们在哪些事情上取得了一致意见,对于哪些事情仍在争论不休?预测中的不确定性有多大,我们该作何反应?像天气系统这样的复杂事物,究竟可不可以建模研究?气候学家是否都存在过度自信的问题呢?这一问题会发生在其他领域的预测者身上吗?政治和其他反向力量会阻碍科学真相的挖掘吗?贝叶斯定理是否有助于判定争论呢?
仔细检查证据,描述出什么是对气候预测的合理怀疑,你会发现对全球变暖问题的怀疑有别于普通博文或政治主张中经常提到的内容。
温室效应真会导致全球气温变暖吗?
本书中提到了许多预测的例子,都将相关性误认为因果关系,将噪声误认为信号。1997 年之前,人们一直认为超级杯的归属与次年的股市走向有关。然而,这两者之间其实并没有可信的因果关系,如果以此为据进行投资,你一定会输得倾家荡产,因为超级杯这一指标是假阳性的,是错误判断。
有时,假报告也会以假乱真。即使确有信号存在,过于嘈杂的数据也会将信号掩盖。举一个无可争议的例子,人们都知道热卡摄入得越多,变胖的可能性就越大。那么,这样一个基本关系一定会在统计记录中得到清晰的体现吗?
我下载了 84 个国家的肥胖率和日常热卡摄入量的数据,这些数据都是免费使用的。从这些数据看,肥胖率和日常热卡摄入量两者之间竟然没有什么关系。以肉食为主食的韩国,日常热卡摄入量约为每人每天 3 070 卡,略高于世界平均水平。然而,韩国的肥胖率却只有 3%。相反,太平洋岛国瑙鲁每人每天的热卡摄入量与韩国大致相同,但肥胖率却高达 79%。如果将这 84 个国家的情况绘制成图(图 12–1),我们会看到肥胖率与日常热卡摄入量之间的联系非常有限,以标准统计测验评判两者之间的关系得出的结论是没有“统计学意义”。
图 12-1 84 个国家的热卡摄入量及肥胖率
当然,掩盖两者之间关系的因素很多,如某些国家有较好的遗传基因或者锻炼身体的习惯。另外,这些统计数据十分粗糙,想要估计一个成年人的日均热卡摄入量是非常困难的。而过于看重这些统计数据的研究员会错误地否定热卡摄入量与肥胖率之间的关系,这便是错误否定,是假阴性的做法。
如果只是简单地把数据放入统计模型中进行分析,然后理所当然地认为这就是真实世界的最佳写照,事情发展若真是如此,那就好了。在某些领域中,尤其是棒球这种数据丰富的领域,提出的假设更加接近于事实真相。而在其他领域中,对因果关系疏于考虑就会走入“死胡同”。
若不是拥有因果事实作基础,人们就有理由怀疑全球变暖这一论断。在几年、几十年乃至几个世纪的时间里,全球气候经历过多次冷暖交替的变化,这种气候的不断更迭循环使得工业文明提前到来。
然而,如果现象背后存在一个对根本原因的合理理解,并以此作为预测的支撑,那么预测就更加可信。对于全球变暖的原因,我们确实有一个很好的认识,那就是温室效应。
1990 年,也就是在汉森参与那次听证会的两年之后,联合国政府间气候变化专门委员会(IPCC,以下简称“气候变化委员会”)在其第一份评估报告中公布了一项有关气候变化的调查结果,内容长达 1 000 多页。由来自全球的几百名科学家组成的团队历经数年完成了这份调查,详细地记录了气温和生态系统的潜在变化,并概述了各种可以减轻温室效应的策略。
气候变化委员会的科学家们列出了两项完全确定的调查。这两项调查不依赖复杂的模型,也没有做出与气候相关的具体预测。相反,它们依据的是相对简单的科学知识,这些知识已经为人们熟知长达 150 多年,即使是自称为气候怀疑论者的人也很少对其持有异议。这些发现迄今为止仍可算作最重要的科学论断。
气候变化委员会的第一个结论是:
确实存在温室效应,它使地球气温升高,而这种情况本不该出现。
温室效应是指某些大气气体——主要是水蒸气、二氧化碳、甲烷和臭氧——吸收由地球表面反射的太阳能的过程。如果不是因为这一过程,30%的太阳能会以红外线辐射的形式反射回太空,地球的气温也会比实际更低一些:平均约为零下 18 摄氏度,同火星上的气温一样。
反过来,如果大气层中这些气体越多,就会有越多的太阳能无法反射回太空,而是直接射到地球表面,气温就会升高。在金星上,大气层更厚,几乎全部都是二氧化碳,平均气温为 460 摄氏度。气温之所以这么高,部分原因是因为金星与太阳的距离近,但更多是因为温室效应。
没有什么情况表明在不久的将来,地球气候会变得同金星一样。但是,大气成分的变化必然会引起气候的变化,因为气候是十分敏感的。人类文明兴起于气温变化幅度不大的地带。世界上最寒冷的首都是蒙古首都乌兰巴托,全年平均气温约为零下 1 摄氏度。而世界上最温暖的首都大概是科威特首都科威特城,全年平均气温约为 27 摄氏度。人烟稀少的地区,冬天的气温会温暖些,夏季的气温会凉爽些,但从整个地球范围来看,气温的冷热差距还算适度。在几乎没有大气保护的水星上,一天之内的最高气温可达 400 摄氏度,而最低温度则达到零下 200 摄氏度。
气候变化委员会的第二个结论是:随着大气中温室气体浓度的增加,温室效应会加剧,全球气温也会随之升高。
人类活动排放的气体是增加大气中温室气体二氧化碳、甲烷、含氯氟烃和氧化亚氮浓度的主要来源。这些气体的增加会加剧温室效应,使得地球表面的平均气温升高。而随着全球变暖,最主要的温室气体——水蒸气——也会增加,这将进一步加剧温室效应。
气候变化委员会的调查提出了几项不同的主张,每一项都值得考虑。
第一,委员会认为由于人类的活动,大气中的温室气体(如二氧化碳)的浓度正在增加,这一点显而易见。许多工业生产,尤其是使用化石燃料的产业,会产出二氧化碳这一副产品。由于二氧化碳长期存在于大气中,其浓度一直在增加:1959 年夏威夷冒纳罗亚观测站第一次监控得出的二氧化碳浓度为 315PPM,到 2011 年这一数字已增加至 390PPM。
第二,委员会认为“这些气体的增加会加剧温室效应,致使地球表面平均气温升高”,这仅是以预测的形式对第一条结论进行重申。这一个预测依据的是一些简单的化学反应,几年前就经过了实验室的证实。温室效应最早是由法国物理学家约瑟夫·傅立叶在 1824 年提出的,人们通常认为该理论是爱尔兰物理学家约翰·廷德尔在 1859 年证实的,同年,查尔斯·达尔文出版了《物种起源》。
第三,委员会认为水蒸气也会随着二氧化碳等气体的增加而增加,从而加剧温室效应,这种说法有些草率。水蒸气是温室效应最大的元凶,但二氧化碳不是。如果只是二氧化碳的浓度增加了,气温的确会升高,但与迄今为止已有的观察记录以及科学家的预测不同,气温不会升高那么多。19 世纪提出并经证明的“克劳修斯·克拉珀龙关系”这一基本热力学原则认为,大气可以在更高的气温下保留更多水蒸气。于是,随着二氧化碳和其他持久存在的温室气体的浓度增加,大气气温便会升高,水蒸气也会增加,温室效应就会成倍加剧,气温又会升高。
温室效应假说的 3 种怀疑论
只有在掌握大量论据的前提下,科学家才会断言某项假说成立。温室效应假说就符合这一标准,所以气候变化委员会最初才会从几百份研究成果中挑出一份,也是许多科学家绝对肯定的唯一成果。温室效应背后的科学原理非常简单,所以早在 19 世纪中后期,当时电灯泡、电话和汽车刚刚问世,当然原子弹、苹果手机和航天飞机这些高端发明还没有出现,而那时人们对温室效应这一科学论断就已经十分了解了。要知道温室效应可不像火箭科学那般错综复杂,高深莫测。
的确,在气候变化委员会公布研究成果之前,瑞典化学家斯范特·阿累尼乌斯早在 1897 年就曾预言工业生产活动最终会引发全球变暖,气温升高是由于温室效应而非自然原因造成,这一点也多次得到过证明。
现在提起温室效应似乎显得有些古怪。20 世纪 80 年代,在英文书籍中,“温室效应”一词出现的频率是“全球变暖”一词的 5 倍之多。但“温室效应”一词的使用在 20 世纪 90 年代才达到顶峰,之后就日渐消退,现在的出现频率反而只有“全球变暖”一词的 1/6、“气候变化”一词的 1/10,因为“气候变化”这个词现在使用率更高。
这一(词汇使用频率的)变化是因为气候学家们试图扩大温室效应理论的影响,然而,当人们极少谈论引发这一变化的原因——温室效应——时,这种关注度的变化便不出所料地误导了人们对它的看法。
比如说,2012 年 1 月,《华尔街日报》发表了一篇社论,题为“全球变暖无须惊慌”,文中有 16 名看上去对全球变暖持怀疑态度的科学家和支持者的联合署名。《华尔街日报》还为这条社论配发了一段视频,标题下面附了这样一句话:
很多科学家认为二氧化碳并非全球变暖的元凶。
实际上,只有极少数科学家对“温室气体导致全球变暖”持怀疑态度。普林斯顿大学的物理学教授威廉·哈珀便是“很多科学家”中的一位,但他在社论上签了名,也是视频中的受访者之一,他在视频中用两分钟左右的时间表达了自己的观点,“大多数人和我一样,认为工业生产排放的气体会导致全球变暖”。对一些全球变暖的相关预测,哈珀表示并不认同,但他未给出自己的理由。
我并非有意暗示这一点:即使证据是自相矛盾的,你也应该盲目接受某种理论。我们可以通过人们对某种理论的预测来检验它是否正确,而气候学家做出的预测却时好时坏。气温数据非常嘈杂,全球变暖的趋势也许可以证实温室效应假说,但这一趋势也有可能是由周期性因素造成的。若全球气温走高的趋势中止,该理论就会被推翻,但也可能是因为数据过于嘈杂,掩盖了信号。
但是,即使你认为我们应该采用贝叶斯定理常用的推理手段,以概率性思维来看待几乎所有的科学假说,我们也应该对那些有极强、极明确的因果关系支撑的假说抱有更大的信心。那些看似对该理论不利的新证据虽然会使我们低估这一理论的有效性,但我们应该在自己了解(或自以为了解)的地球及气候的相关信息中权衡该理论的重要性。
健康的怀疑论应该以此为基础,对新证据的优势和该理论的整体优势进行权衡,而不是为了争出高下或意识形态方面的利益而搜集事实,因为一旦争论带有党派和政治倾向,就会变得愤世嫉俗。
2009 年 12 月,联合国在丹麦首都哥本哈根召开世界气候大会。当时正值冬至时节,日短夜长,日照时间可能只有 4 个小时,气温甚低,阵阵寒风掠过丹麦和瑞典之间狭长的厄勒海峡,从时间和地点这两方面考虑,这次会议真可谓是在最差的时间和最差的地点召开的一次全球气候会议了。
更糟糕的是,哥本哈根的啤酒贵得出奇:在丹麦,以绿色技术为支撑的基础设施建设十分发达,世界一流,这都得益于对酒类等许多产品征得的高额赋税。丹麦现在的能源消耗量同 20 世纪 60 年代末期不相上下,一部分原因是该国的环保意识增强,另一部分原因是人口较少。(与之形成对比的是美国,该国当前的能源消耗量约为 20 世纪 60 年代的两倍。)可丹麦似乎在暗示人们,高能效的未来可能是寒冷的、黑暗的、昂贵的。
于是,哥本哈根贝拉中心的气氛已经毫无悬念地超出了怀疑主义,并且更倾向于彻底的犬儒主义了。我也参加了这次会议,当时还天真地以为能够看到一场关于全球变暖的科学,严谨的辩论。而我看到的却是一场政治会议,各国的分歧不可调和。
位于太平洋上的小国图瓦卢海拔较低,是最容易受海平面上升威胁的国家之一。来自图瓦卢的与会代表游走于各个会议厅之间,大声抗议着,他们认为会议提出的目标少得可怜,根本无法减少温室气体排放。而对温室气体排放负有主要责任的几个大国却自始至终争论不休,无法达成共识。
参加会议的美国总统奥巴马没有作任何准备,他已经把其政治资本押在医疗保险改革法案和刺激计划上了。而中国、印度和巴西等国因为所处地理位置比较特殊,比美国更容易受气候变化的影响,但是这些国家却不愿意做出可能会损害其经济增长的承诺,因此也没有明确各自的立场。俄罗斯的气候寒冷,化石燃料资源储量丰富,在本次会议上成了一张百搭牌。情况与俄罗斯相似的加拿大也是一样,不大可能会努力推动任何与美国意愿相悖的议案的出台。而有些比较富裕的欧洲国家与奥地利、日本以及非洲和太平洋地区很多较为贫穷的国家则结成了形式上的联盟。但是,在全球变暖这一问题上,虽然政治具有本土性,但科学却是无国界的。二氧化碳已经迅速包围了整个地球:一辆中国青岛的柴油货车排放的二氧化碳,最终会影响到厄瓜多尔首都基多的气候。因此,要想成功地实现减排目标,各国需要达成高度一致的意见,而不仅仅是结成几个小联盟那么简单。这样的一致意见即使不用几十年才能达成,恐怕至少也需要几年时间。
在哥本哈根会议期间,我有幸与几位科学家进行了交流,其中一位就是理查德·鲁德。这位来自北卡罗来纳州的科学家说话总是柔声细语的。鲁德曾经在美国宇航局带领科学家团队搞科研,现在在密歇根大学教授气候政策课程。
鲁德对我说:“在美国宇航局,我最终认识到,所谓的‘火箭科学’就是用较为简单的心理学知识解决复杂的难题。科学的部分相对简单,但其他问题,如怎样制定政策、怎样根据公共卫生做出回应等都是相对复杂的问题,因为其中没有明确的因果机制。”
我们的交谈不时地被贝拉中心的扬声器发出的通讯所打断。一位带有法国口音的女士说出了下面这段话:“本次会议未能达成任何共识,本次会议讨论的各个事项暂缓决定。”而鲁德却确信,未来有关气候问题的争论中,3 种类型的怀疑论将无处不在。
第一类型怀疑论源于利己主义。仅 2011 年一年,化石燃料行业在游说活动上的花费就高达 3 亿美元(约为 5 年前的两倍)。为了本章的写作,我与几位气候学家交谈过,他们在描述化石燃料行业的这种行为时用到了“阴谋”这个词,但是如果一个基于合理的利己主义的解释是充分的,我们就没有理由断言这是一个阴谋:化石燃料公司有经济激励政策使它们能够保持现有的地位,在法律上也有《第一修正案》为其辩护。然而,我们不能误认为化石燃料公司这是在试图做出准确的预测。
第二类型怀疑论属于逆向思维。在任何有争议的辩论中,有些人会发现,与大多数人保持一致大有裨益,而一小部分人则发现自己成了大家排挤的对象。在气候科学领域,这一现象尤为明显,因为这里的数据充满了噪声,并且很难以一种切身体验的方式验证气候预测。在推崇思想独立的美国,这种现象特别普遍。鲁德对我说:“不管你是观察气候、臭氧还是吸烟人群,都会发现总有那么一群人对科学运算驱动的结果持怀疑态度。”
最重要的是第三类型怀疑论,就是科学的怀疑论。鲁德说:“你会发现科学界有些人极为关注科学的某个方面,从某种程度来讲,如果你真的想取得什么进展,就应该尊重这些人的观点。”
对“全球气温会持续升高”预测的批判
在气候科学领域中,健康的怀疑论主要针对的是用于预测气候变化的计算机模型。宾夕法尼亚大学沃顿商学院的教授斯科特·阿姆斯特朗就是一个怀疑论者,他也是毕生研究预测的一小部分人之一。阿姆斯特朗的著作《预测原理》堪称预测领域的权威著作。阿姆斯特朗的办公室位于宾夕法尼亚的亨茨曼大厅,我在那里拜访了他。他已有 74 岁高龄了,但留着一撮山羊胡,看上去整个人好像年轻了 15 岁。
2007 年,阿姆斯特朗向艾尔·戈尔发起挑战,想要和他打个赌。气候变化委员会曾预测全球气温会持续升高,而阿姆斯特朗则认为自己的“无变化”预测——全球气温会保持 2007 年的水平——会打败气候变化委员会的预测。戈尔从未应战,但阿姆斯特朗每月都会公布自己的结果。截止到 2012 年 1 月,阿姆斯特朗的“无变化”预测在 47 个月当中有 29 个月都更为接近实际气温,胜过专门委员会“缓慢持续升温”的预测。
阿姆斯特朗告诉我,他在本质上并不怀疑温室效应的科学性,“我认为气温确实在一点点升高,在过去 150 年里,没有人为此事争论过。”
但是,对全球变暖的多数见解,阿姆斯特朗还是颇有微词的。2007 年,在向戈尔发出挑战的同时,阿姆斯特朗与他的同事凯思腾·格林用他们所说的“审计”方法对全球变暖的预测进行审查,以便判断这些预测的真伪,尤其是气候变化委员会所作的预测是否遵从他的那些预测原则。
图 12-2 阿姆斯特朗与戈尔的打赌图示
阿姆斯特朗和格林在论文中宣称,他们发现了气候变化委员会预测的不足之处,认为气候变化委员会未能遵循 89 条预测原则中的 72 条。尽管 89 条原则可能确实显得有点多,但大部分都是适用于预测领域的实用经验,当我们用这些原则来预测全球变暖时,基本上可以把它们简化为三大批判标准。
第一,阿姆斯特朗和格林认为,预测者之间是否达成共识与其预测是否准确无关,和其他任何事一样,预测者也有个人偏见。于是,阿姆斯特朗对我说:“不必投票,科学不是这样进步的。”
第二,他们认为全球变暖这一问题的复杂性,使得预测变得徒劳无功。“历史上从未出现拥有大量变量和不确定性的复杂事件最后是靠计量经济模型或其他复杂的模型解决的。模型越复杂,预测越不准确。”
第三,他们在论文中写道,预测并不足以解释全球变暖问题的内在不确定性,换言之,预测者实际上总是过于自信。
复杂性、不确定性和一致意见的重要性是本书的核心主题,每一点都值得认真倾听。
达成共识的预测结果
谈到全球变暖问题时,人们总是对“共识”一词过度痴迷,而那些不赞成共识的人也以此为荣,并把自己标榜为异端分子。另外一些人有时会依靠在线散发请愿书这类不可靠的手段,试图表达他们对全球变暖这一理论的怀疑态度。每当一些气候学家公开反对某项有关气候变暖的调查结果时,他们就会声称这些调查缺乏理论共识。
这些争论造成了人们对“共识”一词的误解。“共识”一词的内涵与“一致同意”或“多数通过”等词的内涵并不完全相同。所谓“共识”,是指组织或团体中的大多数成员围绕某一个特定的理念或方法,经过深思熟虑,最终达成广泛的一致意见。(比如,我们大多数人达成了共识,午餐吃中餐,但霍雷肖却决定午餐吃比萨。)
实际上,达成共识的过程也是一种投票方式。当某一个政党正打算选出一位美国总统提名人时,某位候选人就会在提前进行投票的州,如爱荷华州或者新罕布什尔州,作好充分的准备,因为在这些地区其他候选人都已落选。即使该候选人在得票数量上远无法达到提名的资格,但如果他向众人证实了自己已被政党中最关键的联盟接受了,也就没有必要在其他各州进行实质性的投票了。这样的候选人就是所谓的“通过达成共识赢得提名”。
确切地说,科学正是这样一种谨慎审议的过程,至少在理念上是这样的:发表文章、召开会议、验证假说、辩论结果,总会有一些科学发现能经得住考验而幸存下来。
气候变化委员会的各种活动,就是共识形成过程的示范。他们每做出一份报告就要历经数年,每一项调查结果都要经过一套全面的审核过程,有点儿拜占庭帝国的风格和官僚主义做派。鲁德说:“按照惯例,每一句审核言论都会被记录在案。哪怕是你的一位醉酒的表兄弟说了什么话,都会被记录下来。”
然而,人们对气候变化委员会这样的审议过程能做出更准确预测的期待程度,更具有争议。团队中的不同成员可以互相学习彼此的专业知识或技能,这一观念确有价值,但这可能会带来团体迷思和从众心理。有些成员更具影响力,不是因为他们有更好的想法,而是因为他们的个人魅力和社会地位。对已经达成共识的预测进行实证研究后,得到的结论各式各样,而与之不同的另一个预测过程,即由团队成员分别提交独立预测,之后经过均衡或综合的预测过程,几乎总是可以提高预测的准确度。
气候变化委员会的预测过程,可能会降低气候预测者的独立性。虽然名义上气候变化委员会有 20 个不同的气候模型可以用来作预测,但他们总是使用同样的假设、同样的计算机编码,重叠的部分太多,做出的预测只能代表五六个独立模型的预测结果。而不论模型有几个,委员会看重的只有全体成员核准的那一个预测。
不能把所有鸡蛋都放在一个篮子里
麻省理工学院的气象学者克里·伊曼纽尔是世界上研究飓风的一流理论家,他告诉我说:“拥有一个多样性的模型至关重要,我们不能把所有鸡蛋都放在一个篮子里。”
伊曼纽尔说,多样性的模型之所以重要,其原因就在于这种模型除了采取不同的假设之外,还存在着不同的漏洞。“没人愿意提及漏洞,但不同的模型确实存在不同的编码错误。我们不能指望一个拥有数百万代码行和指令的模型一丁点儿错误都没有。”
如果你习惯性地认为关于全球变暖的辩论就是“怀疑论者”和“信仰者”之间的一系列争论,可能就会认为这些争论是由持怀疑论的某位科学家挑起的。实际上,尽管伊曼纽尔将自己描述成保守的共和党人——这在麻省理工学院可谓勇敢之举——但他可能并不认为自己是全球变暖的怀疑论者。相反的,伊曼纽尔在科学界声誉良好,已经被推选为美国国家科学院成员。伊曼纽尔 2006 年出版的著作中提出了一个关于气候科学的基本“共识性”(并且经过缜密思考和完善表达的)观点。
伊曼纽尔关心的问题其实在科学界相当常见:气候学家已经就某些争论不休的问题达成了较为广泛的共识。2008 年对气候学家所作的一份调查显示,几乎所有(94%)的科学家都认同气候正在发生变化这一说法,其中 84%的科学家承认“气候变化是由人类活动引起的”这一观点。但是,对于气候计算机模型的准确度这一问题,众人则各执己见。科学家们对计算机模型预测全球气温的能力评价不一,对计算机模型模仿气候变化潜在影响的能力总体上持怀疑态度,比方说,只有 19%的科学家认为计算机模型准确地模仿了 50 年后海平面上升带来的影响。
对于任何一个对气候科学抱有讽刺观点的人而言,这样的调查结果应该都是具有挑战性的。他们总是认为科学家们在运用模型时判断不当,做出的气候预测都是捕风捉影,这样的想法应该杜绝。其实,那些科学家与他们的批评者一样,对模型也存在诸多怀疑。然而,正如阿尔·戈尔主演的那部《难以忽视的真相》一样,电影特效制作的气候变化有时不够慎重,向人们呈现了北极熊在北极为生存挣扎,或是南佛罗里达州和曼哈顿下城被洪水淹没的影像。这样的电影并不能很好地表达科学共识,气候学家争论不休的问题其实都是老生常谈,比方说如何设计计算机编码才能制作出逼真的云图?
气候科学不是“火箭科学”
气象(天气)预测者和气候学家总是意见不一,很多气象学家或含蓄或明确地批评气候科学。
气象预测者几十年来一直在努力提高预测的质量,但只要出现错误,还是会收到人们发来的表达愤怒的电子邮件。提前 24 个小时作预测确实充满挑战,所以,那些运用类比技术作预测的气候预测者怎么可能现在就预测出几十年后的气候呢?
正如谈到“共识”这个词时会出现几个意义相近的词一样,“气象预测”和“气候预测”这两个概念也存在一定的语义差别。气候是指地球自身的长期均衡状态,而气象描述的则是背离了长期均衡状态的短期表征。气候预测者不会试图预测 2062 年 11 月 22 日塔尔萨是否会下雨,他们更关注的可能是未来整个北半球的平均降雨量是否会比现在多。
而气象学家需要全力应对复杂性:混沌理论的整个学科都是从基本无望的气象预测发展而来的。气候学家也需要应对复杂性,比方说,云属于小规模现象,需要大量的计算机处理才能模仿得准确,却能对气候预测内在的反馈环产生潜在的深远影响。
充满讽刺意味的是,气象预测竟然是本书的成功案例之一。通过各种努力,结合计算机的力量和人类判断,气象预测比 10 年前甚至 20 年前准确多了。大多数领域的预测者都有过度自信的倾向,而气象预测者严于律己且严于律人的精神实在可贵。但是,他们取得的进步有力地驳斥了“复杂性使进步无望”的观点。
气象预测取得的进步源于该学科的两大特征。第一,因为每天都要进行气象预测,所以气象学家可以获得大量反馈,可以实时检查以校准他们的预测。而气候学家在作预测时就不具备这一优势,他们往往要预测 80~100 年后的气象状况,所以人们才会对他们的预测持怀疑态度。
第二,对天气系统的物理现象(这些物理现象受相对简单的、容易观测的规律支配)有深刻了解,同样会惠及众多气象学家。其实,气候学家可能也拥有同样的优势。我们能够观察云,也能准确推断这些云的运动方式,但如何将这一推断转换为数学术语是极大的挑战。
气候预测的一个经典案例,是对某些相当重要的巨大云层的运动轨迹进行的成功预测,这些云层最终演变为飓风。伊曼纽尔位于麻省理工学院的办公室编号为 54—1814 房间,想找到这里并非易事(我在一位很特别的看门人的帮助下才找到这间办公室,这位看门人可能跟我一样,都受到《心灵捕手》这部电影的鼓舞)。从伊曼纽尔的办公室里,可以清楚地看到查尔斯河的全景,也很容易想象到远处飓风的走向:飓风会向剑桥地区倾斜呢?还是会刮到北大西洋呢?
伊曼纽尔对两种飓风预测进行了区分。一种是单纯的统计区分,“对自己感兴趣的现象进行长期跟踪记录,对自己认为可行的预测指标进行长期跟踪记录,比如在大气中大规模流动的云或海洋温度等所有可获得的信息。不必特意亲身接触这些物理现象,只需将统计数据与你想要预测的事物联系起来即可”。
设想一股飓风正盘踞在墨西哥湾上空。我们可以针对过去出现过的飓风建立一个数据库,观察其风速、经纬度、海洋温度等数据,找出与这次飓风最为相近的地方。其他飓风是怎样运动的?什么样的飓风会袭击新奥尔良这样人口聚集的地区?什么样的飓风会最终散去?不用依靠所有气象知识,只需一个完善的数据库,我们就可以做出预测。
这样的统计技术可以提供粗糙但有用的预测数据。实际上倒退 30 年,当时气象预报预测飓风轨迹的最主要的方法就是纯统计模型。
然而,此类技术会受到收益递减规律的支配。在美国,飓风并不少见,风暴平均每年都会袭击美国一次。当你将大量的候选变量应用到一个罕见的现象中,就会有过度拟合的危险,会把过去数据中的噪声误当作信号。
当然,如果你对该系统的结构有所了解,那就还有另外一个方案可供选择。第二种气候预测模型从本质上来讲,就是模拟某个领域中某些部分的物理力学特性。与纯统计模型相比,建立这种模型需要更大的工作量,并且要对该现象发生的根本原因有深刻的了解。但是,这种模型更加准确。这样的模型现在正用于预测飓风路径,而且相当成功。正如前文中提到的那样,20 世纪 80 年代以来,飓风路径预测的准确性已提高了 3 倍左右,人们提前 48 个小时就能了解到袭击新奥尔良的卡特里娜飓风的确切登陆位置(虽然不是所有人都相信这一预测)。统计学驱动的系统现在不过是作为基准,用来对这些更加准确的预测进行衡量。
模型越复杂,预测越糟糕
阿姆斯特朗和格林对气候预测提出的批评,与他们所作的研究有关。这两位学者对经济学这类几乎不存在可用的物理模型、人们对其因果关系也知之甚少的学科进行过实证研究。野心过于膨胀的预测方法在这些领域频频失败,所以阿姆斯特朗和格林推断,这些方法用于气候预测也会失败。
任何预测模型的目标都是尽可能地“抓住信号、扫除噪声”。保持两者的平衡有时并非易事,需要有理论依据和保质保量的数据做保证。在经济预测中,数据贫乏,理论研究薄弱,所以阿姆斯特朗才会认为“(经济)模型越复杂,预测越糟糕”。
在气候预测中,情况更加模糊不清:温室效应理论的影响很大,可以支撑更为复杂的预测模型。然而,气温数据非常嘈杂,总是与预测模型相向而行。哪种考虑才是对的呢?我们可以依据经验处理这个问题,对气候科学中曾经使用过的各种预测方法的成功和失败的状况进行评估。像往常一样,最重要的是看这些预测在现实生活中的效果。
我敦促大家,不要将预测过程缩减为一系列的“车贴标签”式的标语口号。简单性原理(“在其他条件相同的情况下,简单的解释比复杂的解释更好。”)这类启发法看似诱人,却难以为我们所用。与用于预测疾病爆发的 SIR 模式一样,有些预测模型中的假设既简单又简洁,这样的情况我们已经遇到过很多,但是这样的模型却过于天真,无法提供成熟的预测。而在地震预测中,那些复杂得离谱的预测方案在软件程序包里功能齐全,在实际应用中却漏洞百出,真可谓华而不实。
“模型越复杂,预测越糟糕”,这句话就是在告诫人们,“不要在食谱中加入过多的盐”。你在做事之前是不是把它搞得很复杂,或者说在其中加了很多“盐”呢?如果你想越来越擅长作预测,就要“相信自己的厨艺,相信自己的味蕾”。
气候预测中的 3 类不确定性
认识到预测中的局限性只是成功的一半,在这一点上,气候预测者已经做得相当好了。气候学家敏锐地意识到不确定性的存在:在政府间气候变化专门委员会于 1990 年公布的 3 份报告中,“不确定”和“不确定性”这两个术语出现了 159 次。政府间气候变化专门委员会建立了一整套命名法,用于表达对某一研究发现的赞成或确定程度。比如,在报告中,当“可能”这个词单独出现时,意味着某一预测实现的概率为 66%,而当“几乎确定”这个词出现时,意味着对某一个预测怀有 99%或更强的信心。
然而,警惕不确定性是一回事,适当准确地估计到不确定性又是另一回事。像政治民调这类问题,我们可以依靠强大的历史证据数据库:美国总统大选前一个月,如果一名候选人在民调中领先 10 个点,那么他最终赢得美国总统大选的概率是多少?我们可以查阅过去几十场美国总统大选的情况,进而依据经验得出一个答案。
但是,气候预测者建立的那些模型不能依靠此类技术。人类只有一个地球,我们要不时地对其气候演变进行预测,这种预测需要跨越未来几十年的时间。尽管气候学家也许已经考虑到预测中会存在不确定性,却仍然不能确定预测中究竟有多少不确定性。对于任何学科的预测者而言,这样的问题都是极具挑战性的。
尽管如此,我们还是有可能将气候预测中的不确定性分为 3 个组成部分。加文·施密特是汉森的同事,与汉森同在宇航局工作,他是一个说话带刺儿的伦敦人,也是实地天气网站的博文合著者,施密特的办公室位于纽约晨边高地,我是在他办公室附近的酒吧与他碰面的。
施密特拿出一张餐巾纸,在上面画出一张如图 12–3 所示的图表,说明了气候学家面临的三大突出问题。在气候预测过程中,这 3 种不同类型的不确定性不同程度地存在着。
图 12-3 全球变暖预测中的不确定图示
第一种类型,施密特称之为“初始条件的不确定性”,这是与温室信号抗争的短期因素,影响着我们对气候的体验。温室效应是一种长期现象,会被日复一日、年复一年的各种事件所掩盖,从而变得模糊不清。
初始条件的不确定性的最为明显的例子就是天气,如果用于气候预测,那它代表的只是噪声,而不是信号。气候变化委员会最近预测,下个世纪的气温可能会升高 2 摄氏度,相当于每 10 年升高 0.2 摄氏度,或每年升高 0.02 摄氏度。可是,在温带地区,当昼夜温差达到 15 摄氏度、季节温差达到 30 摄氏度时,这样的信号是很难察觉的。
我是在 2011 年拜访施密特的。事实上,就在我们会面的前几天,纽约和美国东北部其他几个地区就出现了反常的 10 月暴雪。中央公园的积雪达到 33.2 毫米,创下了 10 月降雪的纪录,而在康涅狄格州、新泽西州和马萨诸塞州情况更加严重,几百万居民的家中同时断电。
中央公园正好有一个相当完整的气温纪录,可以追溯到 1869 年。在图 12–4 中,我绘制了跨越 1912~2011 年整整 100 年的月平均气温,从图中可以观察到四季气温的剧烈波动(变化虽然剧烈,但也能够预见),从高温到低温再回到高温,有些年份较高,有些年份较低。从这些例子中可以看出,与天气相比,气候信号几乎无法察觉,但这一信号确实是存在的:中央公园在 100 年的时间里平均气温降低了约 15.6 摄氏度。
图 12-4 1912-2012 年中央公园(纽约市)的月平均气温
而在为期 1~10 年的时间里,气温也会出现周期性波动。其中之一被称为“ENSO 循环”(厄尔尼诺–南方涛动现象)。每次循环会历经 3 年左右的时间,是由热带太平洋地区的水温变化引起的。在发生厄尔尼诺现象的年份,若该循环充分发挥威力,就会给北半球大部分地区带来更加温暖的天气,也会降低墨西哥湾飓风的活动频率。在发生拉尼娜现象的年份,情况正好相反,这时的太平洋水温较低。除此之外,人们对 ENSO 循环的了解相对较少。
初始条件的不确定性的第二个案例是太阳的活动周期,平均约为 11 年,在这一个周期里,太阳会发出略强或略弱的辐射。(这一点通常可以通过太阳黑子这个更高一级的太阳活动来衡量。)但太阳的活动周期不怎么规律,比如,太阳的第二十四个活动周期中,人们预期太阳黑子在 2012 年或 2013 年的活动量最大(因此会出现更高的气温),但实际上这一现象却推迟了。太阳的休眠期有时可以持续几十年,17 世纪末 18 世纪初的蒙德极小期持续了近 70 年,这段时期内几乎没有太阳黑子活动,因此欧洲和北美地区的温度大幅走低。
最后一个案例是向大气喷发硫黄的火山的周期性休眠。火山喷发释放的气体具有反温室效应的作用,可以使地球降温。1991 年皮纳图博火山爆发,此后两年里,全球温度降低了约 0.2 摄氏度,与温室效应在 10 年里带来的温度升高幅度相当。
时间跨度越大,就越容易忽略这些中期效应。在 1~10 年的时间跨度内,中期效应都能够主导温室效应的信号,但超过这一时长,它们就会日渐式微。
第二种不确定性会随着时间的推移而增加,施密特称之为参数的不确定性。这一类型的不确定性涉及大气中二氧化碳或其他温室气体的浓度。在较小的时间跨度内,大气成分还是可预测的。工业活动持续不断,二氧化碳迅速进入大气层并长期滞留。(据估计,二氧化碳的化学反应半衰期约为 30 年。)即使主要工业国家同意立即制定出实质性的减排措施,想要使大气中的二氧化碳的增长速度放缓也需要数年的时间,更不要说实现负增长了。施密特对我说:“你我永远都无法等到二氧化碳浓度降低的那一天,就连你的下一代也等不到。”
由于气候模型依赖于对大气中二氧化碳浓度的特定假设,这不仅使未来 50 年或 100 年的预测变得非常复杂,也会对近期的预测产生轻微的影响,影响程度主要取决于影响二氧化碳排放的政治和经济决策。
第三种不确定性是结构的不确定性。这种不确定性是气候学家及其批评者最为担忧的不确定性类型,因为该类型最难定量,与我们对气候系统动力学的了解程度及我们能否很好地用数学方法表现这种模型紧密相关。结构不确定性的增强速度较为缓慢,而在气候这样的动态系统模型中,错误也会自我强化。
施密特认为,综合 3 种不确定性因素考虑,在气候预测出现之前的 20~25 年里,这 3 种类型的不确定性很可能都处于最低点。此时,我们就可以比较合理地确定大气层中二氧化碳的浓度了,但是考虑到 ENSO 循环、火山周期性休眠和太阳活动周期对气候的影响已经日趋平稳,我们要做的还有很多。
气候变化委员会在 1990 年公布了第一份报告,当时正值 20 年里的最佳时机。20 世纪 80 年代,詹姆斯·汉森所作的一些早期预测也是如此。换句话说,是时候评判预测的准确性了。它们究竟表现如何呢?
评判气候预测准确性的时刻到了
衡量一个预测的准确性,首先需要一个测量工具,而气候学家的测量工具很多。全世界主要有 4 个评估全球气温的组织,它们使用的测量工具从陆地上的温度计到海洋中的测量站,这 4 个组织分别是美国宇航局、美国海洋和大气局,还有英国和日本的气象部门。
最新加入这场“预测竞赛”的是卫星观测。最常用的卫星记录来自亨茨维尔的阿拉巴马大学和一家名为“遥感系统”的私有公司。卫星记录并不直接被采纳为气温数据,而是通过对微波辐射的测量进行气温预测。卫星测量出的低层大气的气温代表一个合理的表层气温。
根据记录时间长短的不同,气温记录有所不同,最早的记录可以追溯到 1850 年英国气象局的观测报告,最近的记录则是 1979 年的卫星记录。这些记录有不同的测量基准,比如,美国宇航局的记录是相对于 1951~1980 年这 30 年间的平均气温得出的,而海洋和大气局的记录是相对于整个 20 世纪的平均气温得出的。这两个记录也很容易得到校正,因为各个系统的目标是测量气温上升或下降了多少,而不是测量气温的实际数值。
令人欣慰的是,各种记录之间的差异并不大。图 12–5 中的气温记录显示,1998 年和 2010 年是气温最高的两个年份,同时还可以看出,自 20 世纪 50 年代以来,大气中二氧化碳的浓度快速升高,温度呈明显上升趋势。
图 12-5 以 1951-1980 年的平均气温为基准的全球气温分布图
1981 年,汉森与其他 6 位科学家在学术声望极高的《科学》杂志上发表了一篇论文,预测气温的早期尝试自此开始。这些预测并不是以完全成熟的仿真模型为基础,而是依据二氧化碳及其他大气气体的影响做出的较为简单的统计预测,效果非常好。但实际上,他们略微低估了 2011 年的全球变暖程度。
汉森之所以小有名气,是因为他在 1988 年所作的国会证词以及同年发表在《地球物理学研究杂志》上的一篇论文。这些预测确实是依靠一个大气的三维物理模型做出的。
汉森在美国国会上说,华盛顿未来将会经历更多的“炎热夏季”。在其论文中,他为“炎热夏季”下了定义:所谓“炎热夏季”,是指华盛顿夏季的平均气温将达到 1950~1980 年这 30 年间夏季气温排名前十的水平。到 20 世纪 90 年代,华盛顿夏季的高温时间将达到 55%~70%,约为 33%这一基准比例的两倍。
汉森的预测最后都应验了。20 世纪 90 年代,华盛顿经历的 10 个夏天里有 6 个的气温都达到了“炎热”的程度(表 12–1),基本符合汉森的预测。21 世纪的第一个 10 年里,这一趋势仍在继续,到 2012 年气温更是创下了新高。
表 12–1 炎热夏季
基准比例:33% 汉森的预测(1988 年):20 世纪 90 年代华盛顿夏季的高温时间将达到 55%~70% | ||||
城市 | 临界值(华氏度) 1 华氏度 =–17.2 摄氏度 | 1990~1999 年 | 2000~2011 年 | 1990~2011 年 |
华盛顿 | 86.2 | 60% | 58% | 59% |
奥马哈 | 86.2 | 10% | 42% | 27% |
纽约 | 81.4 | 80% | 75% | 77% |
孟菲斯 | 89.3 | 50% | 67% | 59% |
平均值 | 50% | 61% | 56% |
汉森在其论文中还为其他 3 个城市做了预测:奥马哈、孟菲斯和纽约。得到的结果更加多样,体现了气候的区域差异。根据汉森对“炎热夏季”的定义,20 世纪 90 年代,奥马哈只有一年的夏季达到“炎热”的程度,低于 33%的历史平均比例。而根据拉瓜迪亚机场的观测,纽约的 10 个夏季里有 8 个达到了“炎热”的程度。
对 4 个城市的预测总体来说相当不错,但只能算是汉森的低端预测。汉森的全球气温预测更难评判,因为这一预测涉及的场景太多,各自依赖的假设也不同,实属高端预测。即使是最保守的方案,也多多少少地高估了 2011 年经历的气候变暖的过程。
作为国际社会在这一领域做出一致性预测的首次尝试,气候变化委员会于 1990 年的预测受到了广泛的关注。虽然与汉森的预测相比,这次预测还是不够明确,但是他们的预测详细周密,较为准确。比如,他们预测陆地表面与海洋(湖泊、河流)表面相比升温更快,而且在冬季更为明显,另外,在北极和其他北半球高纬度地区,将出现气温大幅度升高的现象。结果证明,这两个预测都是正确的。
然而,政府间气候变化专门委员会所作的头条预测是“全球气温将会升高”,为自己的预测留下了很多悬念。
与汉森不同,委员会的气温预测采取的是呈现一系列可能的结果的形式。在所有可能的情况中,最高值是下一个 100 年里气温将会灾难性地升高 5 摄氏度,最低值是下个世纪的气温只会升高 2 摄氏度,而更有可能出现的情况是全球气温升高 3 摄氏度。
实际上,自从这份报告公布以后,实际气温的上升速度已经减缓了(图 12–6)。在 1990~2011 年间,每年气温平均升高 0.015 摄氏度,或每 100 年升高 1.5 摄氏度,这只是委员会预测报告中提出的最有可能的数值的 1/2,也稍低于最低值。另外,委员会的预测报告还高估了海平面上升的幅度。
图 12-6 1990-2011 年全球实际气温 VS.1990 年气候委员会的预测值
这样的结果是对气候变化委员会预测效果的一次沉重打击,尽管我们应该考虑一个重要的限制条件。
政府间气候变化专门委员会是在“一切照常”的情况下做出的预测,认为减少碳排放量是不可能做到的事。这套方案意味着,截止到 2010 年,大气中的二氧化碳浓度将会达到 400PPM。实际上,人们已经在为减排努力了,尤其是欧盟,虽然他们付出的努力十分有限,但是这一预测也太过悲观了,2010 年二氧化碳浓度实际上仅为 390PPM。换句话说,预测中的错误其实反映了预测中参数的不确定性——这对政治和经济问题的影响比对科学问题的影响更大,还反映了委员会对减排努力过于悲观的态度。
尽管如此,委员会最终还是承认其预测过于冒进。1995 年,委员会成员公布了另一个预测,“一切照常”情况下的预测范围经过修正,使得预测值大大降低:每个世纪气温升高 1.8 摄氏度。与实际的气温趋势相对比,这次预测已经算是非常准确的了,它基于委员会做出的巨大调整。因此,当你发现预测错误时,正确的做法是及时改正,而不是学堂吉诃德的“愚侠”精神,誓死不屈。这也从侧面证实了气候预测中确实存在不确定性。
对早期预测的全部努力给出的分数,可能取决于你是否根据曲线图打分。气候变化委员会于 1990 年犯下的预测错误在一定程度上解释了预测中存在参数的不确定性,但如果委员会在 5 年后做出的预测仍然没有实质性改变,这一论点就更有说服力了。另外,1995 年的气温预测基本准确,为数不多的几个关于全球气温升高(如北极冰面收缩)的预测也相当不错。如果以高标准评判预测者,那么委员会的分数就会比较低,但也能勉强及格。如果你已经了解到预测史原本就充满了失败,那么相比之下,委员会的预测已经相当好了。
预测中的不确定性未必能成为不采取行动的理由,相反,耶鲁大学经济学家威廉·诺德豪斯认为,正是由于气候预测中存在不确定性,人们才不得不行动起来,这是因为气温升高是一件糟糕的事。另外,在气候科学中,预测更具有猜测性而不具有准确性,政府正是打着这个幌子,要么在经济刺激计划上投入数千亿美元资金,要么发动中东战争。
“全球变冷”事件的教训
时至今日,气候学家的每一次预测都冒着声誉受损的危险:其他领域的错误预测很快就会被遗忘,而相比之下气候预测的错误却会被人们牢记数十年。
气候评论家曾经普遍认为,人类会遭遇全球变冷现象和新的冰河世纪。确实,20 世纪 70 年代发表的几篇论文曾经预测全球有变冷的趋势。这些论文以一个足够合理的理论为依托:由硫排放引起的变冷趋势将压过由碳排放导致的变暖趋势。
这些预测遭到了主流科学文献的驳斥,但得到了新闻媒体的支持。1975 年,《新闻周刊》上的一则报道曾经猜想泰晤士河和哈德逊河可能会结冰,并且认为食品生产会大幅度减产,不过这些观点仅代表文章作者本人的观点,与所有接受采访的科学家的看法无关。
如果媒体在气候科学争论者中的“怀疑论者”和“信仰者”之间错误地画上等号,那它们有时也能舍本逐末地选出最荒唐的气候变化断言,即使这些断言受到一大群科学家的批判也无所谓。
2011 年纽约下起 10 月怪雪之后,施密特曾这样对我说过,“问题是,很多人会到处乱讲,好像他们亲眼见过这些数据似的,我敢保证谁都没有亲眼看到数据”,当时许多媒体都把这场雪灾视作与全球变暖相符或者相悖的证据。
那时施密特也接到了无数通电话,很多记者都在问他这场纽约 10 月暴雪在气候变暖方面意味着什么。施密特告诉这些记者他本人也不能确定,模型并不能计算得那么具体详细。但是,他的一些同事的言论就没有那么谨慎了,越是引人注目的言论就越有可能被新闻媒体引用。
20 世纪 70 年代,人们依据硫排放问题做出全球变冷的预测。硫排放也许可以解释气候变化委员会在 20 世纪 90 年代的预测为何会失败,也可以解释 1995 年专家组为何大幅缩小气温预测的变化范围。1991 年,菲律宾吕宋岛的皮纳图博火山爆发,向大气中排放了含硫气体,这次火山喷发带来的影响和气候模型的结果是一致的。但是仍需强调的是,不同温室气体的相互作用会给气候模型带来挑战,还会导致系统误差。
从图 12–7 可以看出,人为因素导致的硫排放在 20 世纪 70 年代早期达到峰值,随后开始下降,这在一定程度上是由于当时尼克松总统为了解决酸雨和空气污染问题,于 1970 年颁布了《清洁空气法》。20 世纪八九十年代的全球变暖趋势或许可以反映出硫排放量降低的走势,因为二氧化硫的排放能够抵消温室效应。
然而,大约从 2000 年以来,硫排放量再次增加,主要是由于发展中国家的工业活动越来越频繁,大量燃煤电厂投入生产。尽管硫排放对全球变暖趋势的削弱作用并不像碳排放量增加产生的影响那么大——否则,全球变冷理论就是正确的了——但是,硫排放或许真的可以阻止全球变暖的进程。
图 12-7 1900-2005 年全球硫排放量
正确的预测绝对离不开科学的方法
如果某一个预测声称能够对气候这类复杂的过程做出准确的预测,或者称需要几年时间才可以证明其准确性,那么人们必然会对其持怀疑态度。
一知半解的预测者有时会错误地认为,他们之所以忽略某件事,是因为对这件事建模是一件难事。优秀的预测者总是有备用计划,如果他们发现自己的模型是失败的,就会默认使用一个合理的基准预测。(在美国总统选举中,你的默认预测是在任的候选人会获胜,这比在候选人中随机挑出一个要准确得多。)
那么,气候预测的基准方案是什么呢?如果人们批判全球变暖的预测不切实际地复杂,就要有一个相对简单的预测取而代之,这个预测需要有强大的理论假设,但没有其他不必要的附属条件。
比方说,假设你试图以一个极其简单的统计模型为基础作气候预测,这个模型忽略了硫排放、ENSO 循环、太阳黑子等各项参数,仅根据二氧化碳浓度、气温等变量进行预测。此时不必使用超级计算机,只需一台手提电脑在几微秒内就能够计算出结果,但这样的预测准确性能有多少呢?
实际上,与气候变化委员会所做的预测相比,这样的预测很可能非常准确。如果将 1850~1989 年的气温记录、南极冰芯及位于夏威夷冒纳罗亚观测站测量出的二氧化碳浓度都放入一个线性回归方程式中,得出的结果是,从 1990 年至今,全球气温正在以每个世纪 1.5 摄氏度的幅度上升,这与图 12–8 所示基本一致。
图 12-8 1990-2011 年全球实际气温 VS.简单回归预测
另外一种方法只是稍显复杂,即使用当时十分容易获得的有关二氧化碳浓度与气温之间总体关系的预测值。对全球变暖的所有预测有一种“通用货币”,即大气中二氧化碳浓度加倍(即 100%增长)对气温产生的影响的值。长期以来圈内人在一定程度上对这个值的认定是一致的。从 1938 年英国工程师 G·S·卡伦德依据简单的化学方程式做出的预测到当今超级计算机做出的预测,从所有预测值中总结出的结论是:二氧化碳增倍会使气温上升 2~3 摄氏度。
考虑到大气中二氧化碳的实际增长速度,通过简单转换得出的结果也许已经表明,从 1990 年至今,气温上升速度为每个世纪 1.1~1.7 摄氏度。实际上,气温上升速度为每年 0.015 摄氏度,即每个世纪上升 1.5 摄氏度,这个数值与预测值正好吻合。
詹姆斯·汉森 1981 年的预测所使用的方法与上述方法十分相似,在对当时的气温进行预测时,效果相当不错,比他在 1988 年依靠模拟气候模型做出的预测要准确得多。
由此看来,阿姆斯特朗和格林对复杂模型的批判是对的。比较基础的预测方法虽然成功了,但也只能表明阿姆斯特朗赢得的只是一场战斗,而不是整个战争。阿姆斯特朗对复杂模型提出了质疑,而简单模型能做出更佳气候预测的事实也支持了他的立场,所以他认为简单模型更胜一筹。事实上,简单模型的确正确地预测出气温会随着二氧化碳浓度的增加而上升,同时也证实了温室效应的假说。
与此不同的是,阿姆斯特朗的“无变化”预测留下了一些最基本的科学问题等着人们去解答。2007 年的气温虽不是高得出奇,但却高于 20 世纪任何一年的气温,而“无变化”预测正是以 2007 年的气温为基准。对于 2007 年的气温高于 1987 年、1947 年或是 1907 年这一事实,除了大气成分的变化之外,还有什么合理的假说可以对此做出解释呢?实际上,气候模型最切实的贡献,就是发现除非我们能够对大气中二氧化碳和其他温室气体浓度升高的原因做出解释,否则想复制目前的气候基本上是不可能的。
阿姆斯特朗对我说,他之所以做出“无变化”预测,是因为他并不认为贝叶斯定理优于其他任何假设,而在其他研究领域,“无变化”预测是一个非常好的默认预测方式。如果将气候预测的严谨做法运用到其他研究领域,将更有说服力。但是阿姆斯特朗并没有这么做,正如 2011 年他对美国国会监督小组所说的那样,“我确实在努力学着不那么关心气候变化,可我就是一个喜欢预测的人,没办法。”
有些预测者说科学对预测来说并不重要,而有些科学家则说预测对科学来说并不重要,本书就是想提醒你,对这两种人的观点皆不可轻信。科学与预测在本质上是紧密相关的,不关心科学的预测者就如同不关心食物的厨师一样。科学的独特之处在于,我们关注的是客观世界,这也是使预测变得科学的原因。如果我们只关注方法、准则或是模型,那预测最终必败无疑。
气温变化趋势的真相
如果说阿姆斯特朗的批判没有道理,那么他与戈尔打的赌又该怎么解释呢?阿姆斯特朗的“无变化”预测不仅没有失败,反而还大获全胜了。自从阿姆斯特朗在 2007 年打了那个赌之后,虽然每个月的气温变化幅度极大,但变化却并不稳定,比方说,2011 年的气温就略低于 2007 年的气温。
这种趋势持续了 4 年多的时间。更重要的是,有个难以忽视的真相,2001~2011 年这 10 年间,全球气温根本就没有上升(图 12–9),反而下降了,虽然降幅不那么明显,但实际情况确实如此。
图 12-9 2001-2011 年的全球平均气温
这类预测框架有时可能是存心欺骗。比如,如果你将 ENSO 循环期中气温很高的 1998 年作为起点,就很容易得到降温的“趋势”。相反,2008~2018 年这 10 年的气温“走势”就呈现为不断升高,因为 2008 年是相对凉爽的一年。
然而,全球变暖的进程并不是匀速推进的。气温上升的历史是一个明显的长期增长过程,但期间也有保持不变或者负增长的趋势。比如,尽管二氧化碳的浓度一直在增长,除了 2001~2011 年这 10 年之外,1894~1913 年、1937~1956 年、1966~1977 年(图 12–10)这几个时间段几乎都没有升温的迹象。这一问题与金融分析面对的问题有些相似之处:在很长一段时间里股市持续攀升,但这种走势并不能告知你明天、下周或是明年的股市表现如何。
图 12-10 1900-2011 的全球气温曾出现短期气温持平和显著下降的趋势
我们可以直接从科学的角度对最近出现的气温保持相对稳定的现象做出解释,比方说,发展中国家不断增长的硫排放量就抑制了气温走高的势头。2001~2011 年的气温虽然没有上升,但比之前的任何一个 10 年的气温都要高。
尽管如此,本书还是鼓励读者认真思考信号与噪声,并找出用百分比或概率表达的预测,这些预测可以真实地体现出我们预测能力的局限性。当预测者对某一个复杂现象的预测表现出十足的信心时,那可能说明他并没有认真思考这个问题,只是将各种数据过度拟合到自己的统计模型当中,或者他并不想找到真相,只是想炒作自己的人气罢了。
阿姆斯特朗和施密特都不愿意对气温走向作对冲预测(即两面下注)。阿姆斯特朗对我说:“我们模拟了 1850~2007 年的气温走向,看到前 100 年的气温变化时,我几乎可以确定与戈尔打的那个赌,我赢定了。”而施密特则认为气温将会继续上升,他还愿意提供诱人的赔率与任何人打赌。“我敢打赌下一个 10 年的气温将会比这个 10 年的气温还高,以多大的赔率打赌都行,即使是 100∶1 的赔率,我也同意。”
前文中提到的统计预测方法,就可以解决阿姆斯特朗和戈尔之间的争论——他们两个的预测都不是十分准确。如果你以 10 年为期限测量气温的发展趋势,那么自 1900 年以来,呈升温趋势的时间占到 75%,而呈降温趋势的时间只占 25%。随着大气中二氧化碳浓度的增加速度不断加快,温室效应的信号也不断增强,气温持平期或下降期的出现频率也会降低。尽管如此,此类情况出现的概率总是存在的,就如 100∶1 的赔率也会存在一样。如果你认为二氧化碳的浓度会以目前(即每年 2PPM)的速度增长,那么根据这一统计方法,在某个特定的 10 年里不会出现净升温的概率为 15%。
不确定性是预测必不可少且不可或缺的一部分。正如我们所知道的那样,有时对不确定性的一个可靠而准确的表达有可能会拯救许多财产和生命。在其他情况下,比方说股票期权交易或者是赌一场 NBA 比赛,你赌的也许就是自己预测不确定性的能力。
之所以需要仔细且明确地对不确定性进行量化,还有另外一个原因,这个原因是科学进步中必不可少的一部分,与贝叶斯定理密不可分。
假设在 2001 年之前,你就已经十分笃信二氧化碳排放会导致气温持续上升。(在我看来,这是恰当合理的,因为我们对温室效应的理论研究和实验证据都支持这样的观点。)你认为全球变暖假说有 95%的概率是正确的。
但是,之后你观察到一些新的证据:在接下来的 10 年里,也就是从 2001~2011 年,全球气温非但没有上升,反而下降了,尽管降幅很小,但的确是下降了。根据贝叶斯定理,此时你应该将全球变暖假说成立的概率预测值下调,而问题在于气温究竟下降了多少。
如果你已经正确地预测到短期气温变化模式中的不确定性,那么对自己估值的下调幅度就不会非常大,反之调整幅度会很大。正如我们所看到的那样,在 10 年内,即使出于气候多样性的原因,全球变暖假说得到了印证,但不出现净升温的概率也会有 15%。相反的,如果气温变化完全是随机且无法预测的,那么就有 50%的概率会出现一个气温下降的 10 年,因为气温上升和下降的概率是一样的。根据贝叶斯定理(表 12–2),无净升温的 10 年会使你很无奈地将自己对全球变暖假说成立的概率预测值从 95%下调到 85%。
12–2 贝叶斯定理——全球变暖假说
先验概率 | ||
全球气温上升的初始预测 | x | 95% |
新证据出现:10 年里未出现净升温 | ||
如果全球变暖假说是正确的,10 年里不出现净升温的概率 | y | 15% |
如果全球变暖假说是错误的,10 年里不出现净升温的概率 | z | 50% |
后验概率 | ||
在 10 年里不出现净升温的情况下,全球变暖假说成立的概率的重新 预测 | xy xy + z(1 - x) | 85% |
另外,即使你断言 10 年内气温不会上升的概率只有 1%,现在看来你的理论也已经陷入非常糟糕的境地了,因为你的断言过于明确。此时根据贝叶斯定理,你赋予全球变暖假说成立的概率已经下降到 28%了。
当我们提出更加自信的主张而又未能实现时,这就为驳斥我们的假说提供了更加有力的证据。一旦出现这样的情况,我们不能责备任何不再信任我们的预测的人,他们不过是根据贝叶斯定理的逻辑做出了正确的推断。
那么,我们为何一开始就要提出更加自信的主张呢?尤其是在这些主张还没有真正被统计数据证实的情况下就这样做,这是为什么呢?其实,人们这样做的原因有很多。在气候争论中,可能是因为这些更自信的主张更有说服力,但这些主张只有在正确的情况下才可能更有说服力。除了被称为气温上升的全球变暖现象,把所有异常天气都认定为人为造成的气候变化,实际是一个筹码很高的赌注,因为这涉及更多政治因素,而不仅是一种科学现象。气候变化会自动显露出来,而不是通过气温上升或海平面上升这些现象体现出来的,对于这一点,人们很难达成共识。显然,把每一次降雪都认作驳斥气温上升的证据是十分荒唐可笑的。
政治与科学的针锋相对
气候学家面临的两难境地是,全球变暖是一个需要在短期内解决的长期难题。这是因为二氧化碳在大气中长期存在,而我们今天所作的决定将会影响到子孙后代的生存问题。
若是在一个完全理性且充满仁爱的世界里,这样的问题就不会那么令人烦恼。但是,我们的政治机构和文化机构并不能很好地处理这样的问题。比如,美国国会在面对 4 年一次的美国总统大选或是美国经济为满足每季度的赢利预测而承受巨大压力时,都有些力不从心。气候学家以各种方式应对这一挑战,有些卷入了政治争论,而有些对此保持距离。宾夕法尼亚州立大学地球系统科学研究中心的负责人迈克尔·曼曾经是论战的中心人物。在“气候门”事件中,他为英国国家气象局提供的气温记录被黑客入侵,这一组织隶属于东安格利亚大学的气候研究小组。一些怀疑论者断言,迈克尔·曼和其他科学家密谋操纵了气候研究小组的气温记录。
相关事实是,科学家同行为他们洗清了嫌疑,气候研究小组的气温记录同其他科学家的记录基本一致,但是在黑客入侵的邮件中,迈克尔·曼和其他科学家明确表达了他们对科学理解过程中的公共关系因素的关注。在一个秋高气爽的下午,我到他的大学办公室里拜访了他,我们谈了约两个小时。
迈克尔·曼对全球变暖背后的科学道理有其独到的见解。与大多数气候学家一样,他并不怀疑气候变化的理论机制,但他对气候模型做出的预测却持怀疑态度。
迈克尔·曼对我说:“对科学任何可靠的评价我都会认同。有些事情我们非常了解或是有几分了解,但对于有些事情我们充满了不确定,甚至对其一无所知。”
“在我看来,这次居心叵测的公开对话带来了一系列不幸后果,其中之一就是,我们正在把时间浪费在争论某一个科学家已经广为接受的观点上,而我们本可以对切实存在的不确定性进行开诚布公的讨论。”
与施密特同在 RealClimate.org 网站上发表博文的迈克尔·曼发现,自己已经卷入了与哈兰学会这样的组织的堑壕战中。他引用了《自然》杂志一篇社论中的一句话:“我们与这些人在街头对峙”。街头对峙的长期目标,是让公众和决策者认识到采取行动抵抗气候变化的紧迫性。过度自信的预测者总是误把自己的信心当作真实情况,如果全社会都习惯了他们的这种做法,那无论是公众还是预测者,都不会再把不确定性看作制胜策略了。
迈克尔·曼对我说:“当你对不确定性的位置相当明确时,就要划定界限,不要让我们的言语中充满不确定性,以致没有人会认真倾听。作为一个团体,不将自己的观点表达出来是不负责任的。总有一些人乐于填补空缺,但他们用来填补空缺的却是不真实的信息。”
实际上,迈克尔·曼口中的“街头对峙”主要是在 Real–Climate.org 网站这类“共识”网站和 Watts Up With That.com 网站这类“怀疑”网站之间展开,围绕每天的最新杂志文章、天气模式或政治论战进行。两家网站各持己见,谁都不愿让步。一朝是喷气式飞机,永远都是喷气式飞机,死不让步。
我并不是说两个网站平分秋色。在全球变暖这一科学争论上,真理似乎只站在一边:温室效应确实存在,由于人类排放二氧化碳气体,温室效应还会继续加剧。这很可能会使地球升温。温室效应的影响并不确定,但一定不会带来什么好结果。
然而,如果只有几个人信服科学,那么“街头对峙”似乎就认定了我们即将解决的是政治问题。实际上,我们还需要很久的时间才能让人们信服科学。在哥本哈根气候大会上,理查德·鲁德对我说:“我曾经得出一个结论,人们必须想出低碳的方法。”但他预感到,193 个成员国几乎不可能找到彼此都接受的方法。
与此同时,在过去几年里,美国公众对全球变暖正在发生这一事实的信任度已经下降了。即使对气候变化带来的影响完全认同,但一些州和国家减少碳排放的计划做得就没有其他地区或国家好。华盛顿州州长克里斯蒂娜·格雷瓜尔对我说:“在产煤州有一些非常进步的民主党州长,你说他们对此是否紧张呢?”
这些问题并非气候争论所独有,而我实在不知道该如何解决这些问题。但是我知道,科学与政治之间存在着根本性的差异。实际上,我已经越来越肯定这两者是彼此对立的。在科学中,进步是可能的。如果我们相信贝叶斯定理,一旦做出预测、观念得到检验和改良,科学进步便是必然的。科学进步的道路并非一帆风顺,有些深受好评(甚至“达成共识”)的理论后来也被证明是错误的,但不管怎样,科学总是向着真相不断前进的。
与科学不同,在政治上我们似乎越来越难达成共识。自罗斯福“新政”实施到 20 世纪 70 年代以来,美国众议院两党之间的分歧已经有所减少,但在 2011 年,分歧又开始加大,在过去至少 100 年的时间里,两党之间的分歧达到了顶峰。共和党已经远离了共识,而民主党也在一定程度上有所偏离。
在科学领域,很少看到所有数据都集中到一个明确的结论上的情况。真正的数据非常嘈杂,即使理论是无懈可击的,信号有时也会有所偏离,更何况根据贝叶斯定理,无懈可击的理论是不存在的。科学是一个渐进的过程,需要进一步提炼与检验,这是科学怀疑论的全部。
而在政治领域,人们从不让步。某人言语不当会被视为表现失礼,确实如此。人们期待政党对于经济、社会及没有内在关系的对外政策等问题保持平等的信念。但是随着世界变得越来越接近,民主党和共和党的纲领也会变得越来越不完善。
正是因为政治与科学之间的争论还会持续几十年,气候学家最好还是从街头对峙中撤出,避免跨越卢比孔河,从科学界踏入政坛。在科学领域,可疑的预测更有可能会现出原形,真相也更有可能占上风。在政治领域,真相并不能享有特权,它可以是任何人的猜测。
美国政治系统失调的状态是解释我们对美国未来前景持悲观态度的原因,而科学技术的不断发展则是解释对美国未来前景持乐观态度的原因。美国是一个善于创造的民族,它的专利数量数不胜数,还拥有世界上最好的大学和研究机构,不论是医药还是信息技术,美国的公司都能占据市场的主导地位。如果让我在思想的锦标赛和政治的牢笼赛之间做出选择,我知道我会选择哪一个,在我自认为预测正确的时候尤其如此。