第三十章 皇帝的新装

如果按照严格的逻辑关系推理,那么即便在现代意义的层面上,流行病学能否独立证明因果关系依然可能会受到质疑,而同样的结果也适用于动物实验。[1]

——理查德·多尔(Richard Doll)

1947年初冬,英国政府的统计学家警告卫生部,一种始料不及的流行病正在全国蔓延开来:肺癌发病率在过去20年间几乎增加了15倍。[2]统计局副局长写道:这是一个“应该研究的问题”[3]。虽然这句话表达出英国人特有的委婉,但是足以引发广泛回应。1947年2月,寒冬凛冽,卫生部要求医学研究委员会组织专家在伦敦郊区召开会议,研究导致肺癌发病率异常增加的原因。[4]

可是这次会议最后演变成了一场荒唐的闹剧。一位专家夸夸其谈地指出,由于城镇(香烟消费最高)肺癌发病率要远比乡村(香烟消费量最低)高得多,因此“唯一合理的解释”就是“空气中的烟雾与污染”。[5]其他专家则归咎于流感、浓雾、缺乏阳光、X射线、柏油、普通感冒、煤火、工业污染、煤气厂以及汽车尾气。总而言之,除了香烟,任何通过呼吸形式传播的毒物都可以成为病因。

五花八门的意见令委员会十分困惑,于是他们委托奥斯汀·布拉德福德·希尔设计一项更为系统的研究方案来确定导致肺癌的危险因素。众所周知,希尔是一位著名的生物统计学家,他曾经在20世纪40年代提出随机试验方案。不过用于这项研究的经费少得可怜:1948年1月1日,委员会批准给一名学生支付的兼职工资是600英镑,给两名社工的报酬是每人350英镑,此外还有300英镑用于杂费与耗材。希尔聘请了36岁的医学研究员理查德·多尔加入自己的团队,但是后者之前从未参与过如此规模或重要的研究。[6]

※※※

与此同时,在大西洋彼岸的美国,似乎只有那些初出茅庐的新手(年轻的实习医生或未受过内外科培训的住院医师)才能敏锐地察觉到吸烟与癌症之间的联系。1948年夏季,正在纽约轮转外科的医学生欧内斯特·温德尔(Ernst Wynder)遇到了一例令人难忘的支气管肺癌患者(他年仅42岁就死于这种源自肺内呼吸道的肿瘤)。[7]患者曾经是一位吸烟者,当然就像大部分吸烟者的尸检结果一样,他的肺部也已经是伤痕累累:沾满焦油的细支气管与被烟雾熏黑的肺组织。其实给这位患者做手术的医生并没有察觉到有什么特殊之处(与大多数外科医生一样,他也没有注意到吸烟与肺癌之间的联系),但是对于之前从未见过此类病例的温德尔而言,这种油烟污染肺组织的癌症影像令人印象深刻,同时两者之间的联系仿佛已经不言而喻。

温德尔回到自己曾经求学的圣路易斯之后,便着手申请经费来研究吸烟与肺癌的关系。然而温德尔却被轻率地告知这种努力根本“毫无意义”。温德尔还曾经致信美国卫生总监,并且引述了之前研究(假设吸烟与肺癌存在关系)的结果,但是他得到的回复就是这些都证明不了什么。“你也可以从牛奶摄入量得出同样的相关性……不可能通过向患者提问获取满意的答案……既然无法证明吸烟与肺癌存在关系,那么就没有理由按照这种思路开展试验。”[8]

尽管温德尔没有能够说服卫生部的官员们,但是他在圣路易斯意外遇到了埃瓦茨·格雷厄姆(以“尼龙丝袜”之说而闻名)这位大咖。其实格雷厄姆也不相信吸烟与癌症之间存在什么关系。这位每周都要做数十台肺癌手术的著名肺外科医生本身就烟不离手。之所以格雷厄姆同意帮助温德尔开展研究,部分原因就是为了彻底推翻这种假设(吸烟与肺癌存在关系)并且平息此类纷争。除此之外,格雷厄姆还希望这项试验可以让温德尔领悟到研究的复杂性与微妙性,从而使他能够在未来设计出捕捉导致肺癌的真正危险因素的试验。

温德尔与格雷厄姆的试验方法非常简单。[9]研究者将首先询问肺癌患者与未罹患任何癌症的患者的吸烟史,然后通过两组患者中吸烟者与非吸烟者的比例来评估肺癌发生是否与吸烟呈正比。尽管这种设计(被称为“病例对照研究”)被视为某种方法学上的创新,但是该试验本身却在很大程度上被认为无足轻重。当温德尔在孟菲斯举办的肺生物学会议上提出其初步设想时,现场的听众居然没有提出任何问题或意见,大多数人要么在报告期间从头到尾打盹,要么就是对这个话题根本不感兴趣。相比之下,在温德尔之后登场的绵羊肺腺瘤病报告却引起了半个小时的热议。[10]

※※※

与温德尔和格雷厄姆在圣路易斯的境遇相同,多尔与希尔在伦敦进行的研究也无人问津。希尔供职的“统计部门”位于伦敦布鲁姆斯伯里街区的一座狭小砖房内。房间里有一台笨重的布伦斯维加(Brunsviga)计算器(据称是现代计算机的前身)在嘀嗒作响,并且它在每完成一次长除法之后都会发出钟表般的报时声。此外,这里还是来自欧洲、美国与澳大利亚的流行病学家召开统计学研讨会的场所。就在几步之遥的地方,我们可以看到伦敦热带医学院的镀金栏杆,上面的牌匾与铭文记录着19世纪流行病领域的重大发现(蚊子是传播疟疾的媒介或者白蛉是传播黑热病的元凶)。

但是许多流行病学家主张这种因果关系只见于传染性疾病(例如蚊子传播疟疾或舌蝇传播昏睡病),而它们通常都会有明确的病原体与传播媒介(病媒)。由于慢性非传染性疾病(例如癌症与糖尿病)非常复杂多变,因此无法使用单一病媒或病因进行解释,更不用说什么“可预防的”病因了。除此之外,认为慢性病(肺癌)自身具有“病媒”的观点(曾经被当成流行病学重大发现而受到膜拜)则完全是无稽之谈。

在这种紧张压抑的氛围下,希尔与多尔仍然全身心地投入工作。他们是一对与众不同的搭档,其中年轻的多尔理性、冷静、沉着,年长的希尔则活泼、热情、幽默,仿佛二人的性格特点天生互补。[11]众所周知,“二战”结束后英国的经济十分脆弱,国库当时已经濒临崩溃的边缘。当香烟价格上涨一个先令以增加额外的税收时,“烟草币”被发放给那些自称为“长期使用者”的人。[12]其实多尔本人就是一名“长期使用者”,他会在忙碌工作的间隙走到室外迅速点上一支烟。

起初,多尔与希尔的研究主要是为了进行某种方法学上的尝试。他们从伦敦及其周边的20家医院中挑选出肺癌患者(病例组)与其他疾病患者(对照组),然后由每家医院安排一名社工对这些患者进行访谈。即便多尔与希尔不相信烟草是导致肺癌的罪魁祸首,但是他们还是采用了广泛撒网的方式来探究其内在联系。调查问卷的内容包括:煤气厂与患者住所的距离,吃炸鱼的频率,以及他们晚餐时是否喜欢吃煎培根、香肠或火腿。当然,多尔还不失时机地在其中隐藏了一道有关吸烟习惯的问题。

截至1948年5月1日,他们总共回收了156份调查问卷[13]。当多尔与希尔对这些内容进行初步筛选之后,他们发现吸烟是唯一一种明确与肺癌具有统计学关联的危险因素。随着更多的调查问卷源源不断涌入,这种统计学关联也得到了进一步强化。就连曾经认为柏油暴露才是肺癌诱因的多尔也不再与自己的数据争辩。除此之外,他还在研究进行到一半时警觉地把烟戒了。

与此同时,圣路易斯的温德尔–格雷厄姆团队也得出了相似的结果。由于这两项研究(横跨两个大陆的两组人群)对于危险因素的判定高度一致,因此也进一步证明了吸烟与肺癌之间存在某种联系。于是多尔与希尔迅速将他们的研究结果整理成文后向学术期刊投稿。同年9月,这篇影响深远的论文《吸烟与肺癌》正式发表于《英国医学杂志》(British Medical Journal)。而就在数月之前,温德尔与格雷厄姆的研究结果已经刊登于《美国医学会杂志》(Journal of the American Medical Association)。

※※※

人们很可能认为多尔、希尔、温德尔与格雷厄姆轻而易举地证明了吸烟与肺癌之间的关系。然而实际上,他们的研究可能证明了某些完全不同的事情。为了理解这种至关重要的差别,让我们重温一下病例对照研究的方法。

众所周知,病例对照研究只有在事后才会对风险进行评估,例如多尔与温德尔在研究中询问肺癌患者是否吸烟。在某项经常被引用的统计学类比中,这种方法就像是询问交通事故的受害者是否酒后驾车一样(事故发生之后再了解情况)。当然根据该实验得出的数据肯定会告诉我们事故与酒精之间存在某种潜在关系,但是并不能让我们获悉饮酒者发生交通事故的实际概率,因此这种回顾性风险评估相当于通过后视镜来观察事物变化。然而只要上述过程发生任何一点改变,此类评估就会出现微小的偏倚。如果驾驶员高估(或低估)了事故发生时他们的醉酒程度呢?或者说如果(回到多尔与希尔的研究中)调查员无意识地强化了对肺癌患者吸烟习惯的问询,又忽略了探究对照组患者的相似习惯呢?

其实希尔知道有一种最简单的方法(正是他发明了这种方法)能够消除此类偏倚。如果能够随机将某个人群分为两组,其中一组被强制吸烟,而另一组被禁止吸烟,那么只要进行长期随访就可以发现吸烟组的肺癌发病率是否明显增高。虽然通过上述方法可以证明吸烟与肺癌的因果关系,但是这种残忍的人体试验简直令人发指,无法满足基本的医学伦理原则。

但是如果承认这种试验根本无法实现,那么人们愿意退而求其次(接受不够理想的试验设计)吗?抛开随机分配的原则不谈,彼时多尔与希尔研究的问题还在于他们采用的回顾性风险评估。然而如果能在受试者罹患癌症之前就开展研究呢?流行病学家能否像胚胎学家观察鸡蛋的孵化过程一样从源头开始观察疾病(例如肺癌)的发生过程呢?

※※※

20世纪40年代早期,特立独行的牛津大学遗传学家埃德蒙·福特(Edmund Ford)也产生了类似的想法。[14]尽管福特是达尔文进化论的忠实信徒,但是他深知达尔文理论存在某种严重的局限性:迄今为止,进化过程均是由化石记录间接推演而来的,它们从未在生物种群中得到过直接论证。化石的问题在于它们已经不可能随时间发生改变(一成不变)。例如三种化石A、B、C的存在代表了三种先后顺序不同的进化阶段,此类结果也许会提示化石A产生了化石B,随后化石B又产生了化石C。然而这些间接证据只是回顾性研究的结果;尽管上述三种化石表明存在三个进化阶段,但是无法证明化石之间顺序相生的关系。

如果想要证明生物种群随时间推移发生了特定的遗传改变,那么唯一正确的方法就是在真实世界中实时(前瞻性)捕获此类变化。因此福特开始致力于采用此类前瞻性实验来了解达尔文进化论的过程。为了实现这个目标,他说服几位学生穿过牛津附近的沼泽地去采集飞蛾。每捕获一只飞蛾,他们就用记号笔进行标记并放归自然。福特的学生们就这样年复一年地穿着雨鞋、带着捕蛾网来回奔走,然后通过再捕获对之前标记过的飞蛾以及未标记过的后代进行研究,这种方法简直就是对在野外生存的飞蛾进行普查。与此同时,上述飞蛾种群每年发生的细微变化均被小心翼翼地记录在案,例如翅纹、大小、体型以及颜色的改变。经过将近10年的统计,福特开始着手观察这些飞蛾的进化轨迹。他已经记录下飞蛾体色(这反映出基因发生了改变)的渐变规律、种群的巨大波动以及飞蛾天敌造成的自然选择迹象(这些构成了沼泽地里的世界)。[15]

多尔与希尔都非常关注此项研究的进展。1951年冬季,希尔突然想到可以在人群中开展类似的研究。据说,就像许多伟大的科学概念一样,他也是在洗澡时获得的灵感。[16]按照福特的理论,假设我们可以使用神奇的记号笔对于某个大型人群(由某些自然产生的吸烟者与非吸烟者组合而成)每隔10年进行重复标记。如果香烟确实含有导致肺癌的物质(就像亮翅蛾更容易被天敌捕食),那么吸烟者罹患肺癌的概率就会更高。其实只要对以上人群进行长期随访,紧盯人类病理世界的天然沼泽,流行病学家就可以精确计算出吸烟者与非吸烟者罹患肺癌的相对风险。

但是怎样才能找到数量足够大的队列呢?此时命运之神再次眷顾了他们。由于英国政府准备将医疗服务体系国有化,因此共有6万多名医生实现了集中注册。只要某位注册医生去世,那么就会有人将相对详细的死因告知系统管理员。按照多尔的搭档兼学生理查德·皮托的说法,上述结果实际上为队列研究创建了一个“理想的实验室”。1951年10月31日,多尔与希尔给大约59600名医生邮寄了包括调查问卷在内的信件。当然这些问题也被刻意简化:受访者仅被问及他们的吸烟习惯与估计吸烟量,别无其他。大多数医生都可以在5分钟之内完成问卷。

研究显示,他们共收到了41024名医生的回信,这一数字在当时的确令人非常震惊。多尔与希尔在伦敦为这个医生队列创建了一份总名单,然后将他们分为吸烟者与非吸烟者。每当这个人群中有死亡病例上报,那么他们就会联系注册办公室了解确切的死因,并且对其中的肺癌死亡病例按照吸烟者与非吸烟者列表统计。现在,多尔与希尔终于可以坐下来观察癌症的实时发展过程了。

1951年10月至1954年3月的29个月里,多尔与希尔的原始队列中共上报了789例死亡病例,其中有36例患者死于肺癌。当对这些肺癌死亡病例按照吸烟者与非吸烟者进行统计时,肺癌与吸烟之间的关系跃然纸上:所有36例死于肺癌的患者生前均吸烟。由于两组(吸烟者与非吸烟者)人群之间的差异非常悬殊,因此多尔与希尔无须采用复杂的统计学方法就可以明辨是非。原本设计此项试验是为了通过最严格的统计学分析来探究肺癌的病因,但是最终连初等数学都没有用上就实现了目标。[17]

[1] Whether epidemiology alone can: Sir Richard Doll, “Proof of Causality: Deduction from Epidemiological Observation,” Perspectives in Biology and Medicine 45 (2002): 499–515.

[2] lung cancer morbidity had risen nearly fifteenfold: Richard Doll and A. Bradford Hill, “Smoking and Carcinoma of the Lung,” British Medical Journal 2, no. 4682 (1950): 739–48.

[3] “matter that ought to be studied”: Richard Peto, “Smoking and Death: The Past 40 Years and the Next 40,” British Medical Journal 309 (1994): 937–39.

[4] In February 1947, in the midst of a bitterly cold: Ibid.

[5] One expert, having noted parenthetically: British Public Records Office, file FD. 1, 1989, as quoted by David Pollock, Denial and Delay (Washington, DC: Action on Smoking and Health, 1989); full text available through Action on Smoking and Health, www.ash.org.

[6] Yet the resources committed for the study: Medical Research Council 1947/366 and Ibid.

[7] In the summer of 1948: Pollock, Denial and Delay, prologue. Also see Sir Richard Doll, “The First Report on Smoking and Lung Cancer,” in Ashes to Ashes: The History of Smoking and Health, Stephen Lock, Lois A. Reynolds, and E. M. Tansey, eds. (Amsterdam: Editions Rodopi B.V., 1998), 129–37.

[8] “The same correlation could be drawn to the intake of milk”: Ernst L. Wynder, letter to Evarts A. Graham, June 20, 1950, Evarts Graham papers.

[9] Wynder and Graham’s trial: Ernst L. Wynder and Evarts A. Graham, “Tobacco Smoking as a Possible Etiologic Factor in Bronchiogenic Carcinoma: A Study of Six Hundred and Eighty-Four Proved Cases,” Journal of the American Medical Association143 (1950): 329–38.

[10] When Wynder presented his preliminary ideas: Ernst L. Wynder, “Tobacco as a Cause of Lung Cancer: Some Reflections,” American Journal of Epidemiology 146 (1997), 687–94. Also see Jon Harkness, “The U.S. Public Health Service and Smoking in the 1950s: The Tale of Two More Statements,” Journal of the History of Medicine and Allied Sciences 62, no. 2 (2007): 171–212.

[11] Doll and Hill’s study: Doll and Hill, “Smoking and Carcinoma of the Lung.”

[12] When the price of cigarettes was increased: Richard Peto, personal interview. Also see Virginia Berridge, Marketing Health: Smoking and the Discourse of Public Health in Britain (Oxford: Oxford University Press, 2007), 45.

[13] By May 1, 1948, 156 interviews: David Pollock, “Denial and Delay,” collections from the public record office files deposited in the Action on Smoking and Health archives, UK. Also see the Action on Smoking and Health Tobacco Chronology, http://www.ash.org.uk/ash_669pax88_archive.htm (accessed January 21, 2010).

[14] In the early 1940s, a similar notion had gripped: R. A. Fisher and E. B. Ford, “The Spread of a Gene in Natural Conditions in a Colony of the Moth Panaxia diminula L.,” Heredity 1 (1947): 143–74.

[15] 福特的学生亨利·B.D.凯特尔韦尔(Henry B.D.Kettlewell)曾经采用这种飞蛾标记法证明黑色飞蛾(能够较好地隐藏于被污染、熏黑的树木上)可以躲避飞禽的捕食,从而展现出“自然选择”所发挥的作用。——作者注

[16] And the notion of using a similar cohort: Stephen Lock, Lois A. Reynolds, and E. M. Tansey, eds., Ashes to Ashes (Amsterdam: Editions Rodopi B.V., 1998), 137.

[17] Doll and Hill’s study of smoking habits and lung cancer in doctors: Richard Doll and A. Bradford Hill, “The Mortality of Doctors in Relation to Their Smoking Habits: A Preliminary Report,” British Medical Journal 1, no. 4877 (1954): 1451–55.