第四十章 突变假说
穿越世间喧嚣的淡淡微风
就像插入的精致楔形刻刀……[1]
——D.H.劳伦斯(D.H.Lawrence)
1976年夏季,逆转录病毒的研究进展令癌症生物学领域发生了巨变,而基因的作用也再次成为人们竞相追逐的焦点。哈罗德·瓦默斯与迈克尔·毕晓普的原癌基因理论为癌症发生提供了首个无可辩驳的学说。该理论解释了辐射、煤烟与烟草烟雾等各种看似无关的损害,通过突变与激活细胞内的癌基因前体导致癌变的机理。该理论阐明了布鲁斯·埃姆斯提出的致癌物与诱变剂间的特殊联系:化学物质之所以能够诱导DNA突变致癌,是因为它们可以改变细胞的原癌基因。除此之外,该理论还澄清了吸烟者与非吸烟者可能出现相同癌症的机制(尽管发病率不同):虽然吸烟者与非吸烟者的细胞中都存在相同的原癌基因,但是烟草中的致癌物增加了这些基因的突变率,从而导致吸烟者的癌症发病率比非吸烟者更高。
然而人类癌基因到底长什么样?尽管肿瘤病毒学家已经先后在病毒与细胞中找到了src基因,但是人类细胞基因组中肯定还分布着其他内源性原癌基因。
其实遗传学可以通过两种完全不同的方式来“观察”基因。第一种方式是从结构上:基因可以被视为某种沿着染色体排列的DNA片段(物理结构),而这就是摩尔根与弗莱明早年理解的那样。第二种方式是从功能上:根据孟德尔理论,基因可以被想象为某种代际传递的遗传性状。在1970年至1980年的10年间,癌症遗传学就是通过这两种方式来“观察”癌基因的。当然每种独特的视角都能够加深人们对于癌症发生机制的理解,从而使该领域越来越接近人类癌症核心分子畸变的真相。
不过破解这个问题还需要先从其结构进行剖析。1973年,就在瓦默斯与毕晓普启动对src基因的早期研究时,芝加哥血液病学家珍妮特·罗利(Janet Rowley)已经观察到了人类癌症基因的物理形态。罗利的工作是通过分析细胞内染色体的染色模式来定位癌细胞中的染色体畸变。[2]尽管她在染色体染色技术(兼具科学性与艺术性)上达到了炉火纯青的地步,但这毕竟只是一种过时的研究方法(就像在数码印刷时代描绘蛋彩画一样)。当癌症遗传学聚焦在RNA、肿瘤病毒与致癌基因领域时,罗利却致力于让该学科重新回到波弗利与弗莱明发现的蓝色染色体上。然而更为匪夷所思的是,她选择研究的对象居然是慢性粒细胞白血病(CML),也就是贝内特笔下曾经声名狼藉的“血液化脓”。
其实罗利对于CML的研究建立在此前费城两位病理学家的工作基础上。20世纪50年代末期,皮特·诺威尔(Peter Nowell)与戴维·亨格福德(David Hungerford)已经在CML中发现了一种特殊的染色体类型:癌细胞总是携带有一条缩短的染色体。[3]众所周知,正常人类细胞中含有的46条(23对)配对染色体分别来自父母。诺威尔在CML细胞中发现了第22号染色体某条拷贝的头部出现缺失,于是他根据发现地将这种染色体畸变命名为“费城染色体”。但是诺威尔与亨格福德并不知道造成染色体缺失的原因以及缺失片段的去向。
根据既往研究的成果,她开始在CML细胞中寻觅第22号染色体缺失片段的踪迹。当罗利把精心染色的CML染色体照片放大数千倍后(她习惯于将这些照片铺在餐桌上,然后埋头寻找臭名昭著的费城染色体缺失片段),她很快就从中发现了一种特殊的模式。在22号染色体缺失的头部结合到9号染色体尾部的同时,9号染色体的某个片段也反过来结合到了22号染色体上。学术界将这种遗传事件称为“易位”,也就是两条染色体片段的位置发生了改变。
罗利此后逐个检查了许多CML患者的染色体,并且发现他们的染色体都有相同的易位。冯·汉瑟曼与波弗利的发现使人们知道了癌细胞中存在染色体畸变,但是罗利的研究结果却提出了更为深刻的观点。癌症中的染色体异常并非杂乱无序,这些染色体异常完全有章可循:它们在某种类型的癌症中可能会存在相同的特异突变。
染色体易位可以使原本位于两个不同染色体上的基因融合在一起,产生名为“嵌合体”的新型基因。例如,9号染色体的头部与13号染色体某个基因的尾部相互融合。虽然罗利认为CML患者的染色体易位也会生成此类嵌合体,但是她并不了解这种新型嵌合体怪胎的特征与功能。不过罗利已经证实,某种与众不同的基因突变(后来人们发现这是一种癌基因)可能就存在于人类癌细胞中,而她则是完全凭借染色体结构异常找到了CML的致病元凶。
※※※
20世纪70年代早期,曾经于加州理工学院受训的遗传学家阿尔弗雷德·克努森(Alfred Knudson)在休斯敦也“观察”到了人类致癌基因(尽管来自另外一种截然不同的视角)。
尽管罗利通过研究癌细胞染色体的物理结构发现了致癌基因,但是克努森依然专注于基因功能的研究。由于基因是遗传物质的基本单位,因此它们能够确保性状代代相传。克努森认为,如果基因能够诱发癌症,那么他就有可能破解癌症的遗传模式,而这与孟德尔研究豌豆花色与植株高矮发现基因概念的方法如出一辙。
1969年,克努森来到了位于得克萨斯州的安德森癌症中心,而弗赖雷克一手打造的儿童癌症临床中心方兴未艾。[4]当时克努森迫切需要一种可供研究的“模式”癌症,他想通过遗传性恶性肿瘤的潜在遗传模式揭示癌基因的作用机制。由于视网膜母细胞瘤在同一家族中具有惊人的遗传倾向,因此这种由德·戈维亚在巴西发现的罕见眼癌亚型自然就成了研究对象。
视网膜母细胞瘤是一种结局非常悲惨的癌症,这种好发于儿童的肿瘤会侵犯童年时期最重要的器官:肿瘤就生长在眼内。研究显示,患儿有时只有在出现视物不清后才得以确诊。但是也有个别患儿的肿瘤在照相时被意外发现(眼睛被闪光灯照亮时会像猫眼一样诡异地闪烁,从而暴露出隐藏在晶状体之后的肿瘤)。如果不及时治疗,那么肿瘤会沿着眼眶后部的视神经侵入大脑。治疗方法主要是采用大剂量伽马射线烧灼肿瘤,或是通过外科手术摘除眼球(只留下空荡荡的眼窝)。
视网膜母细胞瘤具有两种不同的亚型,分别为与遗传有关的家族型与散发型。众所周知,德·戈维亚已经发现了家族型视网膜母细胞瘤。罹患家族型或遗传型肿瘤的儿童可能具有明显的家族史(父亲、母亲、表亲、兄弟姐妹以及其他亲属均会发病),这些患者往往还是双眼受累(就像德·戈维亚在里约报道的那个病例一样)。当然该肿瘤也可以出现在没有家族史的患儿中。例如,罹患散发型肿瘤的儿童不仅没有家族史,而且通常只会有一只眼睛受累。
这种遗传模式引起了克努森的兴趣。他想知道通过数学分析能否辨别出散发型与家族型肿瘤进展过程中的细微差异。于是克努森采用了最简单的方法:他先是将散发型患儿与家族型患儿分成两组。然后通过查阅既往病历资料,克努森把两组患儿的发病年龄绘制成表格与曲线。有意思的是,他发现上述两组患儿的进展“速度”存在差异。家族型视网膜母细胞瘤患儿起病迅速,通常在出生后2~6个月就可以得到诊断。散发型视网膜母细胞瘤往往在患儿出生2~4年后才会出现。
但是为什么相同疾病的进展速度会在不同患儿中存在差异呢?克努森根据物理学与概率论的数学公式与简易方程为两组患儿建立了癌症进展模型。他发现这些数据符合一种简单的模式。家族型视网膜母细胞瘤患儿仅需要单个基因突变即可发病,散发型视网膜母细胞瘤患儿则涉及两个基因突变。
不过这又带来了另外一个令人费解的问题:为什么单个基因突变可以导致家族型患儿发病,而散发型患儿却需要两个基因突变才能发病呢?经过反复思考,克努森终于找到了一个言简意赅的解释。他回忆道:“数字2是遗传学家最喜欢的符号。”[5]由于每个正常人体细胞的染色体与基因都有两份拷贝,因此每个正常细胞都应该具备两份正常视网膜母细胞瘤基因(Rb基因)拷贝。克努森推测,散发型视网膜母细胞瘤患儿只有在两份基因均突变失活的情况下才会发病。之所以散发型视网膜母细胞瘤患儿的发病年龄延迟,是因为同一个细胞中的Rb基因需要累积两个独立的突变。
相比之下,家族型视网膜母细胞瘤患儿先天就携带一份缺陷Rb基因拷贝。由于这些患儿的细胞里已经存在一份缺陷Rb基因拷贝,因此只需要单个额外突变即可让细胞发生变化并开始分裂。综上所述,这些患儿不仅更容易发病,而且进展也更为迅速,并且最终形成了克努森在统计图表中看到的差异(进展“速度”)。于是克努森将该理论称为癌症的二次突变假说。对某些癌基因来说,它们需要经受两次突变“打击”才能刺激细胞分裂并导致癌变发生。
尽管克努森的二次突变假说是对视网膜母细胞瘤遗传方式的力证,但是它乍看起来似乎并不符合既往癌症研究的分子生物学规律。[6]回想一下,src基因只需要一份激活拷贝就可以让细胞分裂失去控制,而克努森发现的Rb基因需要两份拷贝。为什么src基因发生单一突变就足以刺激细胞分裂,可是Rb基因突变却需要两份拷贝呢?
其实答案就在于这两种基因的功能差异。研究显示,src基因在细胞分裂过程中会激活一种功能。就像雷·埃里克森与花房秀三郎所发现的那样,src基因突变后将合成某种无法遏制其功能的细胞蛋白,这种肆无忌惮且极度活跃的激酶会在超速运转中持续刺激细胞分裂。与此同时,克努森发现的Rb基因却执行着相反的功能。虽然Rb基因可以抑制细胞增殖,但是它在失活(通过二次突变打击)后能够启动细胞分裂。因此克努森将功能相反的Rb称为抑癌基因。
他写道:“这两类基因显然在儿童癌症发病中起着至关重要的作用。其中癌基因凭借活性异常或增强来发挥作用……抑癌基因(或肿瘤抑制基因)在肿瘤发生中处于隐性状态;并且仅在两份正常基因拷贝都缺失的情况下才会导致癌症发生。由于某些人的生殖细胞中已经携带此类突变,因此体细胞只需发生一次突变就很容易罹患肿瘤。除此之外,尽管某些儿童的生殖细胞中没有携带此类突变,但是也会在两次体细胞突变的作用下罹患肿瘤。”[7]
综上所述,这种与众不同的假说完全源自统计学推理。克努森根本不知道想象中抑癌基因的分子身份。他既没有在癌细胞中“观察”到这些基因,也从未通过生物学实验发现过Rb。与孟德尔一样,克努森只是在统计学意义上了解这些基因。正如他说的那样,自己可以感觉到它们的存在,“就像人们可以根据摇曳的树枝来判断风的到来”。
※※※
到了20世纪70年代末期,瓦默斯、毕晓普与克努森开始将癌基因和抑癌基因的作用结合起来描述癌细胞的核心分子畸变。克努森认为,癌症基因可以分为两类。第一类是“正向”基因。例如src基因,它是正常细胞基因的激活型突变体。在正常细胞中,这些基因只有在收到适当的生长信号时才会促进细胞分裂。可是一旦发生突变,它们就会呈持续过度激活状态并导致细胞分裂失控。按照毕晓普说法,激活的原癌基因就像是汽车油门卡滞。由于携带这种基因的细胞无法停止有丝分裂,因此细胞会进入永久持续分裂状态。
第二类是“负向”基因,例如Rb基因,它可以抑制细胞分裂。在正常细胞中,这些抑癌基因或肿瘤抑制基因可以为细胞增殖提供“刹车”,细胞只要收到适当的信号就会停止细胞分裂。在癌细胞中,这些“刹车”在突变之后已经失活。按照毕晓普的说法,由于在“刹车”缺失的细胞里找不到有丝分裂的“停车”信号,因此细胞会无视所有“停车”信号的阻拦义无反顾地分裂下去。
其实原癌基因激活与抑癌基因失活(“油门卡滞”与“刹车失灵”[8])这两种异常状态均代表了癌细胞中核心分子的缺陷。虽然瓦默斯、毕晓普与克努森并不知晓究竟需要多少此类缺陷才会最终导致癌变,但是他们认为这些因素共同作用就会导致癌症发生。
[1] The fine, fine wind: D. H. Lawrence, “The Song of a Man Who Has Come Through,” Penguin Book of First World War Poetry, ed. John Silkin (New York: Penguin Classics, 1996), 213.
[2] Rowley’s specialty was studying: Janet Rowley, “Chromosomes in Leukemia and Lymphoma,” Seminars in Hematology 15, no. 3 (1978): 301–19.
[3] In the late 1950s, Peter Nowell: P. C. Nowell and D. Hungerford, Science 142 (1960): 1497.
[4] In 1969, Knudson moved: Al Knudson, interview with author, July 2009.
[5] “The number two,” he recalled: Ibid.
[6] Knudson’s two-hit theory: A. Knudson, “Mutation and Cancer: Statistical Study of Retinoblastoma,” Proceedings of the National Academy of Sciences of the United States of America 68, no. 4 (1971): 820–23.
[7] “Two classes of genes are apparently critical”: A. Knudson, “The Genetics of Childhood Cancer,” Bulletin du Cancer 75, no. 1 (1988): 135–38.
[8] “jammed accelerators” and “missing brakes”: J. Michael Bishop, in Howard M. Temin et al., The DNA Provirus: Howard Temin’s Scientific Legacy (Washington, DC: ASM Press, 1995), 89.