第14章 第一份人类基因组
一般来说,一想到被抢先报道的前景,第一反应就是既绝望又希望,希望你的对手“某人”死去。你可能会考虑要放弃,但是这可能会让你没有任何明确的东西显示这几年的辛劳结果……所以很难不考虑重新尝试用你的对手相同的方法去和他竞争。虽然你现在落后,但是只要稍微比他聪明点你就可能赶上他。然后你的对手可能会彻底气疯了。
——詹姆斯·沃森,《倾情DNA:基因、基因组和社会》
在我们开始测序首例人类基因组很久以前,甚至在确信我们将能够做这件事很久之前,我们就开玩笑地猜测谁的DNA将特别荣幸能从头到尾被第一个阅读。谁将拥有科学好奇心、自信心和安全平静的头脑愿意测序他或她的基因组?尤其当大多数人被遗传决定论者们吓唬得认为这将揭露他们所有的生物秘密时,谁将有足够的理解力理解遗传和环境之间深奥的相互作用从而愿意看到自己个人的遗传程序发表在网上?
技术问题同样也包括在内,很多问题归纳一下就是,比起微生物使用的初级的无性生殖,性是怎样引入人类更多的遗传多样性的?当谈到测序细菌基因组,我们选择了参照复制品——所有这些都是相同的,正如称呼所表明的——将提供一套同种DNA样本。因为我们使用高度纯系株的果蝇基因组确保我们拥有的DNA尽可能排除变异。但是当谈到人类基因组时,就有许多遗传变异,像地球上的人们一样多。
因为人类DNA的结构是双螺旋状,有两条互补链,我们测序哪条DNA链无关紧要。但是这里存在一个人类复杂化的问题。人类23条染色体中的每一条都是成对存在的:23条来自我们的母亲,包括X染色体,23条来自父亲,或者包括一条X染色体代表女儿,或者包括一条Y染色体代表儿子(因此女性有两条X染色体,而男性有一条X,一条Y)。
首先一个问题是,测序对象该选择男性还是女性。男性有个优点,他既有X染色体也有Y染色体,但是缺点是X和Y染色体只有一半的DNA,而其他22对染色体却拥有所有的DNA;如果我们选择一位女性,那么将有两个X染色体而没有Y染色体。如果我们只研究一个人,我们应该选择一个普通人作为实验对象还是总统克林顿呢?那个人的责任和风险是什么?这个人会同意吗?
早些时候,清楚的是,当技术准备甫定,要测定人类基因组变异的程度,将毫不怀疑地要付出巨大的努力,选择谁做样本真的不是那么重要。无论如何,如果可以在遗传测试中找到与疾病有关的序列差异的科学利益和商业利益,那么对我们来说获得尽可能多的遗传多样性是有意义的。这就意味着我们应尽可能从几个人那里测序公共DNA,并且创建一套一致的基因组序列,这个序列不代表任何个体,而是人类总体的融合,一份参照基因组。
吉恩·梅尔斯和他的小组做了几个计算,看在这个公共DNA序列中,我们可以使用多少实验对象而不致引进太多的变异,以至于它将危及我们使用现有的算法和计算机拼接参照基因组的能力。如果我们允许实际覆盖一个人的基因组来帮助组装的话,那么5个或者6个人就是极限了。我们决定我们将尽力从男女双方得到一份混合的DNA,并且包括一些种族多样性。
在TIGR,塞雷拉成立之前,海姆·史密斯就发愁怎样创立最好的人类基因序列文库,这并不只是因为他没有足够研究人类DNA的经验。海姆和我有过几次讨论,讨论怎样取得人类DNA,包括获得商业来源。但是为了生成文库,而且为了完全确定我们知道它们里面包含什么,海姆必须从头开始。
人类取样也意味着漫长的事先知情同意程序,这甚至将阻止我们在6个月建造塞雷拉的期间开始进程。由于海姆和我渴望前进,下一步很明显:当开始寻找人类DNA捐献者时,我们感到地球上再也没有比我们更知情的人了——我们对于测试他们的基因组并公布出来的可能的风险有深刻的理解。海姆和我都不认同过分简单的基因决定论概念——认为我们仅是我们的基因所创造的“我们”,而且我们生活的轨道能从我们的遗传密码精确地预测到。同时我们都拥有一个对我们自己的基因组本能的好奇心。在我们心中,从来都不认为我们会承担任何医学风险,除了可能对我们的心理的影响:我们可以预料来自我们的诽谤者们的政治攻击,如果他们知道了我们采用了我们自己的DNA。
一旦我们同意使用这个方案,我们每个人都决定我们要为文库提供一个丰富而容易产生的DNA来源:以精液的形式(我们不久就开玩笑说谁将需要较大的试管)。最后我们确定使用标准50毫升的无菌试管并且冷冻其中的精液。虽然海姆能轻易地把他的样本直接带入实验室而不让他的技术员知道试管的来龙去脉,但是我们仍然认为如果我带着冷冻的试管溜进实验室并移交给他们,还是有些不宜。借助联邦快递装有冷冻试剂的盒子几乎每天从应用生物系统公司送到TIGR,于是我拿一个装有干冰的已打开的联邦快递盒子,装入我的样本,然后把它交给实验室,这样实验室大多数人以为样本来自于迈克·亨克皮勒或者托尼·怀特。这种诡计必须重复好几次因为最初的实验要消耗大量DNA。
一旦塞雷拉崛起并开始运转,额外DNA测序的问题就变得和我们当初害怕的一样复杂了。律师们介入其中,什么应该做,什么可以做,他们提供互相矛盾的意见。为了监视样本的整个测试过程,我拜访了国家癌症研究所前任主任萨姆·博德,他现在是塞雷拉的首席医学官员,他建立了一个由外来专家组成的一流委员会。开始时,我通知萨姆我们已经有了两个DNA样本,这些样本已经被海姆转变成了TIGR的文库,并且它们被用来做所有最初的测序以此启动塞雷拉程序。我向萨姆透露海姆和我都是捐献者,并解释说其他人应该包括女性和保持尽可能多的人种和地域多样性。我让萨姆决定他是否应该通知委员会,我们已经进入对两个人类捐献者的序列的解读工程;他认为最好不要通知,不过还是制定了一个与海姆和我曾做的不冲突的程序。
眼睛显示了它
阅读任何大众化的遗传学叙述,你会经常看见这些文字:DNA决定一切,从感情到疾病到智商(不论那是什么)到眼睛颜色。在教室里,全世界的孩子们都被告知,褐色眼睛是显性的——也就是说,父母之一方,如果遗传给你一个对应具有显性特征的基因,你将也会拥有这个特征。由此,如果一个父亲有褐色的眼睛,那么他的孩子可能也有,而双亲都是蓝色眼睛的话,几乎总是会有蓝色眼睛的孩子。
让我们假设你还没有遇见我或是没研究过这本书的外封套,你已经决定通过研究我的遗传密码来找到我的眼睛颜色——就像租用玛丽二世女王豪华游轮穿过哈德逊河一样[28]。我的密码的其中一卷,15号染色体,是一个好的开始之处。在那里你会发现一个叫作OAC2的基因,它是褐色眼睛和蓝色眼睛主要的决定因素。基因在专门的黑色素细胞中活动,后者产生黑色的色素,负责眼睛的颜色。我眼睛颜色的生理基础像任何其他人一样,被黑色素细胞的分布和内容所支配,尽管过程比通常认为的要复杂得多[1]。
根据一项600多人的正常有色人种的研究表明,眼睛的颜色不太可能是基于蓝色或灰色这种特殊基因的精确遗传拼写。(在一个变体中,非蓝/灰色为字母A/T或T/T,在另一个变体中,为字母A/G或G/G,或者是两个变体的结合)。根据这些数据,我的基因组显示,我更有可能有蓝色或灰色眼睛,而不是拥有科学家们所称的“非蓝/灰色”变体,我有两个变体——一个是C/C和A/A,第二个是G/G和A/A,而且我确实是蓝眼睛。然而我的基因组告诉我一个直截了当的结论,眼睛颜色实际上是依赖于几个基因的,尽管不是很常见,但是两个蓝眼睛的父母是可以生出褐色眼睛的孩子的。并且,尽管蓝色和褐色眼睛在高加索人中是显性的,我们也有灰色/绿色/淡褐色和间于它们之间的色度。简单和过分简单化的教科书对于眼睛颜色的遗传学描述没有做出符合自然的公正评判。
委员会表达了两点主要顾虑。第一,如果那个捐献了他们的DNA的人被识别出来的话,而且如果他们基因组中的任何疾病基因被识别出来,他们就要冒可能失去他们的死亡保险和/或者人寿保险的风险。类似的,如果他们有与各种不良社会特性或病态人格有关的突变,那么一旦他们的身份随着他们的遗传密码显示出来,它就能引发这些对应的问题。我们最终确立的政策是,由于责任和保护我们的捐献者的需要,塞雷拉将不再公开他们的身份。然而,如果捐献者们希望的话,委员会承认他们自己有权决定是否公开他们是捐献者。
第二点顾虑是关于测序不同种族背景的基因组。我就“种族问题”只与委员会会面了一次,因为真正的担心是数据可能被一些人用来替种族主义辩护。对我而言,测序5个白人男性的基因组来代表人类根本就是错误的。尤其是在遗传层面上,我们看起来都是相同的。当委员会听说这些争论时,很快就差异性达成一致。我们想征集大约20个可能的捐献者并就此在《华盛顿邮报》上、塞雷拉公司以及应用生物系统公司周围做了相应广告,那么至少有两个记者提供了他们的DNA就不足为奇了,其中一个还写了一篇有关塞雷拉捐献DNA过程的文章[2]。
包括海姆和我在内的每个捐献者都要求听一节关于承担风险和事先知情程序的课,并且签订必需的协议。当博德提供给我们一份他与顾问委员会一同起草的同意文件时,我开玩笑说我们不想从任何有能力把30页的复杂法律文件通读下来仍然有能力射精的人那里得到DNA,因为他必须是一个律师。
每个捐献者会因为他或她的样本得到100美元的报酬,对于女性来说,样本是血液,从胳膊上抽取,男人既要提供精液还得提供血液(尽管有几个拒绝提供精液)。(当这个过程被描述给一位知名的公众人物时,她讥讽道,“这场景真是无懈可击:男人获得高潮可以得到报酬,女人却要被一根针刺一下。”)我们对获得的每一份样本,分配给它的捐献者一个代号,只有博德有密码。
我们试图为每一个捐献者培养细胞株并产生序列文库,接着进行测试序列。那5个最后人选由我的高级职员来选择,其中包括博德,以匿名的信息为基础,其中包括代码、性别和自认的种族以及既能提供永久细胞株又能提供好的序列数据的高质量的文库:这些人是海姆、我,以及三名自称的非洲裔美国人、中国人和女性西班牙人。我仍然不知道任何女性的身份。尽管几名捐献者,包括记者在内,后来公开了他们的身份,但是不重新测序他们的另一份样本,就没办法在他们和测序的DNA之间建立连接。我们最终发表的序列是五个捐献者的合成物,我们的基因组序列甚至可以组装成一个合成物的事实证明了地球上的人类在DNA层面上的相似性。
在使用谁的基因组做测序这一点上,政府计划甚至面临着更大的麻烦。科林斯和他的同事们吹嘘他们已经混合了15~20个个体的DNA,这样最终的基因组序列将来自数个匿名者。数年后,众多的DNA BAC文库已经从博士后、实验室捐献者等人捐献的样本中产生了,但是这些捐赠者当时都没有考虑过一些棘手的问题,比如伦理问题和知情同意问题。如果一个或更多的捐献者自我识别并拒绝自己的基因密码被公众使用的话,所有的文库就都要被摈弃,这使得公共计划随时面临挫折和风险。然后几乎所有的公共基因组最终都仅来自一个或两个捐献者(这样有利于长时间地保守秘密)。
果蝇基因组最后的片段被测序后,我就把塞雷拉的设备转移到对人类基因组发动全面攻击的战役上了。当时——1999年9月8日的早上——我们的技术小组和ABI员工的所有的努力已将测序机的故障率,从曾经高达90%降至10%。这就意味着我们仍然有至少30台价值30万美元的测序机每天都需要修理,但是即使是故障率如此之高,我们还有足够的能力在300台能运转的机器上用不到一年的时间测序人类基因组。
但是那时,我们还有压力:公共计划宣布它已经测序了大约1/4的基因组。在另一次重大修订策略后,我的对手们宣布他们将只制作基因组的一个粗略版本并且到第二年春天完成这个“第一草图”,毫无疑问会伴随有一个媒体狂欢活动了。我们在塞雷拉所做的和已改变的公共计划所做的重要差异可归结为标准和策略:全基因组霰弹式技术对比于传统的分级测序法。我知道我们已经有了获胜的策略,政府投资的实验室即使用相同的或甚至更大的测序能力,也不能和我们竞争,除非他们放弃他们的标准,改变他们的计划而采用我们的。
在开始我们的工作的前一年,1998年9月,公共计划的线路图已经改变:他们要在2003年前即在塞雷拉能够完成工作前做一个基因组草图,2003年是沃森联合发现双螺旋第50周年纪念。取代在10年间发表高质量数据的原始计划,他们现在正努力尽可能快地把未分析的序列倾倒进公共数据库中。我的自称的竞争对手——幸存下来的5个基因组中心,他们给自己起了一个绰号G5(这个团队是以G18开始的)——相信自己通过这样做,他们会阻挡我对基因组申请专利,而且他们也会为首批完成人类基因组而获得荣誉。我为他们思想的愚蠢和不成熟感到困惑。当我的许多批评者们正着迷于塞雷拉数据的发表时,公共投资的实验室正不在意地把序列倾注到公共数据库中,制药公司正快乐地每夜下载这些序列,所以他们能在它们上面申请专利。因此,反对人类基因组申请专利的人们制定的这个天真的政策肯定起了相反作用:基因专利申请得又早又快,几乎所有的专利都是基于政府数据,而不是塞雷拉的。
多亏了在公共关系方面的文过饰非的精彩工作,降低公共计划的标准并没有遭遇过许多批评和分析。似乎没有人充分意识到公共计划通过改变它的目标,即将有效地高精确地完成一个染色体一个染色体的努力的目标,改变为测序人类基因组的一幅又快又脏的“粗略草图”,有关“质量第一”的最初真言就到此为止了;认为基因组草图将削弱正确地完成工作的动机的担忧也到此为止了。这使得我们在塞雷拉所承担的工作呈现出彻底性和综合性。
关于塞雷拉的核心仪器3700型的测序仪的负面报道很多,斯图尔特的小组曾在《科学》杂志上发表了一篇对该仪器的评论[3],声称它作为较短的序列片段的专用仪器——“阅读”——它没有提供什么优势(“在资金投资方面,没有马上增加生产力”)。这篇评论引发了ABI和塞雷拉公司股票价格的下跌。具有讽刺意味的是,我决定使用3700型测序仪后,对仪器的评价判断基本上被政府资助的小组忽视了,他们在购买这些昂贵的设备之前,没有做通常要求他们做的令人讨厌的评估和分析,并且我们的那些保守派竞争对手也在争相尽快购买相对而言未经测试的3700型测序仪。塞雷拉创办后的那年,ABI报道了10亿的销售额。威尔康信托基金在3700型测序仪上花了比塞雷拉更多的钱,以便它的桑格研究所可以测序25%~30%的人类基因组。同时,麻省理工学院借钱给埃里克·兰德购买比政府准备资助的更多的仪器,借钱的前提是他从弗朗西斯·科林斯那里得到了资助(资助一年的金额为4000多万)的基金管理费,这使他有了公共计划里最大的经营运作。
多亏了G5的策略的改变,我的老板们站着就挣到更多的钱。亨克皮勒和怀特高兴地给公共计划提供产品,现在公共计划打算买价值数百万美元的3700型测序仪和试剂,怀特们就像军火商发动一场战争以便他们可以把武器卖给交战双方。当我的小组注意到我们的企业“伙伴”以较快的速度装备我们的对手们时,不免士气低落,我不得不努力使他们精神振奋起来,这真令人丧气。
用相同的仪器来阅读遗传密码意味着——除了政府资助计划的非同小可的10倍多的金钱和人力资源——塞雷拉和公共计划之间胜负取决于我们各自的科学策略。用得最多的词测序意味着遗传密码的字母真正地以适当的顺序组装;没有人会认为只是通过往桌子上扔几张碎片就能组装一个拼图玩具。然而,因为政府资助的实验室正在做数千个微型基因组计划,通过一次一个地测序BAC复制体,他们不得不处理数千个小型的拼图,但是我们只要做一个大的就可以了。我从来不曾想象,他们会想要拼接他们所有的拼图碎片——BAC复制体或者染色体。我正在为我的科学的完整性下赌注,希望它能占据上风;也为我的程序员们、我的方法和我的高功能的计算机下赌注,希望它们把如此庞大的公共计划淘汰出局。
用霰弹枪序列拼接一个DNA序列,只要求很少的序列覆盖范围。比如,1倍或单一的含有10万碱基对的BAC复制品,这意味着你已经生成了10万碱基对的DNA序列。但是这并不意味着你已经一次性测序了复制品的每一个字母。潜在的困难是这些被随意生成的DNA片段(比如,如果你把一张报纸撕成50块碎纸,把50张这样撕成的碎纸混合放在一个盒子里,然后随意抽出50张碎片,那么你肯定不可能最终拼成一份完整的报纸)。把这些任意片段再放回到一起,就像统计方法所预料的,你会发现1倍的覆盖范围实际上仅代表了66%的复制品的DNA序列。(一些部分将被复制;其他的将会丢失)。3倍的覆盖范围被要求覆盖96%的序列。用政府计划的序列聚合法,它将用8倍到9倍的覆盖范围安排和确定片段重构一个BAC复制品。我们曾认为我们也会需要那么多。但是我们的果蝇试验成功后,我知道我们能够只利用很少片段就可以获得比99.6%以上的人类染色体覆盖范围。多亏了我们的末端配对技术,我们在每一个复制品终端测序DNA,复制品有2000、1万或5万个碱基对,只要5倍覆盖范围就可以得到正确顺序和确定方向的序列。
与塞雷拉的竞争也使得我们的对手们把他们的努力相对集中。当公共计划瓜分基因组开始时,一些实验室极具领土观念,并且打赌说他们具备了测序人类染色体和部分染色体的能力,而当时他们甚至根本没有钱、设备和能力去做这些事。到1998年9月,整个基因组已被预订瓜分,但不是每个当初下单的人都能够很快绘制出图谱,并进行高效率的测序。总的来说,因为BAC复制品图谱的有限供应,公共计划正处于崩溃的危险中,尽管它比塞雷拉整体测序能力要强得多。
可以理解,埃里克·兰德对这个状态很不高兴,1998年10月,他提议放弃瓜分基因组的协议,改为从一个覆盖着整个基因组的文库中随意选择的序列复制品。这个建议意味着不再看重公共计划的脆弱的共识。然而,那年12月,他接受了妥协:萨尔斯顿和沃特斯顿将确保为公共计划提供足量的对应复制体。到1999年3月,得到了“激动的”副总统艾尔·戈尔的支持,该协会宣布,到2000年春天,它将生产至少90%的人类基因组序列,以“工作草图”的形式完成,“比预期的早很多。”[4]加速的公共计划中除了占支配地位的四个主要实验室,他们作为次要的参加者们心理是压抑和不平衡的,因为科林斯甚至冷静地提出逐步淘汰进度不理想的中心,“他们的领导更沮丧。”[5]俄克拉何马州的布鲁斯·罗是一位早期的DNA测序者(结果证明,他还是在新闻界一些丰富多彩的引文的始作俑者),更简单点说,他是“被国家卫生研究所用K-Y凝胶对待的家伙。”[6]
虽然兰德已经清楚地明白,不采用我的方法,政府项目的努力将不能组装一份人类基因组序列,他相当确认我们的方法更好或者甚至更有用,在公开地攻击它的同时,他开始私下采用它,更糟的是,科林斯和其他人试图使用纳税人的钱秘密资助塞雷拉的一位商业竞争者,加利福尼亚的帕洛·阿尔托的因塞特基因组学。在这项秘密交易中,因塞特将提供配对的DNA序列以帮助政府资助的实验室与我们竞争,具体就是他们在SNP协会的帮助下搜寻并提供单字母的核苷酸多态性(SNPs, or snips)。他们的秘密协议得到了威尔康信托基金和一些药物公司的支持。它不仅推进政府计划拼装它的基因组数据的速度,而且意外收获一个副产品SNP,有效地成倍增加了协会中对制药公司有用的数据,所以他们使用相关数据不需要与塞雷拉交涉。通过SNP研究联盟,科林斯也能否认“他”(国家卫生研究所)正资助因塞特并帮助它与塞雷拉竞争。科林斯使用SNP研究联盟的另一个基本理由是他们无须发表数据(该协会不受制于政府/威尔康信托基金的规则)。这样他们既可以否认他们正使用我们的配对技术,又确保塞雷拉不能从这些数据中获益。该协会的一名成员,格兰素威尔康的艾伦·罗斯对这些手段感到愤怒,他告诉了我科林斯正在做什么。科林斯曾大言不惭:“我们不认为世界上的研究者们没有免费和开放的数据库这一事实是正当的,这种情况甚至连一天都不应该存在。[7]”但是他和兰德实际上正为数百万的序列保密着呢(序列至今还从来没有发表呢,除了已组装的部分)。
《今日美国》的蒂姆·富兰德最终曝光了因塞特方案,写了一篇以《联邦政府可能曾试图因基因图谱徇私枉法》为标题的报道[8]。科林斯生气了,他的政策主任可能发誓要痛打富兰德一顿[9]。但是问题的关键仍然是,纳税人的资金已经通过第三方从塞雷拉的主要竞争者手里购买了一类数据,如果他们严肃对待协作,这些数据是我原打算免费给他们的。
直到现在,阅读基因组对抗赛已经抓住了许多人的想象,公共感觉谁将会赢对于双方来说成为一件重要的事。政府支持的实验室想给政治家留下他们仍然值得资助的印象。而塞雷拉,我们这家上市公司,依赖于它的投资者的支持。在高峰期间,当塞雷拉或政府资助的公司发表公告时,每月有500篇左右的新闻报道出现,有时候甚至有数千篇。
为了与媒体交涉,科林斯有一个新闻小组,而瓦尔姆斯有他自己的人,每个政府资助的实验室都有一个或更多的新闻界主管。然而,媒体一次次围绕着一个主题:克雷格·文特尔是受压迫者,是与既成体制的集体力量竞争的一个独行侠和圈外人。在他的领导下,塞雷拉正在与官方的人类基因组计划竞争,而官方计划耗资30亿~50亿,这项由政府支持的国际协作,主要中心在英国、法国、德国、日本和美国。
烦闷的科林斯和他的同事们会抱怨他们是怎样被我的“巨大公共关系优势打败的”。[10]我打的是由一台“公共关系机器”[12]安排的“聪明的新闻之战[11]”,当然公共关系机器是“润滑良好的”[13]。科林斯抱怨那些描述基因组比赛的不体面的文章,在这些文章里他蹲在他的摩托车上,而我站在我的快艇的舵上。(“什么傻话!”[14])萨尔斯顿则抱怨“试图使记者报道显然被忽略了的公共计划的更加复杂的分析将是一次艰苦的历程”。[15]我的“好顾问”已经使用了“残忍无情的操纵”[16]和“塞雷拉公共关系的深层次的不懈的力量”[17]来影响世界媒体。然而,在那一天访问结束时,萨尔斯顿自己也承认,公共计划“在公共关系方面做得很差”[18]。
前面提到的公共计划对于关于我的大量文章的意见的批发商的牢骚在塞雷拉是一个恒久不变的笑料,因为我的“私人部队”实际上是一个名叫希瑟·科瓦斯基(Heather Kowalski)的年轻女士,她离开了她在乔治华盛顿大学的新闻发布官的工作,于1999年11月来帮助塞雷拉处理媒体不断的要求。虽然她没有其他应聘者那么多经验,但是她的态度我真的很喜欢。媒体的要求如此不通情理,尤其当我旅游时,她变成了一个长期的旅游伙伴和顾问,她工作如此努力,因此她的成功是应得的。
希瑟知道结交媒体只有一种方式:诚实而坦诚,加强他们的信任。通过采取这个简单的方法,她能够应付甚至最笨拙的记者。希瑟有一个不同寻常的常识,这证明是有帮助的,不仅能帮助我应付问题还帮助我对付近期的攻击和反击。不像一些由我的对手们部署的新闻发布官队伍,她没有训斥记者们,即使他们没有追随塞雷拉路线。最重要的是,她是直率的,当她认为我正在说或做一些愚蠢的事或被误导(经常发生)时她不会不告诉我。而其他人害怕这么直接地告诉我坏消息,所以他们开始依赖她。
尽管公共监督在增加,工作仍在继续,人类DNA的30亿字母的测序工作进行得甚至比给果蝇测序还要好。我们现在每24小时制作5000万到1亿的DNA碱基对,序列完全是高质量的。新的软件现在已完成,条码阅读系统在起作用,这使成对的序列行踪变得有规律。一个巨大的未知数仍然是,对于将近10倍于果蝇的数据,拼接程序如何理想地工作。
如果我们愿意,我们也可以利用政府计划每天发表在公共数据库基因银行中的数据。像其他的纳税人一样,毕竟我们曾资助了这项工作。制药公司每夜下载数据,因塞特公开使用基因银行来创建一个他们用来和我们竞争的数据库。弗朗西斯·科林斯没有对这些完全的商业应用抱怨什么,并且还利用这些更进一步为他的联邦政府计划的价值做辩护。但当我宣称我们将与纳税人资助的计划进行一次实质性的合作,把它的数据引进到我们的拼接中时,引起了强烈的抗议浪潮。G5曾讨论过他们是否能够对塞雷拉保留数据,即使如他们的所言正是由他们提供免费序列给大家。甚至还有人说我们是科学骗子,比如当萨尔斯顿告诉BBC说塞雷拉工作是一项“欺骗性工作”[19]。
为了充分利用基因银行的数据,我要求吉恩·梅尔斯和他的小组提供我们用来组装基因组的第二版软件。为了纪念他为编译软件而消耗的咖啡数量,我们称此软件为“宏大”。我们曾为果蝇基因组准备了一个类似的备用计划,建立在格里·罗宾和他的同事们几年间获得的测绘数据基础之上。我们从来不用它,但是对于公私联合果蝇基因组计划它是一块安全毯;它使我们安心,我们正在制作一套有品质的序列。最终,塞雷拉的目标以及对它的股东和数据库捐款人的承诺是要产生一份高质量的人类基因组序列,可以用来推动新的药品和疾病治疗的发展。我们的工作设想是,有更多的序列数据,就有更好的基因组拼接。我们的目标是提供最好的最完整的人类基因组版本帮助科学发现、疾病基因发现和新疗法的发现。癌症患者或其他疾病不关心谁测序了基因组,他们只是想要一个治愈或对他们疾病的治疗的新希望。
这一实用主义备用计划再一次让我们小组感到棘手,梅尔斯感到烦躁,因为它必须依赖于质量不断变化的公共数据,而我们在室内制作的是一致的高质量的数据。当我们拼接我们的基因组时,来自公共计划的数据仍然不能被认为是完整的基因组,只是提供了拼组起来的覆盖范围,有些地方的数据过多而有些地方偏少。还有其他一些与贴错标签和嵌合BAC(混合序列)有关的问题。公共计划在今后的6年里将主要处理这些问题,但是低质量的数据会干扰我们的策略并降低我们拼接的质量,[20]在我们测序老鼠的基因组之前,仍有一些未知因素。
当哗众取宠之事仍在继续的时候,新闻界的战斗变得越来越疲惫了。到目前为止,G5会议已经被就像其中一个与会者说的“幼稚的小圈子的态度”玷污了,在会议上我通常是被诽谤对象。然后,一天,一个新的休战机会来了,托尼·怀特给我打电话说他和迈克·亨克皮勒正与埃里克·兰德谈话(到现在他是他们的第一个顾客),而且埃里克对我是否想再次合作的意向感兴趣。
乍看起来,如果我能有权使用他们在基因银行的数据,公共计划从合作中获取了比我更多的利益。我怀疑在这些讨论中,优先考虑的不是人类基因组,而是埃里克·兰德以及他怎样能获得一个优势。在公共计划中,埃里克的同僚们也怀疑,但是埃里克相信合作是唯一可以避免我在结束基因组的竞赛中明确地宣称我是获胜者的方式。
尽管我有这些不安,我仍决定尝试另一次合作。我的科学顾问委员会也热衷于这项提议,因为公共计划的任何失败都可能引发各种连锁反应,包括减少对国家卫生研究院的资助。迈克和我正要去波士顿参加一个会议,顺便同意去见兰德,他的基地设在剑桥附近的怀特黑德研究院。我们在波士顿的一家宾馆的私人房间里会面。兰德希望这次碰面保密。
我告诉他像我与格里·罗宾以及那个果蝇团队那样的充分合作也许是不现实的,因为存在着许多敌意,但是我仍然敞开了合作的计划,在合作中,我们将交换数据,以一篇共有论文的形式或两篇同步论文的形式发表基因组分析。埃里克曾经涉及许多生物技术公司的诞生,他清楚地明白我们的数据库业务。我将提供给任意科学家一份密码DVD,只要他不以任何途径或形式出售,他可以自己使用。尽管我愿意所有我们的序列数据免费供科学界使用,但是我们不希望对手的数据库公司比如因塞特下载并且转售塞雷拉的数据,就像他们正在利用联邦的数据那样。
对埃里克来说唯一很重要的问题似乎是他要成为塞雷拉基因组出版文献的合著者,不论是否有一两篇论文,因为我们正计划使用他和其他人在基因银行发表的数据。我们将对我们使用的任何数据加以适当的说明,这是学术规则。不过我指出如果这样的话我应该是任何一篇出自联邦资助计划的论文的作者,因为这几年以来,我已经把大量的人类数据储存在了基因银行,现在它正被公共基因计划使用。基于同一原因,任何成功的人类基因搜寻者也是这样。
我们同意不久再次对话,埃里克强调即使我们确实达成协议,他也只代表他自己说话,并且不确定他是否能让其他的公共实验室坐下来谈谈。我怀疑谈话将漫无边际,但是我仍希望这些谈话可能至少使报界稍微冷静、平和下来。当我向我的高级小组汇报时,他们甚至更加不知所措。毕竟有过那么多的攻击和诽谤,他们都想“踢联邦资助实验室的屁股”,对我来说现在屈服“只是错误”。
1999年10月7日,我收到理查·罗伯茨给我的3页纸的备忘录,他是我的科学顾问委员会的主席,备忘录的大部分是由埃里克·兰德送给理查的一份文件草稿组成。文件概括了出现在我们早期谈话中的各个要点,当提到由塞雷拉数据和公共数据创造的序列数据时,埃里克理解得很清楚:“正如克雷格所描述,塞雷拉的业务计划是由它增值的数据库来吸引顾客,而不是对难以获得的序列数据的排外的访问权。一个重要问题是,塞雷拉想防止竞争者利用塞雷拉的数据快速生成类似的增值数据库来与其竞争;这就是为什么要推迟12个月把联合分析数据储存到基因银行的原因。”[21]
整个11月,我们与兰德进行了几轮讨论,他甚至参加了一个塞雷拉的科学顾问委员会会议,该会1999年10月10日在马里兰的威河大院里召开,在那里,一年前克林顿总统曾尝试发展以色列人和巴勒斯坦人之间的和平进程。与兰德的电话会议结束后,塞雷拉高级科学职员和董事会感到,在塞雷拉可以忍受的条件下,我们与联邦基因组计划的合作已经取得了真正的进步。但是我们不久得知,正如他曾经警告过的,兰德在这几轮讨论中仅代表了一个人——他自己。
1999年11月12日,埃里克决定告诉弗朗西斯·科林斯关于合作提议的事。埃里克说他得将已经达成的协议作一个概述,并且还说“关于可接受的协议精神,有足够的共同点认为我们能够做,而且有合适的时间让他们[克雷格、阿诺德(列文),可能是迈克和托尼·怀特]和我们(你、哈罗德、我和任何另一个重要的人)讨论”。然而直到后来,他才感到了麻烦。当进行到参加双方的核心讨论的关键问题时,埃里克被科林斯挤出了会议,并且被强势的诽谤塞雷拉者所替代——萨尔斯顿、沃特斯顿和来自威尔康信托基金会董事会的马丁·鲍布洛(Martin Bobrow)。科林斯一定会和瓦尔姆斯一起出席的。我已经和联邦政府中的几个人物之一——能源部的阿里·帕特诺斯,建立了良好关系,但是他没有被邀请。托尼·怀特坚持要去,亨克皮勒也是,因为科林斯等人现在是他们的主要客户,并且在过去的几周内,他曾经把他们十亿分之一的编码字母和完整的22号染色体储存进基因银行,相当于2%的基因组。我感觉我们正接近一场第一顺序的灾难;这对阿里来说也是显而易见的。
在准备会谈的过程中,科林斯准备了一份文件,在里面他替换了一些曾经在与兰德的讨论中协商过的条款。文件被贴上了“共享原则”的标签,尽管它们只是被小组成员分享。我们同意在杜勒斯机场附近的一家旅馆会面,那儿曾见证过,我早先和弗朗西斯和谐相处的期望的落空,我知道我现在的情况注定要比以前更糟糕,但是12月29日,我还是勉强去了杜勒斯。
科林斯和鲍布洛以通常的政治辞令开始,毛遂自荐说自己是圣人,每晚把未加工的数据存入基因银行,而我们是罪人,因为我们最终要帮助一些药物公司,这些药物公司想保护他们投资的上亿美元,想把这些数据转化成药物专利。当讨论最后转到联合型数据库和一个可能的合著文献时,那些“分享原则”很快被证明什么也不是了。问题是我们的批评家们既不明白商业现实,也没有开放心态去探究原因、进行讨论或准备妥协。他们要我们在数据、方法和我们工作的荣誉方面做出让步;但他们却没有回报地做出任何让步。沃特斯顿宣称塞雷拉数据应该马上被利用,他不关心因塞特或任何其他公司是否会用这些数据来与塞雷拉竞争。在托尼·怀特的对于最后一项建议爆发性的回应渐渐平息后,很明显会议结束了,但是对它的反响几年之内都能感受到。
尽管科林斯的团队不愿意协商或妥协,但是他们现在能有本钱说他们与我们有着共同的兄弟情谊和真正的合作精神了,因为托尼·怀特以极其无礼又不切实际的要求做出了回应(怀特的确坚持说,合并的数据库3~5年间不能被其他人使用,但是这项要求的提出是由于对公共计划方面不妥协的失望,它是给任何想责备塞雷拉并想迫使协商崩溃的人的一份礼物)。
当科林斯团队坚持说数据必须公开、免费和无限制地为商业利用时,他们也因为想到我们将利用他们的数据与他们竞争而深深地感到失望和苦恼。詹姆斯·史瑞夫把我们比作20世纪50年代的科幻B级电影里的怪物,“可以吸收发射到它们两翼的火箭炮和导弹的能量,借助试图摧毁它们的人的力量变得更强大。”[22]甚至就在杜勒斯会议破裂时,科林斯还偷偷走到我这里再一次要求关于塞雷拉文献的合著者地位。
政府或威尔康信托基金会成员随后总结了他们关于塞雷拉地位的观点,将4页纸的陈述交给我,日期是2000年2月28日,其中包括一个最后通牒(在第3页底部),说除非他们到3月6日收到一次回应,否则对于一起工作的讨论,他们将认为是在我这方面没有更进一步的兴趣。备忘录送到我办公室的时候,我正在国外,我的助手林恩·郝兰德(Lynn Holland)通知科林斯我有两个星期的行程,等我回来时我会回复的。威尔康信托基金现在依赖于一个未成熟的策略把更多的压力加到我的身上。3月5日,星期天,信托基金会发表了2月28日那封信的复印件,上面标着“机密”送给了《洛杉矶时报》。科林斯否认与消息泄漏有任何联系。那时,他正受到自己的管理部门的批评,因为这次事件给国家卫生研究院资助的增加投下了阴影。正如公共计划的一位成员承认的,“对于国家卫生研究院来说,卷入这次泄漏事件就是场政治灾难。”[23]
威尔康信托基金会桑格中心的蒂姆·哈伯德(Tim Hubbard)把一份备忘录传给萨尔斯顿、摩根和其他人,日期是3月5日,上面解释了为什么泄漏了文件:
塞雷拉官员们做了多次声明,关于他们可敬的意图,已经被广泛报道了。从这和其他发表的文件(《财富》杂志)看,他们的态度实际上是愤世嫉俗的,焦点在获得最大限度的货币利益,不考虑对于世界范围医学研究的影响。鉴于人类基因组的唯一性,显而易见的是,他们希望尽可能地锁定,而不考虑对于学术和商业研究和发展的抑制效应。
塞雷拉做果蝇试验成功后,这是不是一种酸葡萄现象呢?备忘录敏锐地问,当然不是:“塞雷拉团队做了未经证实,而且过分夸大了的声明。”
科林斯和他的团队经常提供给《洛杉矶时报》的两名记者保罗·雅各布(Paul Jacobs)和彼德·高斯林(Peter G.Gosselin)一些内部情报。这次他们相当关注威尔康泄漏事件,把信转化成一篇头版故事,一篇达1348字的头版故事[24]。他们引用了托尼·怀特的话,这是一次背信行为,它破坏了本来注定会有的更进一步的关于联合计划的讨论:“把那封信送给新闻界是卑鄙的。”当我第二天被要求对此进行评论时,我也持相同的观点,证实了备忘录的发表充其量是片面的,而且同时,最坏的问题是它的时间是不恰当的,以至于我没有机会在最后期限之前做出回应。
第二天,《华盛顿邮报》报道说:“如果信件的发表确实意味着给塞雷拉施压,它不起作用……塞雷拉的计划非常好,通过把这些数据和那些被公共资助研究者们产生的数据合并,公司今年有希望发表一份完整的人类基因序列,比人类基因组计划设置的最后期限早3年。那意味着,是塞雷拉能获得现代科学最伟大成就的荣誉,而不是耗费了这么多年生活在基因组计划上的学术研究者们获得。”[25]那天我反复重申我的立场,塞雷拉仍然对合作感兴趣,并且研究院的信“明显说错了”我们在知识产权保护上的立场。
在几天之内,格里·罗宾也表示了对我们的支持,他告诉《纽约时报》说,国家卫生研究院的官员们可能会把我们推到太为难的境地:“我认为一家上市公司的领导层无法负担放弃他们所拥有的一切”,塞雷拉和我“完全遵守信件和他们协议的精神”。当提到果蝇基因组时,格里说他对让塞雷拉发表数据的压力表示疑惑,因为它已经发表了比任何其他的竞争者多得多的数据。[26]一名记者评论说:“被认为是人类最高尚的事业之一的人类基因组计划,越来越像一场泥浆摔跤比赛。”[27]随着争论的升级,约翰·萨尔斯顿最终也明白了事实:“许多人控告我揭发隐私、妒忌、保护我的地盘……我已经进入了政治世界。”[28]他承认,泄漏事件是一场灾难。
几天后,科林斯和摩根透露,他们仍然另有一个锦囊妙计,当然最后也是引火烧身。到此时,多亏了牛市,或者说多亏了22号染色体的成功揭示,塞雷拉股票正在飙升猛涨。通过克林顿总统和托尼·布莱尔首相各自的科学顾问尼尔·莱恩(Neal Lane)和鲍勃·梅爵士(Bob May)(现在是牛津的梅勋爵),摩根努力游说让两位国家首脑做一项有关人类基因知识产权的联合声明。经过全面编辑和多次延期后,在沉闷的新闻时间段,白宫决定先召开记者招待会,科林斯和莱恩也参加了。由于担心塞雷拉可能会宣布它的首次草图,这次声明也被用来平息英国的恐惧,白宫给他们的笑容比给公共计划的都多。在国家科技奖颁奖晚会上,克林顿总统说:
这次协议郑重宣布,这本写有所有人类生命的生命之书是属于全人类的每一位成员所共有的。人类基因组计划得到了美国和英国的资助,要求它的拨款受益人测出他们发现的序列,并在24小时内可以被公共使用。我强烈要求其他国家、科学家和股份公司接受这项政策,尊敬它的精神。我们必须确保人类基因组研究的利益不是用美元而是用人类生活的改善来衡量。
鲍勃爵士认为它是“一项原则的温和陈述”,它“可能倾斜了道德景观”,并且通过阐明专利和所有权问题,它将“应该是加强而不是削弱市场”。莱恩同意它只是重申了现存的政策,“没有人挥舞旗号,没有人说这可能是一个你需要改变政策的信号,没有人说你处在错误的方向,或者向你施加压力。”
但是白宫发言人约瑟夫(乔)·洛克哈特(Joseph[Joe]Lockhart)给新闻界留下的印象却不是这样。当他那天早上向记者做简报时,他建议总统应该计划限制基因专利;这些建议是在CBS广播新闻采访中和一群挤进洛克哈特办公室的不带相机的记者面前提出的。这被看作是对生物技术界尤其是塞雷拉的一次沉重打击。
那时,当股市正处于“非理性繁荣”高峰期时,突然出现了暴跌,白宫很快采取行动试图把这个毁灭性的妖怪再放回到瓶子里。不同寻常地,莱恩发现自己被要求在午饭时间做一个介绍。他仍然忽略了市场里的大屠杀,在詹姆斯·布莱迪简明新闻发布办公室,他说:“我想完全清楚地说,这个声明与任何正在进行的公共与私人部分之间的讨论没有任何关系。”[29]和他一起的是弗朗西斯·科林斯,他抓住机会告诉新闻界公共计划是怎样提前并且按预算进行的。对于现在事态的发展,他似乎有些幸灾乐祸,并透露了不同的信息:“我认为这是一个相当有意义的一天,我很高兴在这一天来到这里,在这里,关于有权进入人类基因组序列的重要原则——作为人类,我们共同分享的遗产——得到了自由世界的领导层的支持。”[30]
在记者招待会上,“与塞雷拉的人发生争吵”的话题被提出,而且一个记者问声明的目的是否是“鼓励文特尔和塞雷拉回到谈判中,并且让他们简洁陈述一个关于他们将分享他们的信息的正式协议”,莱恩回答说联合声明“适用于每个人”,科林斯重复了类似的真言:“不仅仅是被提到的专利问题,也是马上发表数据的问题。”
当另一个记者指出“股票今天正在迅速下跌”,莱恩回答,他“没有看见任何理由”可以把股票暴跌和已做的声明联系起来。“我们的理解是塞雷拉赞成这个声明,”他补充说,但是几分钟后,他又承认:“我不清楚他们是否被提前被告知声明要说什么。”那天他最后说了一些稍稍安慰股东的话:“我们想使人们的生活更好,这个声明给出的原则我们认为也是为了这个目的。”
莱恩和克林斯的安抚没起多大作用,股市第二天继续下跌。在两天时间里,据估计生物技术的股票总资缩水近5000亿美元,塞雷拉缩水了近60亿美元,时至今日,鲍勃爵士先生仍坚持称声明“说了些明智的话”,而股市反应的方式是“反常的……它正在寻找调整借口。”尼尔·莱恩引用了市场反应作为一个例子说明:“一个相对小的事情,当它出现在白宫时,也能有巨大的反响。”
《华尔街日报》的一位编辑打电话问我成为美国经济最强大的人物之一有什么感受。“更穷了”就是我的答案。我正要成为第一名生物技术亿万富翁时,我的股票暴跌了,开始几个小时就直线下跌3亿美元。由于忙于基因组而没有充分使用魔法师号帆船,一年前我卖掉了它,但是现在我正在法国南部协商买一艘漂亮的47米长的纵帆船,盼望着我不久将能再次航海。我甚至把桅杆重新刷了漆。这条船要求有12名船员,它要花我大约1500万美元,加上每年维护费200万或300万美元。这条纵帆船的德国主人了解股票市场,当我告诉他我认为我可能再也购买不起它的时候,他表现得很通情达理。取消了合同,我失去了3万美元预付款。
虽然我失去了我从来不曾拥有或指望的钞票,将用来发展新疗法研究的数千亿美元一夜之间化为乌有。信任我和我的眼力的投资者们同样遭遇了这个结局。这也附带有法律结果:一位股东通过一家律师事务所提出了诉讼请求,这家事务所专门从事某家公司的股票价格暴跌时进行的集体诉讼。它的论据大致是,政府因为我们与科林斯等人失败的谈判而惩罚塞雷拉,塞雷拉没有发布这些决定性的正与政府协商中的信息。这正是律师们所拥有的奇怪的类似思想:我们正因为没有提到从来都没有发生过的合作而被指控。
数百亿美元从股市流失,白宫的压力很大。克林顿总统在发表声明之后的一天,他给予了纠正,解释说,这个声明的目的不是要对基因的专利性或是生物技术工业造成影响。由于出现了纰漏,克林顿和摩根成功地给白宫带来了尴尬。在股市崩溃、信件泄露给《洛杉矶时报》后,总统命令尼尔·莱恩结束基因组战争。“搞定它……使这些家伙们在一起工作。”[31]
莱恩曾经对基因组冲突大为震惊,他高兴地答应把信息传递给科林斯。第一个明显的影响是对塞雷拉的攻击降低,约翰·萨尔斯顿称它为一个“笼头”,“塞雷拉成功地使弗朗西斯保持沉默,这对公司来说是很有价值的。”[32]对我而言,它是特别的一天,对科学界来说,它是悲伤的一天,在这一天,要求美国总统介入来停止无休止的污蔑中伤。然而,我从与政府的接触中学到了一个教训,那就是只有傻瓜才会疏远和离开政治。我很担心科林斯会耍花招利用白宫留下一个印象,那就是,政府和威尔康信托基金会是唯一卷入测序人类基因组的两个当事人,不管他们是不是第一个完成的。科林斯在玫瑰园到处散布得到了总统和英国首相的支持,这次宣传将比我只有一个女性的公关队伍所做的一切事情的总和还要多。
当时,似乎是我得到了总统的关注。1998年3月,在千年祈福第二夜,我不仅与克林顿一家共进晚餐,而且克莱尔和我还拜访了他们在白宫的私人住处。当时我们喝健怡可乐、葡萄酒和啤酒一直到凌晨,我们讨论每件事,从斯蒂芬·霍金的演说到总统怎样整理床铺过快(希拉里相信被子应该透透气),甚至有一个提问时间,在此期间,希拉里解释说,考虑到科林斯的职位是一个联邦官员,她感到他已经错误地混淆了科学和宗教。
但是基因组竞赛进入最后一轮时,发表国情咨文演说集会上,是科林斯与第一夫人同座,而我似乎已经失宠了。当千年祈福第八夜降临时,他们建议我谈谈基因组,但是,兰德参加了我们的威河会议两天后,是他而不是我走上台去讲演。
1999年10月在白宫,兰德作了《信息学遇到基因组学》的讲演[33],按照惯例讲述了数据怎样不得不被公开的情况。(“很明显,有关人类基因组的信息必须免费为全世界的每个人所利用。”)克林顿尤其被兰德的陈述所打动,兰德称,从遗传学角度讲,所有人类99.9%以上都是相似的,克林顿就想到“所有的种族流血冲突……就是为了这千分之一的区别。”[34]
“克雷格现在是不受欢迎的人,”我的助手的熟人如此告诉她,传话人曾经在白宫工作过。我们花了一些时间寻找出现这些流言的原因。事情追溯到一个月前,在迈阿密海滩召开的第11次基因组测序和分析会议中,我们举行了一个特殊的全体会议,讨论有关DNA技术的应用。来自应用生物系统的一些人推荐要请来自联邦调查局的一位女性讨论法医DNA测序,这是一个销路好的市场。全体会议之前,我与她见了面,并且吃惊地听她描述了一年前,为了进一步调查当时所谓总统与莫尼卡·莱温斯基的桃色事件,她是怎样在白宫从总统那里获得了一个DNA样本的。
当我在会议上介绍她时,我笨拙地参考了莱温斯基事件,那时,这件事已经公开化一年了[35]。——我提醒与会者,大多数人曾经参加过的前一次会议上我们遇到的蹊跷:总统要做一个基调讲演,但是就在要开讲最后一分钟前,他取消了,他还曾经为此而道歉。现在我知道原因了,我解释说,他当时与我们下面的演说者有一个约会。如果事情当时就这么结束了,那么我怀疑白宫也就不会关心这件事了,但是联邦调查局的特工不仅以评论莫尼卡门丑闻开始她的演示,而且继续用幻灯片显示了那条臭名昭著的蓝色裙子,这是一条圈住了世界上三个最著名的DNA样本的裙子。她讨论了她能从每个斑点获得多少DNA,以及每个斑点包含大量的精子。她继续描述1998年8月3日从总统那里获得血样,然后用他的血液和她从蓝裙子上分离出来的样本上做了DNA分析。她演示一张张幻灯片,证明血液样本和样本K39中的DNA相匹配,解释说,在白种人中,这种随机匹配的几率是7.87万亿分之一。她最后一张幻灯片是显微镜视野下的总统的精子。
一个现任联邦调查局的特工对这件有激烈争议的案件了解得这么详细,说我很震惊那是保守说法。当有人把这一切报告给白宫时,我扮演的角色是怎样被定位的还不清楚。但是,我最终发现过分保守的员工们已经决定抵制我,并且因为联邦调查局的特工的应用演示而责备我。我不想成为蝴蝶效应的受害者,一只昆虫扇动翅膀——联邦调查局的特工——引起一场巨大的风暴,这个风暴以代表科林斯和政府计划的单方总统公告的形式出现。但是我能看见乌云正在聚集。
5月4号,我在家接到来自能源部的一个朋友阿里·帕特诺斯的电话,这电话本身并没有什么异常,因为我们经常通话,通常都是在每个周日。但是那晚他随意提到的事确实让我思考了一下,他邀请我去他的市区住宅喝一杯,还说,弗朗西斯·科林斯可能会进去坐一坐。弗朗西斯住在相同复杂的市区住宅里,几乎从阿里家穿越了整条街。考虑到我已经完成的工作,我勉强可以理解了。塞雷拉测序计划做得不能再好了,终点在望了。塞雷拉将首先测序出基因组,它比政府计划的工作质量更高。除此之外,我上次虽然与弗朗西斯有过温馨的交谈,但最终却以集体诉讼和损失数亿美元而告终。
后来弗朗西斯在对我们的见面的描述中说道,假如和事佬的角色就是决定结束敌意,掩埋战斧,并且提供给我橄榄枝的话,那么是他先摆出了这个重要而高尚的姿态。[“我找了一个文特尔和我共同的朋友(阿里·帕特诺斯),要求他安排一个秘密会面。”[36]]但是这个主意事实上是阿里出的,正如他回忆的,“说服文特尔参加秘密会面比说服弗朗西斯给我带来的麻烦少得多。弗朗西斯推诿了几个月,宣称他需要从国家卫生研究所老板那里得到安全许可。”
我由此明白阿里不是因总统所下的“让这些家伙在一起工作”的命令所驱使,而是他意识到我们都被我们各自的环境、同事和顾问们从现实绝缘了,因此,想要让和解从注定失败的阴影中走出来,就必须从一个正式会议的紧张的氛围中跳出来。(正如阿里自己所说的,“他们需要从这些茧壳中抽身出来,并且被带到他们能做回自己的环境中。”)那时,我推测阿里已经打过电话,因为科林斯和政府资助的实验室人员都关心塞雷拉将做一个先发制人的声明,声明我们已经在他们修补与白宫的关系之前完成了基因组测序。
当然他们有权不满。能源和环境众议院小组委员会呼吁举行人类基因组测序计划听证会,并且邀请我在4月6日听证会发言。有我的小组的鼓励,我采取了一个坦白、率直的方法。我仔细解释了一个被测序的基因组和从BAC复制品中得到的序列之间的差异。在前者中,遗传密码的碱基对顺序在整个基因组是已知的(塞雷拉工作状态),而后者当中,大多数序列都没有组装或排序(公共基因组工作状态)。希瑟和我认为听证会提供了最好的机会宣布我们的进程。我们发表了一篇新闻稿——《塞雷拉基因组学完成一份人类的基因组测序阶段》——为了将关键信息传递给政府基因组人员,所以他们知道我们离大型发布非常地近了,它将在拼接过程结束后的任何时间举行。科林斯抱怨说新闻界误解了我们的意思,但是我们不是虚张声势吓唬人,我知道他也知道这个。同样,我知道拥有总统对我们所做的事的支持,将会抬高我们的成就而不会造成学术争论,并且确保它在历史课本中的位置。
阿里让我放心,他会确保他、科林斯和我在他家里进行的讨论绝对是非正式的,并且我可以否认任何一次曾经发生过的严肃谈话。由于来自阿里的强大压力以及我个人的感觉驱使,我需要做一些白宫希望做的事,我同意一天晚上顺便去拜访一下阿里。
阿里住在一栋典型的三层楼的市区住房里,地下室有一个娱乐室/家庭娱乐室,弗朗西斯已经在那里等着了。阿里开始不停给我俩啤酒,气氛很紧张。谈话慢慢地以当前的琐事开始,好像真的只是一次偶遇。几杯下肚之后,谈论转向了更严肃的问题,考虑一个由白宫或至少涉及总统的可能的联合声明。关于在《科学》杂志上联合发表或同时发表文章的事也被提及。谁都没有对任何一方做出承诺,不过我们都承诺对我们的交谈保密。又喝了几杯后,弗朗西斯和我一起离开了,开玩笑说可能会有一个摄影师蹲在树丛中。当他走向他的家时,我进了我的车,然后开车回家了。
我告诉了克莱尔发生的事,她的反应很坦率:你参加这样的谈话简直是神经错乱了。但是尽管如此,会晤仍然继续,不止克莱尔一个人表示不赞成会晤。希瑟已经成为我重要的顾问和朋友,她也很生气,以至于朝我大叫,或者干脆拒绝谈论此事。但是我继续谈,就像在我们以前的谈论一样,我也感到科林斯现在除了与我站到同一立场,别无选择。
尽管科林斯还没有和威尔康信托基金会或华盛顿的兰德谈论这个计划,我们给自己订了一个简单的目标:当塞雷拉完成它首次人类基因组拼接时,在白宫与克林顿总统做一项联合声明。那时,政府将对它自己的计划做一次进度报告,我们将宣布我们会一起工作,在《科学》杂志上联合发表文章。事情进程已经到了联系《科学》杂志的编辑唐纳德·肯尼迪的地步,看他怎样处理最终的文章,当然,塞雷拉要求设法限制它的商业竞争者下载和转售它的数据。如果我们在欧洲,这原本不是个问题,因为在那里,新法律已经制定,允许有独特数据库的版权。美国国会仍然在激烈争论这个问题,丝毫看不见解决的希望。肯尼迪鼓励我们所有人与他合作,他因为《科学》杂志将发表这个历史性的成就而感到兴奋。
保密不久变得甚至更重要了,因为白宫不希望被抢风头。我需要我的高级小组成员进入讨论,当然,他们不高兴我正放弃我们的优势,放弃使我们的攻击者难堪的机会,以及放弃单独拿奖的机会。希瑟仍然很生气,认为我已经失去了我的理智。海姆和吉恩看起来极不自在,仍然对公共计划深表怀疑,考虑到我们曾忍受的一切,他们的反应不足为奇。他们和我一样,十分关心与政府人类基因组计划的公共关系战争将掠走我们的时间,我们想要并且需要时间来分类整理我们的数据以检查它们的质量,并且分析它们的意义。而具有讽刺意味的是,我们现在需要更多的时间来处理公共数据的混合质量。
我的同事们不是唯一对折中方案反应冷淡的人;我也被其他人指责,有时候甚至是严厉指责。在拉荷亚与斯克里普斯研究所(Scripps Research Institute)的领导人理查德·勒纳(Richard Lerner)的一次晚宴中,基因组竞赛的最后阶段出现了。当我告诉他,我至少打算与政府计划发表联合声明,勒纳大发雷霆。他把它比作奥运会中的马拉松比赛,只有在终点线才能停下等候下一个运动员出现,然后才可以手拉手,一起穿越。他的观点是需要让国家卫生研究院和政府为他们的傲慢吃一次教训,如果我仁慈一点,那么我将会使数千人失望,他们是我反抗政府对科学社团所犯的所有错误的力量源泉。
白宫要求我提供一个时间,问我觉得什么时候我们能完成第一次拼接,我与吉恩·梅尔斯和生物信息学小组一起计算出计算机将花多长时间才能把序列拼装在一起。我给了他们一个估算,还告诉他们,我所提出的时间有一个较大的缓冲,他们反过来通知我定的特别的日子不能用,而指定了比我定的早几个星期的一天,这让小组更惊慌。在阿里家的地下室进行的讨论继续着(每次弗朗西斯和我出现时,他妻子和孩子很不乐意地被赶出去)。6月26日被确定下来。有了最后期限,这激励我的小组更加辛苦地工作,尽管他们一直在全力以赴。有一个真正的危险是,在结束之前我们可能会失去动力。
在我与弗朗西斯和阿里的谈话中,我们消耗了几盘比萨饼和啤酒就决定由克林顿总统主持这次事件,托尼·布莱尔将通过视频直播连接从伦敦参加。首先,总统先讲话,接着是布莱尔,然后是科林斯,最后是我。我们每个人都有大约10分钟的陈述时间,我们同意提前共同分享文本。虽然我很高兴这个安排,但是对于要说什么以及怎样描述我的小组在塞雷拉的工作,我们仍然小心翼翼。克林顿和布莱尔最后一次就此事公开发表言论时,塞雷拉股票每股下跌了100多美元。如果那样的事再次发生,那么同意这些讨论的代价将是失去我的工作。
会议前一周,“高级行政官员”通知新闻界说科林斯和我将就基因组测序工作的完成发表声明,总统克林顿可能参与[37]。《华尔街日报》称,“白宫的一项联合声明发出了一个强有力的象征信号,政府和私营部门可以在重要项目上合作,行政官员补充说,达成一条协议,即在仪式上共用一个讲台,是数周协商的结果。”[38]文章继续指出,“联合仪式将与其他谈话一致,目的在于协调各小组的发现的科学出版,也许到了秋天,尽管不能确保会达成这样一个协议。”
随着日子一天天临近,压力在增加,但是到那时为止,整个进程是无法停止的。一旦我同意平局,那么在敌意再次突然爆发之前,我们想在白宫尽快宣布它。我每天都接到从阿里或尼尔·莱恩那里打来的电话,他们问我拼接是否已完成了。拼接还没完成,但是我向他们保证,它不久就会完成,并且几乎每小时都要核对计算的进程。我们正在用康柏的“血刃”[29]芯片,它正与大量数据作斗争。由于电脑死机,巨型计算机需要重新启动许多次。为了检查拼接过程每个阶段的进程,吉恩和他的小组根本不能入睡。分段算法的一个优势在于继续进行下一步之前,我们可以评估每一步的成功。这也极大地帮助我们缓解了心理压力,因为我们知道我们正在取得真正的进步。
最初的拼接在公告发布几周前完成了,但是拼接是建立在所谓的划分方法论基础之上的,而不是整个基因组之上。实质上,基因组通过把数据串拼接成数百个小一点的块状来完成,这些小块被分配到基因组中合适的地方,用公共图谱数据,而不是一次性决定整个序列。但是公共数据没有包含整个基因组,我们仍希望完成整个基因组。在声明之前一两天时,拼接程序“宏大”看起来似乎它要真正实现基因组了。
显而易见我们确实在第一次拼接人类基因组中获得了成功,我把注意力转向了我在白宫的发言。我知道总统、首相和科林斯正在使用职业的演讲撰稿人,但是毕竟我投入了这项工程,我想写下我想要发表的每一个字。我被告知将会有广泛的新闻报道(保守陈述),而且我们的评论将会在全世界几个频道上实况转播,包括CNN和BBC。当我们被告知这将是历史上的第一次,一个重要的科学进步从白宫被宣布出来时,我感觉更有压力了,我发现自己在作斗争,不知道该说什么以及该怎么说。同时,我收到了总统克林顿的发言草稿,既大方又激励人心,我开始感觉更加不适应这项任务了。第二天,科林斯发言稿的复印本到了,我必须承认,给我留下了深刻印象。现在我正开始后悔没有用一个演讲撰稿人。每晚,我都坚持熬到很晚,有时候只能写几个句子或者一段话。为了要我在白宫东厅的电视现场直播上发言的复印本,白宫正给我施压,电话变得更疯狂迫切。这时我收到了托尼·布莱尔的演说词复印本,我的血液开始沸腾。这份讲稿由他的首席科学家鲍勃·梅爵士起草,党派性很强,我怀疑威尔康信托基金会对他的讲稿有重要的影响。
我很不安,以至于给阿里打了一个电话,告诉他如果布莱尔发表这样的演说,我将抵制白宫的颁奖典礼,举办我自己的记者招待会。阿里试图使我平静,并许诺马上给尼尔·莱恩打电话,他告诉我不要轻举妄动——事实上,不要做任何事或给任何人打电话直到我从他那里或尼尔那里得到回复。尼尔最后打来了电话,他想和我一起讨论布莱尔的演说,一行一行,以澄清对我冒犯之处。当我结束时,他清楚地明白我的处境,并且同情我,但是他说,他能做的很少。“我能改变任何你想在科林斯的演说中想改的东西,甚至总统的,但是你让我改变一个外国元首的主要国际演说,我不能那样做。”
我记起了科林斯和我在地下室讨论中的搪塞,当时他告诉我,对兰德在他之前做的事,他不能为他的同事辩护。科林斯还说,他与最后那封信在《洛杉矶时报》的发表没有关系,他已经批评了威尔康信托基金会。如果曾经有人欺骗我,那么就是对他的耻辱;如果欺骗第二次发生,那么是对我的耻辱。我不想让它再一次发生在白宫的电视现场直播中。我很坚定:如果布莱尔的演说还是那个样子,我就不会露面。尼尔请求我等一等,至少给他尝试改变它的时间。
作为一个乐观主义者,我不停地继续做我的文本,并且坐在我家办公室的电脑前直到午夜后,电话铃响了。这是尼尔·莱恩安慰的声音,他向我保证,每个人都收到了我的信息,托尼·布莱尔的演说词将会被重写。我能先看副本吗?他保证演说词会改变,并且我将会满意。现在我同意参与吗?我向来知道尼尔是可敬而率直的,所以我接受了他的话。谈话很快转到我的演说上,我向他承诺副本早上6点前送到,电话里我详细告诉了他我想说什么。尼尔似乎很满意。我们下一次见面将会在白宫那天早上。我们要向世界揭示人类之书。