第5章 科学的天堂,官僚的地狱

    通常使用恰当的酶把这个大分子打碎,然后这些小的碎片被相互分离并测序。得到足够的结果后,这些结果被一个程序安装在一起形成一个完整的序列。这个过程必然是相当缓慢并且冗长乏味的,常常陷入持续的领悟和筛分中,而且这种方法也很难用于大DNA分子……看起来想要测序遗传物质我们需要一个合适的新方法。

    ——弗雷德里克·桑格(Frederick Sanger),

    诺贝尔获奖讲演,1980年12月8日

    我发现自己走进黑暗走廊的一间无窗的房子里,这间房子位于我曾提到的36号楼的二层,它将是我在国家神经紊乱和中风研究所(NINDS)的新项目的研究室。这座建筑是马里兰州贝塞斯达(Bethesda)的国家健康研究所的一群无计划地占用山林农田建造的复杂建筑之一。为了建设和装备这个实验室,我花了几十万美元,为了启动我在分子生物领域的新研究事业,现在我有一笔100多万美元的年度预算。把我在布法罗的研究小组的大多数成员带来后,我就可以很快开始研究了。

    在国家卫生研究大院里,有数百名全国顶级的研究人员在我们的周围一起工作,我们可以和他们相互合作。在我们楼下是马歇尔·尼伦伯格(Marshall Nirenberg)的实验室,他因为破译了遗传密码,揭示了怎样由一个基因中的DNA的三个“字母”编码一个氨基酸过程,氨基酸是构成蛋白质的单位,从而与人分享了诺贝尔奖。他和他的NIH的精英们可以教我们新的东西,有助于激发我们的新奇想法。我在贝塞斯达学会的技巧和产生的兴趣在我以后的生命中起了意义深远的影响,也给我日后产生解读基因组的兴趣奠定了基础。这里真是研究者的天堂。

    但我深知享受愉快必须付出的代价。正如每一次漂亮的周末航行总是伴随着充满狂风和惊涛骇浪的海上的累人的旅程。在NIH享受顶级科学工作的同时我也受到了它的影响,我不得不和一些行动迟缓的政府官僚机构打交道。我是以最高的民用服务等级——15级10等进入NIH的。问题是分配给我的实验室的人力资源明显没有按这个等级委派。最典型的是:当某位政府机构忠实官员遇到一些麻烦时,他采取了一个小小的抵制方案:把我的文件夹扔到抽屉的最底层并把它忘诸脑后。我不得不打电话询问我的薪水并确认一些必要的事宜,因为他们找不到我的文件而发生一些不愉快的事情。幸亏罗斯威尔·帕克还一直将我作为相关基金的研究员发放工资,否则,我可能会几个月没有工资。当最终对质此事时,这个人力主管承认是因为害怕搞乱程序而决定什么也不干的。

    这并不是唯一的摩擦起因。本来承诺有一个固定职位给克莱尔的,同时也给几个关键的人员诸如多琳·洛宾逊(Doreen Robinson)和马丁·史瑞夫(Martin Shreeve)安排职位以便他们可以跟我从布法罗转入NIH。但是在我到NIH不久,我被叫到学术主任欧文·柯宾(Irven Kopin)的办公室,被告知克莱尔一定会得到固定职位,但是必须在一年或更久以后,因为他们觉得她的科学资历低于他们的标准。

    寻找一套新房子被证明同样比我们预期的要难,因为在华盛顿附近,生活消费水平相对较高。一套比我们在布法罗的又小又旧的房子要几十万美元,而布法罗的是8万美元。我们的不动产代理芭芭拉·罗德贝尔(Barbara Rodbell)是马蒂·罗德贝尔(Marty Rodbell)的妻子,正是他联系我们来NIH的。芭芭拉刚开始卖房子,而我们是她的第一个(也是唯一一个)客户。

    我们在马里兰的西尔弗斯普林(Silver Spring)买了一套住所,这也是我们唯一可以支付得起的,它是一座价值10.8万美元的有两个卧室的市内别墅。我们和恺撒——我们的一条6个月的荷兰卷尾狮毛小狗,它的名字源于它在我们的生存空间中的绝对支配地位——算是有可安身之所。我也为我的8.5米长的凯普岛瑞游艇(一次几乎导致我们的经济出现问题的放纵产物)找到一个泊位,位于马里兰盖尔斯威尔(Galesville)的哈特格斯(Hartges)游艇园。西河在这里通行无阻地注入切萨皮克海湾,形成了几千海里的海岸线和巨大的停泊地点。当地经济支柱是烟草和捕蟹,这使得这个地方有浓浓的怀旧情结,特别是那些有烧木头的壁炉和跳棋格子的桌子的杂货铺更加重了这种风格。

    一个周末,我计划到海湾航行探险,探险是我的职业和个人热情的交汇点。在前往盖尔斯维尔的路上,沉醉于飞车的我始终敏锐地盯着后视镜看有没有无标志的警车,我自然会注意到任何的不寻常的事情,比如坐在一辆褐色福特车前排的两个可疑的人。不管我变换车道还是选择复杂的路线前往盖尔斯维尔,这辆特殊的福特车始终跟在我的后面。一到达哈特格斯我很快就忘了这条神秘的尾巴。但一天的航行后,在我回西尔弗斯普林的路上它又出现了。我开始担忧那辆福特车,疑惑是否我的反战抗议的日子回来困扰我了,因为现在我已是一名政府高级雇员了。如果我知道那辆车中的人会对我日后的研究方向产生重大影响的话,我就不会这样多疑了。

    下周一早上,当我发现有两名穿黑套装打领带的男子在我的狭窄的NIH办公室等我时,我的担心看起来似乎是发生了。当我走进来时,他们站起来并出示了身份证,他们是美国国防部的。他们解释说,他们来此是想要跟我谈谈用我的研究探索神经毒气以及相关生物战争试剂。这个要求是有道理的,因为我正在研究的受体蛋白正是神经毒素的作用对象。尽管这个话题很严峻,但是听到他们感兴趣的是我的研究内容而不是我个人,我还是松了一口气,请他们坐下说话。

    他们要我从事的研究的基本思想很简单:是否可以开发神经毒剂附着的在体内引起伤害的相同的蛋白质来检测神经毒剂的存在?这些蛋白质是否可以当作诱饵来吸收空气中相当微小的神经毒剂,并借助精细化学分析通过微弱的光信号的闪烁来警告其周围的人员,已受到毒剂攻击?

    虽然我当时正在研究的特别肾上腺素受体不能得到作此用途的足够剂量,但是信使化学物质乙酰胆碱作用的烟酸乙酰胆碱受体可以得到足够的量,我认为,我们可以将这种物质作为替代品。可以说,这正是他们所愿意听到的。乙酰胆碱传递神经信号给各种各样的肌肉,包括控制呼吸的膈肌。神经性毒剂如塔崩(Tabun, GA),梭曼(Soman, GD),和沙林(Sarin, GB)阻碍一种称为乙酰胆碱酯酶的关键酶的活性,这种酶分解和排除乙酰胆碱。化学毒剂在几分钟就起作用了,通过加重人体对神经刺激的传递,从而导致神经系统的短路,最终使膈肌瘫痪让人窒息。

    因为乙酰胆碱还对大脑的数个位点也起作用,所以非军事科学家们也对该受体感兴趣。尼古丁引发位于神经末梢的那些受体位点,增加脑中多巴胺的消耗,多巴胺是另外一种信号分子,它反过来在神经科学家们所谓的“犒赏通道”上发挥作用,从而导致吸烟者的渴望感受。

    乙酰胆碱受体已被约翰·林德斯特姆(John Lindstrom)成功地提纯,他当时在圣迭戈的索尔克研究所(Salk Institute)。约翰很高兴以相当高的价格为我提供这种蛋白质,有一点我认为是合理的,如果让我们努力去分离它将会是相当艰辛的。这样,他就会得到国防部的钱去进行他的基础研究,而我也可以解决怎样帮助政府检测神经毒剂。

    但是政府的官僚脑袋并不是一个统一协调的实体。NIH的官僚作风使得我从国防部拿钱难度加大了很多。科学家们不会把政府的钱转入NIH,他们通常直接在工作中把钱花掉。尽管有人说我太商人作派了并且我的确不需要额外的钱,最后一个25万美元的机构间转账还是以我的名义被安排储存在NIH的一个特殊账户里。

    一旦我的实验室成立,我们就随时可以从人脑中分离或克隆肾上腺素受体基因,这将为我们提供其分子结构和其神秘的工作方式的新线索。在这个意义上,克隆意味着基因的复制,通常是把它放在实验室里置入大肠埃希氏杆菌中,随着细菌的繁殖,我们想研究的基因复制也完成了。事实上,克隆一个基因也意味着在细胞或染色体中找到它以便我们能揭露基因用来制造蛋白质的DNA处方——既然这样,对肾上腺素有反应的大脑中的受体蜂拥而至。为了达到这一目的,我们必须隔离受体蛋白质,计算出它的氨基酸序列,然后推论出能够拼出这些序列的可能的DNA编码。

    这个描述使过程听起来简单容易。实际上,要花10年的辛苦。相同的工作现在只需花少部分时间,甚至几天的工夫,这里面也有我的一部分努力。不过让我们回到20世纪80年代,那时分离和研究人体内微量的蛋白质是很艰难的。

    为了使微量的受体蛋白质达到我们能开始基因捕获的数量,我想利用最近开发的叫高性能液体色谱(HPLC)的新技术。用这种方法,人类细胞膜的成分在清洁剂中被溶解成脂肪和油脂,然后使它们穿过柱状物质把它们分开。每个蛋白质的前进速度取决于它的大小或负荷,所以越小越敏捷的分子穿越得越快。

    采用这一新方法,我需要有经验的人。我雇用了安东尼·克拉维奇(Anthony Kerlavage),他已经在加利福尼亚大学圣迭戈分校和苏珊·泰勒(Susan Taylor)一起做过高性能液体色谱蛋白质的提纯工作。发展分子生物技术的力量就必须研究蛋白质,为此我建立了一支青年小组,由北卡罗来纳州的一个博士后钟富荣(Fu-Zon Chung音译)和两个从布法罗来的实验室技术员珍妮·高科因(Jeannine Gocayne)和迈克·菲茨杰拉德(Michael FitzGerald)组成。

    当我的小组全力制造纯化受体时,我们最后发表了30篇有关受体结构和功能的不同方面的科学论文。当受体的设计被解构出来时,更重要的发现之一是,大自然是多么节俭,一次一次地使用相同的结构,几乎没什么变化。我们对于蝇蕈碱乙酰胆碱受体(乙酰胆碱受体的亚型)和α肾上腺素受体(一类肾上腺素受体)结构的分析显示它们的基本结构是类似的,尽管它们被认为是人体内不同的神经递质。这对科学界来说是令人惊奇的,科学界普遍认为,不同受体属于不同的研究领域。结果,很多人拒绝接受我们的发现直到几年后受体基因被排序出来,发现它们是极为相似的。

    两年内,虽然我们的士气正遭受挫败,但我们的努力却取得了重大进步,我们的目标就在眼前,我们正从少量提纯的受体上获得第一个氨基酸序列。我们被杜克大学(Duke University)的罗伯特·莱夫科维茨(Robert Lefkowitz)团队打败了,他们与梅克(Merck)制药公司合作提纯和克隆来自火鸡的红细胞的肾上腺素受体。他们的成功使这个领域的每个人都很兴奋,包括我。我召集我那失望的小组成员在一起,提醒他们这是我们研究领域的早期结果,大多数发现还有待我们挖掘。我们应该逐渐赶上他们并且充分利用莱夫科维茨的克隆人脑中的稀有肾上腺素受体这一突破性发现。

    为了取得进展,我们充分利用基因密码中的互补碱基对——双螺旋的2条单链——的连接方式。在他们那次极具洞察力的1953年的重大突破中,沃森和克里克已经通过碱基对配对的方式计算出一条DNA链是怎样轻松地被复制成一个互补链的。这反过来反映了当细胞分离时,它们是怎样复制染色体中的DNA的。在基因字母表中的4个碱基中,他们发现A总是与T对应,C总是与G对应。把双螺旋分成2条单链,这个简单的规则帮助生成一个互补链。同样地,如果你重组一串单独的碱基对,那个相同的规则就确保它会粘到一个互补链上——实际上,这就给你一个DNA探针,它与人类染色体的巨大环境中的一个单独基因相附着。

    我们以两种方式充分利用这个互补的碱基对继续探索人类肾上腺素受体的基因密码。首先,我们能利用已取得的小部分的人类受体蛋白质序列推断相应的DNA序列,并且用它作为一个探针搜索人类基因组中的基因。接着,我们利用进化遗产:火鸡肾上腺素受体基因很可能有一个类似的人类受体的基因密码。换句话说,我们从火鸡受体基因本身开发DNA探针:如果它们黏结在互补的人类DNA,它们就会显示相等的人类基因。通过把一个放射性标记贴到任何一种探针上,我们能通过确定探针附着处的放射性斑点来评估我们的成功。

    但是,仍然有一个实际问题有待克服。我们首先需要得到适合操作这些试验的人类基因组:甚至就像它在细胞里一样以染色体的形式打包起来,这个编码还因太大无法操作。把人类基因密码分裂成易处理的碎片对搜寻基因来说是至关重要的。如果你把人类细胞中所有的DNA补充物拿走,把它分裂成碎片,你最终就会得到科学家们称之为文库的东西。有两个基本类型的DNA文库:基因组文库和互补DNA文库。

    基因组DNA文库可以通过特殊的限制酶制造出来,利用这种酶把人类染色体切割成片段,每一片段大约由1.5万~2万个DNA碱基对组成。为了能处理这些人类DNA片段,我们也需要一个复制和储存的方法,就像一本书需要印刷和装订一样。在复制过程中,将人类DNA的每个片段都附着在一个噬菌体DNA上,噬菌体可以感染细菌,并且能够在其中繁殖。当这个经过处理携带的病毒被用来感染埃希氏大肠杆菌时,它携带着人类DNA。在皮氏培养皿表面涂上受过以上感染的埃希氏大肠杆菌,在细菌菌落上就会生长出清晰的斑点,病毒已经把埃希大肠杆菌杀死。这些斑点被称为空斑,它们包含数百万的病毒微粒——因此包含数百万最初人类DNA片段的复制品。

    互补DNA文库以细胞中的另一遗传物质信使RNA为材料,它被用来执行基因组的命令合成蛋白质。我们的基因密码只有3%负责编码蛋白质,所以集中RNA合成蛋白质,我们最终得到一份更简明的人类DNA密码的“工作副本”(一个典型的基因能包含100万个碱基对;相反,转录的RNA可能只有1000个碱基)。换句话说,这个文库揭示了一个方法:大自然的复制者把整个基因密码转录成一段相当小的信使RNA,它仅代表特定细胞或组织需要的基因遗传信息。

    信使RNA本质上是中转站。为了将它从细胞中分离出来,以便于直接解读,我们通过一种叫反转录酶的酶,将RNA复制成DNA的稳定形式。它被称为互补DNA(cDNA)。通过分离人类RNA产生cDNA,你将得到人类基因组的浓缩版本,其中包含易读形式的蛋白质编码基因。就像基因组文库,互补DNA文库的大小都必须处理成能够处理和复制的形式。大自然再次提供了解决方案。通过隔离在组织中工作的信使RNA,把RNA转变成互补DNA片段,然后把这些片段插到一个质粒中,它是一个小的环状DNA,并为细菌携带指令,互补DNA文库就被制造出来了。当埃希氏大肠杆菌被感染上质粒,它将再次为文库里的书提供“印刷机”。因为每一个细菌将包含人类cDNA的不同片段,当细菌复制时(分裂成子代细胞),亲代和子代细胞将包含相同的人类基因片段。

    尽管肉眼看不见这些DNA片段,但是用科学工具可以观察它们。稀疏地展开包含人类cDNA的埃希氏大肠杆菌,注意让两个细胞绝不会互相接触,单个的群体将开始生长。最终,当有斑点出现时,每个群体将包含数百万的相同细菌细胞(克隆体),所有这些群体都具有相同的人类cDNA片段。在一个小皮氏培养皿中,可能有几万到几十万这样的单个群体,从而得到一个人类DNA的巨大文库。

    使用任意类型的文库,利用互补DNA粘贴在一起的方法,搜寻受体的工作现在可以开始了。用一张滤纸就可能把DNA从皮氏培养皿中移出来,培养皿中正在用基因组文库或cDNA文库培养埃希氏大肠杆菌。然后将滤纸整夜浸入探测受体的DNA探针溶液中。为确定它是否被束缚在文库中的互补DNA上,探针被附加了放射性标记——通过与一个放射性核素32P交换DNA中的磷原子。然后清洗滤纸以便去掉没有附着任何DNA片段的放射性探针,然后晾干,放到一个X射线胶卷盒里好几天。阳性菌落和噬菌斑——表示放射性探针已经粘在目标DNA上——在显影的X线上呈现黑色斑点。将皮氏培养皿与胶卷重叠,阳性菌落和噬菌斑就能被识别,它们的DNA被分离和扩增。

    并不总是很容易发现不稳定的编码少量蛋白质的信使RNA。以一个难以捉摸的膜蛋白质为例,比如肾上腺素受体,在每个细胞中只有几千个蛋白质分子。结果,编码受体蛋白质的RNA信息也是稀少的。利用捐献给医学科学的人脑中的基因物质,我们必须检测超过100万的cDNA菌落,才能找到一个包含制造肾上腺素受体信息的cDNA菌落。一旦我们培养一个菌落产生一批足量的这种DNA,我们就能用测序DNA的过程把它解读出来——算出4个核苷酸(CGAT)的顺序,它们形成了糖和磷酸盐的DNA外部骨架中的“横档”。我们可以用两种基本测序方法来读出DNA中这些碱基对的顺序。一种方法是弗雷德里克·桑格在剑桥的英国医学研究委员会分子生物学实验室(Medical Research Council's Laboratory of Molecular Biology)里发展出来的,他是一个专注的研究者(同样也爱好划船),他曾经说自己是“有良好的思想,却不太擅长讲话”。第二种方法是哈佛的沃利·吉尔伯特(Wally Gilbert)的工作,他被描述为一个“政治掮客,一个有宏伟目标的男人”[1]。虽然桑格和吉尔伯特在1980年共同分享了诺贝尔奖,但是过去10年间完成的大多数序列是桑格设计的方法的一个直接扩展。桑格是一个有着惊人才能的科学家,他能解决生物界一些高难问题。1975年5月桑格因为他的首批DNA部分序列而得到大家的敬重,然后继续得出一个噬菌体基因组的首批完整序列:细菌病毒(噬菌体)的基因密码中有5375个碱基对,被称为φ-X174。接着桑格测序了大约17000个人类线粒体(我们的细胞中的能量工厂)中的DNA碱基对,标志着首批人类基因组工程的开始。考虑到他有这么多的显著纪录,桑格是双诺贝尔奖获得者就不足为奇了(第一次诺贝尔奖,是由于1958年他对于蛋白质结构的工作,当时他拆开了大约50个组成胰岛素分子的氨基酸),尽管他的学术影响巨大,得到同行的敬重,但是桑格是一个安静的、谦虚的、不招摇的人。他说:“我没有多少学术才气。”

    桑格在剑桥和阿兰·考尔松(Alan Coulson)一起开创的DNA解读方法涉及到用DNA聚合酶制造无数的DNA分子复制体。复制DNA聚合酶必须放在DNA的基本片段液中,即核苷酸中。酶从每一个源DNA链的末端阅读,用核苷酸制造新的复制体。桑格的贡献是把另一成分“末端核苷酸”加到这个溶液中,“末端核苷酸”的每个核苷酸用32P做放射性标记,这样命名末端核苷酸是因为,当它们在培养的复制体中合并时,它们会随着末端聚合酶的活动,用放射性周期标记培养链的结束。这一过程在任何阶段都可能发生,大量DNA分子复制体是在试管中制造的。结果是DNA不同长度的片段的混合物,每片段都是以放射性标记的C, G,A或T上结束,依赖于哪一个碱基标记32P。

    这些片段然后在电场作用下,通过平板凝胶,按DNA分子的大小被分离开。现在人们能读出它们的序列是因为DNA的最大片段在平板凝胶中移动速度慢。四个核苷酸上C, G,A, T的标记是相同的,都能在X线胶卷上产生相同的黑色标记,人们必须对每个片段进行四次检验,每次检验出对应密码中的一个碱基。一旦DNA聚合酶和每一个不同的终止核苷一起被识别(以便在一批中,所有的C都被标记,另外所有的G都被标记,其他两个也一样),它们就被分放在相同的凝胶平板体的4个邻近的泳道上。当片段分离后,一个泳道显示DNA片段以一个C结束,另一个就显示以一个G结束,其他两个也一样。

    然后将凝胶板烘干,对准X线胶卷放几天,出现四个黑色的平行泳道。接着研究胶卷,从四个碱基泳道的第一条泳道开始,然后移动至最近的泳道出现。如果最初,比如说最小的DNA片段在C区带泳道上,那么C就是第一个碱基;如果下一个黑色标记在A区带泳道上,那么A就是第二个碱基,以此类推。用这种辛苦的方法,每个样品按顺序记录每个碱基几百次,序列就出现了。这是一项单调乏味的工作,很多事情都可能发生而且经常出错。如果在凝胶平板上的四个泳道中的任何一个失败了,整个实验就毫无价值了;有很多次,泳道不能相互平行了,于是在凝胶平板中走得越远越不可能比较黑色标记和读出每个泳道上的缺口序列。凝胶板可能因为太干而破裂。当我们一天天地等待答案时,试剂可能变质了;几周过去了也可能不会产生任何有用的数据。

    我发现解读的过程特别令人丧气,因为我曾对分子生物学抱有很高的希望。我已经见过太多的例子说明科学进步很少是靠数据所驱动,更多是靠某个特殊个人力量或是某个教授的事业推动。我想要真实的,生活的经验事实,而不是那些通过其他人的眼睛过滤出来的东西。你或许有序列或许没有。在方法的局限内,它或许是精确的,通常因为马虎的操作它是不精确的。我注意到当碱基不清楚时,许多序列实验室经常作出一个猜测,而不是留下一个问题标记。经过几周的斗争后,我们发现我们能为人脑肾上腺素受体获得一个cDNA克隆。当意识到它的序列完全不同于火鸡的受体序列时,我们感到十分兴奋。我们在贝塞斯达的第一次重大成功正处在边缘上。

    但是,当我们确定序列的最后片段时,很清楚有可能我们还没有完成工作:我们正在失去基因的起始点,在这个点上,DNA通常有一个标记符号的基因对等物,就像前面所提到的,只有少量百分比的DNA与编码蛋白质的基因相对应。有大写字母和周期的基因对等物帮助细胞的分子系统区分它们。

    就像一个大写字母开始一个句子一样,大多数标志着DNA的蛋白质译码区的开始的基因,所谓的起始密码子,是以ATG开始的(编码蛋氨酸)。正如大写字母经常出现在句子中间一样,蛋氨酸也通常出现在蛋白质序列中,所以必须要有多余的信息核实一个ATG标志一个基因真正的开始。比如,一个人可以寻找一个邻近的终止密码子,它是处于DNA序列末端的一个分子周期,并告诉我们的分子系统何时停止合成蛋白质。

    因为我们知道我们只有一个来自脑文库的DNA片段和肾上腺素受体对应,我们需要另一个文库来找到剩余的基因。我们仅有的希望是从缺少的片段附近的DNA中制造一个放射探针,并用它来彻底搜查人类基因物质的第二个文库,以便发现基因缺少部分的一个互补片段。

    我们再一次海底寻针,尽管这次要测量的DNA的数量很少。在第二个基因组文库中,DNA片段平均长度是18000个碱基对,因此每个片段(克隆)仅代表了由30亿个碱基组成的基因组中的0.0006%。我们现在要寻找的是167000个克隆中的一个,而不是100万个克隆中的一个。在几周内,我们已经有几个可靠的线索可供检测。一个由18000个碱基组成的克隆看起来在它里面有基因的端点,所以我们开始给它测序。

    这个计划是行得通的,最后我们通过电脑拥有了完整的基因序列图谱,我的职业生涯的第一篇分子生物论文完成后[2],我们把它投到《欧洲生化学会联合会快报》(FEBS Letters),因为我认识那里的编辑乔治·西门萨(Giorgio Semenza),他许诺会很快发表。我们不久获得第一例人脑肾上腺素神经递质受体基因序列。鉴于我们不得不从受体蛋白质纯化开始爬陡峭的高山,计算出怎样解读密码,我们都感到好像完成了一件重要的事。看到DNA序列这对我来说是极美好的时刻,它曾是我幻想的一部分——走出漆黑的洞穴进入阳光地带。甚至是今天,一个人能利用人类的检测仪器和技术显现分子密码,好像仍然很不平常。这篇论文标志着我事业的转折点。我已经离开了一个安全的领域,在那里我曾经舒适地确立了自己的地位,现在我让自己和小组转向一门新学科——分子生物学。我们已经准备好前进了。

    但是那时对我来说显而易见的是,获得一个基因或蛋白质的序列只代表了理解肾上腺素工作方式的第一步。这段特殊旅程的终点标志着很多新的路程的起点。比如,通过把人类受体基因插入老鼠细胞,并培养它们,我们能大量生产用于各种实验的受体。我们需要做更多的测序来跟上我们早期的发现:一定范围内的神经递质受体随着相同抗体起反应。它们有着共同的进化遗产,为了巩固我们的这一信念,我们需要比较大量受体序列。我们的关于解读几个不同受体基因DNA的努力标志着我们进入了一个当时还不存在的,属于科学处女地的领域:基因组学。

    《自然》期刊最新发表的一篇文章也刺激我在科学事业中的这个关键性改变。那是加利福尼亚理工学院的李·胡德(Lee Hood)小组写的一篇文章,描述了一个有关可能提高DNA测序技术的问题。不是用单独的放射性探针,而是通过利用4种不同的荧光染料,4种不同的桑格序列反应在一个测序凝胶体上被合并成一个单独通道。当一个DNA片段朝凝胶体的底端移动时,被一条激光光柱滤过,光柱激活荧光染料。发光的染料很容易被光电倍增管探测到,然后被计算机记录下数据。4种颜色,代表不同的核苷酸,直接读出基因密码,把生物的模拟世界转换成微芯片的数字世界。

    我曾经与李·胡德和他的博士后迈克·亨克皮勒(Michael Hunkapiller)合作研究过受体蛋白质,现在我想再次与他们合作。我利用传统的放射性方法花了近一年时间给1000个碱基的基因密码排序,这段历程真令人痛苦,从李·胡德的文章我马上看到了加州理工的自动化方法的价值,我联系了他们,得知亨克皮勒要把这个方法进一步发展成一个商业性的DNA测序仪。他已经加入了应用生物系统(ABI),这是一家生物技术公司,曾做过DNA的合成仪。我与亨克皮勒还有本地的ABI销售代表谈了话,告诉他们我想买一台他们的首批机器。这对ABI是很合算的,因为国家卫生研究院的买卖会赋予他们技术上的声誉。经过多次讨论后,万事俱备,我的实验室将成为这批新的测序仪的首批测试者。现在我所需要的是偿付11万美元。恩斯特·福瑞斯(Ernst Freese)是我的研究所的基础科学部主任,他反对购买新的没有经过验证的技术,但是他愿意提供25万美元购买一个蛋白质顺序分析器。

    问题是我想研究的受体蛋白质量太少,这样一台顺序分析仪使用效率过低。福瑞斯和我对于蛋白质分析和DNA测序之间的相对价值发生了争论,最后我输了。几天沮丧过后,我想起这25万美元是国防部给我用于生物战争侦查工作的特殊款项。我告诉福瑞斯我强烈地要尝试这个新技术,我要用这笔钱并且对这次冒险负责。他肯定仍然反对我,但是我认为现在他已经被我的坚定打动了,于是订单给了ABI公司。

    1987年2月,国家卫生研究大院里的36号楼收到了一个不寻常的货物:它是我的新DNA测序仪。我的未来就在这个板条箱里。我对我这个婴儿感到很兴奋,为了解决实验室空间缺少的问题,我决定把这个仪器放在我自己的办公室里,我个人负责帮助建立DNA测序的新方法。在我旁边是技术员珍妮·高科因,她刚从布法罗获得硕士学位。我想她能很容易继续并且完成她的博士学位,尽管她好像没有信心,但我对她的技术有足够的信心,我让她用新方法帮我测定DNA序列。

    我们很快就开始了工作,检查了仪器的每个部分。这项交易的最后一项是“电泳盒”,它包含一个垂直的测序凝胶体,大约有一张标准文稿簿大小。凝胶体有16条泳道以便16个样本能同时移动(因为我们必须移动4个标准样品以确保仪器正常工作,实际上,它只能处理12个样品)。在凝胶体的底部,是一个扫描仪,来回读出从荧光染料发出的任何信号,然后发送到计算机。一个单程操作需16个小时产生数据,而用旧方法则需要1周时间。

    熟悉测序仪花了几个星期,我们很快就看到了很好的数据,每个DNA样品有200个基因密码碱基对。问题是仪器的软件是原始而不可靠的,当珍妮和我轮流读出色峰,而其他人记录基因密码时,问题出现了。人工能直接读和识别的特定序列模式,比如标记基因开始和限制酶捆绑点的ATG密码子,机器却不能。后来,我们的软件工程人员花很多时间使计算机能完成珍妮和我用经过训练的眼睛很容易做成的事。

    在DNA排序过程中,一个重要的阶段是DNA聚合酶的使用,这是复制DNA的酶,在一小片叫作测序引物的DNA片段的辅助下工作。想象一下将缺失的铁轨修补完好的修路过程,你就能大致描绘出聚合酶和测序引物一起工作的图像。铁轨代表了DNA双螺旋,铁路工代表DNA聚合酶,开始把新铁轨放在两段完整的铁轨处,DNA聚合酶可以被一小片捆绑到DNA序列特定碱基的合成DNA(测序引物)诱导在DNA上的特定点开始生成一小段双链DNA。

    当我和内森·卡普兰作为一个生物化学家一起培训时,我学会了精确地测量每样东西,检查所用试剂的纯度,而不依赖于提供商所声称的纯度。每次我操纵机器,都要测量DNA和测序引物的质量,在化学反应中的反应物和产品之间生成恰当的比率。对于细节的关注是至关重要的,ABI告诉我们,最初没有人能与我们从测序仪中得到的结果相比较。事实上,很少有人得到过结果。他们的大多数消费者都很失望地退还了他们仪器。我们感到我们已经在该仪器上取得了足够的进步,我们测序两个新的受体基因,一个是我们从老鼠心脏分离出来的β-肾上腺素受体,该受体改变对应肾上腺素受体的心脏泵的活动;另一个是蝇蕈碱受体,它通过迷走神经作用降低心率。我们很快给这两个基因测序,1987年秋天,我们在《国家科学院学报》上发表了我们的结果,它们是第一次通过自动DNA排序法得到的数据,这个方法仅在一年前我曾在《自然》杂志上读到[3],而我现在的科学事业与那时已大不相同。

    现在我们已经克隆、排序而且制造肾上腺素受体,我们已能利用分子生物工具探索一些有关受体结构和功能的问题:什么使它识别肾上腺素?一旦它和肾上腺素捆绑在一起,接下来会发生什么?受体分子实际作用是什么?什么成分控制了它的合成和降解?在细胞膜中它的分子结构是什么?

    这些问题的关键是确定它的细胞膜内的三维蛋白质图像。一个蛋白质的复杂形态不能轻易地从它的DNA序列推断,解决这个问题仍然是生物学的重大挑战之一。这个知识是至关重要的,因为当大量分子中的一个围绕我们的细胞游弋时,它具有适当的形态和适当的电荷去捆绑一个受体,该受体能产生一个至关重要的反应比如使心脏跳动更厉害或者调整细胞生长过程。

    每个研究肾上腺素受体分子结构的人已经注意到一个重要结构特点:根据计算机的预测,7段氨基酸将形成一个螺旋形的形态,一个α螺旋体。这些螺旋体试图跨越细胞脂膜。从细胞外部到内部,受体分子都是重要的交流者,记得几年前我的玻璃珠子实验已经帮助证明了这一点。肾上腺素受体穿越膜7次;我们推测大概7个“手指头”形成一个口袋可以抓紧肾上腺素,这样多少改变了剩余的受体分子从而显示信使化学物的到来。因为脂细胞膜外部的环境包含水,我们认为与肾上腺素在一起的氨基酸应是亲水的,它们带负电荷,因为肾上腺素带正电荷;我们确实发现一些氨基酸具有这种特性。受体序列中其他氨基酸,比如脯氨酸通常在蛋白质结构中发挥作用,它会产生不规则角或扭结。

    当时,我们甚至知道如果我们重新设计受体蛋白质那么会发生什么事情。利用一种叫作“定向诱变”或者“蛋白质工程”的分子生物技术我们可以做一些奇妙的实验,比如对受体基因的基因密码做一些改变,我们能改变氨基酸的序列,从而改变蛋白质结构。以这样的方式,我们就能开始解剖这个难以捉摸的分子的内部构造,研究改变了的受体蛋白质怎样有效工作——比如,它是否仍然与肾上腺素黏附在一起,是否会有其他药物也喜欢和它黏附在一起。另外,如果是这样,受体的行为是否还和它以前遇到肾上腺素一样?

    这里我必须承认我是一个老派的生物化学家:我不仅喜欢思考改变蛋白质形态的突变,而且喜欢思考这些改变从生物学角度看是如何反映出来的。很多遗传学家满足于发现一片DNA和一个特性有联系,然后就停留在那儿。对我而言,那就像追星族碰到了认识名人的人一样,“我有一个朋友认识麦当娜。”但是我想要得到更多的信息;我想知道更私密的事,而不仅仅是麦当娜的二手知情人。就此事而言我想懂得如何激活麦当娜以及每个人的受体生物规律。

    最终我们多次改变受体蛋白质氨基酸。1988年,我们发表了两篇重要的论文,论文描绘了我们发现氨基酸影响肾上腺素分子黏附和激活受体的方式,奇怪的是它对β-神经阻滞剂药物没有影响,但是该药物也是黏附在受体上的,比如心得安。我们从这个发现中得出结论,黏附在受体的催化剂,比如肾上腺素(所谓的兴奋剂)上的受体蛋白质上的斑点不同于附着在像心得安这样的拮抗性的受体阻滞剂上的受体蛋白质上的斑点。我们以前对于受体是如何工作的简单描述现在要修正了。激素总是被认为像插入锁里转动的钥匙一样工作——锁是受体——而拮抗剂只是不理想的不能打开锁里所有机关的钥匙。现在看起来似乎它们能够在锁的不同部位上作用以防止它工作。

    如果我们有一个模型显示肾上腺素受体真正像什么,那么这个推测就容易多了。我记得我第一次加入卡普兰的实验室时,苏珊·泰勒曾经通过X射线晶体学得到乳酸脱氢酶的三维结构。根据她的数据设计的0.11立方米的蛋白质模型,显示了在各种各样包括植物和动物的有机体中,酶是如何催化丙酮酸盐和乳酸盐在基本新陈代谢中的互换的。我想为肾上腺素受体做相同的实验。但是为了给受体“拍照”,就需要对晶体状的蛋白质进行X射线研究,这需要提纯的受体蛋白质质量达到克单位——相当于我们那时能得到的受体蛋白质的100万倍。我仔细查看了文献,发现有人用酵母大量生产蛋白质并获得成功,所以我雇用了一位专家,迪克·麦克白(Dick McCombie),让他为X射线研究生产足够的蛋白质。

    大概就在这段时期,我也第一次讨论了有关一个项目的问题,这个项目有一天将把我的研究推进到举世瞩目的中心位置。当我花大部分工作时间仔细调整我的自动化DNA测序仪时,我开始追忆一些早期的讨论项目,那就是测序人类全基因组的不切实际的想法。[详细内容读者可以查阅杜克大学的基因讲解员罗伯特·库克·迪根(Robert Cook-Deegan)所著的《基因战争》(The Gene Wars)一书。]其中一场讨论是在1985年5月由加利福尼亚圣克鲁斯大学的罗伯特·辛舍梅(Robert Sinsheimer)组织的研讨会上进行的。他曾经认为像这样一个大型生物项目能使他的大学从此出名。研讨会我也参加了,位于拉荷亚的索尔克学院的诺贝尔奖获得者瑞纳特·杜尔贝克(Renato Dulbecco)在《科学》杂志上提倡给基因组测序以帮助赢得抗癌战争,英国医学研究理事会的悉尼·伯伦纳(Sydney Brenner)也力促欧盟承担一个协议项目。人类基因组的讨论还被查尔斯·德利斯(Charles DeLisi)推动,他是能源部的一个数学生物学家。能源部的介入似乎出乎意料,但是实际上它早就被要求提供辐射对人类的影响,尤其是第二次世界大战中在广岛和长崎遭受原子弹袭击后的幸存者(受原子弹影响的人)的基因密码所受到的影响。

    人类基因测序的想法被当时多数人评价为除了不可能就是错误,自然遭到了国家卫生学会的反对。[詹姆斯·温家登(James Wyngaarden)是反对派首领,他讽刺说能源部基因解密计划好像“国家标准局计划建B2轰炸机一样”][4],甚至伯伦纳也开玩笑说这项工作如此宏伟艰难,技术太有限以至于测序任务应该当作惩罚性劳动交给罪犯去做——一个罪犯派给1200万对碱基的测序任务。这时我被建立一个人类个体基因序列总数据库的想法摄住了。10年里,我的大部分时间花在试图解码大约10万个人类基因中的一个。如果15~20年的巨大努力可以检测出整体的人类基因的结构,那么我将全力以赴。像其他领域一样,我的领域将肯定会从此受益。据我了解,仅有的真正意义上的争论在于这项工程是否切实可行。运用以前桑格的方法显然是不切实际的,我们要忍受放射性标记、凝胶体破裂分叉无数次的挫折;而在基因组上使用自动化的方法这一切将大为改观。我开始更多地考虑我如何展开这样一项艰巨任务,我将不得不扩大我的实验室,但是在国家卫生研究院的真正的资产是有限的。与恩斯特·福瑞斯(多亏了我的成功,他对测序理由有了转变)和欧文·柯宾(Irwin Kopin)——后者是国家神经紊乱和中风研究所(NINDS)的主任——讨论过后,我在马里兰州的罗克维尔的帕克劳恩大楼里有了一席之地了,在美国食品和药物管理局的街对面。这次迁居可以让我的项目扩大4~5倍,我的小组也扩大了,又增加了二十多位科学家。

    尽管如此,这个决定并不是直截了当的。要移出研究大院我感到很不自在——这个地方曾经是如此珍贵,我的同事们曾经为他们占用36号大楼里哪一层楼而对簿公堂。但是我要去帕克劳恩出于两个动机:那儿缴纳的管理税最少,而且我将进入新大楼(49号楼)的计划编制委员会,这样当它建成后我就可以把我的小组整体搬到科学院的主阵地。我同意1987年8月搬到帕克劳恩。

    那时,大多数人都嘲笑用ABI仪器来处理人类基因组的研究项目。日本人已经提供了一个替代产品,在1987年,日本人以头条新闻宣称他们计划建造一台新机器,每天能够给100万对碱基测序(这个目标最终调整到一天1万对)。但是对我而言,如果你有一台缝纫机,想加倍你的产量,你就得增加第二台机器,为了加快我们的DNA测序速度,我们需要第二台DNA测序仪。我知道,通过给我的实验室增加几台ABI仪器,我就能达到日本人的目标。最简单的答案就是平行处理。

    我开始与福瑞斯协商给我增加75万美元的年度预算,以便我能买更多的DNA测序仪。福瑞斯尽管害怕其他实验室的主管会抱怨我过大的预算,但是他通过给我的实验室配件贴上国家神经紊乱和中风研究所DNA测序设备的标签的障眼法,避开了这个问题。这个策略使我能够得到我要的机器,只要我为同行们提供他们研究中涉及的DNA片段测序。我同意了,因为我知道没有多少分子生物学研究在神经紊乱和中风研究所进行,所以也就没有那么多测序要求。克莱登·加达塞克(Carleton Gajdusek)是一个例外,他曾经因为研究库鲁病赢得了诺贝尔奖,这是一种不常见的大脑疾病,与牛脑海绵体病(疯牛病)有关。我又另买了三台测序仪,我的实验室立刻变成世界上最大的DNA测序中心。

    当我如饥似渴地马上开始测序工作时,很明显我们手边没有有效的方法以便我们可以以一种划算的方式进行测序。我们需要制订一个策略以便很好地利用自动化测序机器,而且要考虑到它们一次只能处理几百对DNA碱基序列的实情。

    一个策略是从一个单程制造出最长的序列,一次读出几百对碱基。然后,将该序列末端的DNA密码,作为新序列的引物,它将标记仪器接下来读出的几百个相邻DNA序列字母的开端。这个过程将被一次次重复直到基因结束或达到正在考虑的DNA片段。这个技术被称为“引物依次推进法”,要花几天时间,因为每一步都得制定一个新的引物。引物依次推进法甚至比使用ABI测序仪耗费更多的时间、精力和费用,因为引物不是简单的DNA延伸,它上面涂有荧光色的化学附着物。我很清楚引物依次推进法并不实用,不能排出好几万对碱基,更不用说数十亿的人类基因组了。(虽然我很清楚这一点,其他人并不是这么清楚。这个问题争论了好几年。)

    引物依次推进法的首位替代方案是小克隆霰弹枪测序法:把有1.8万~3.5万对碱基的长的复制体粉碎成足以被测序的碎片,然后计划好怎样把短序列再连接到一起。根据DNA被粉碎成小片的方式,这个方法有几种不同的版本。在佛瑞德·桑格1982年的使用λ噬菌体解码4.8万对碱基的开创性工作中,他没有采用真正的随机(霰弹枪)方法,而是用了一个新颖的方法打破或是分割λ基因组。他利用了另一位诺贝尔奖获得者汉密尔顿·史密斯(Hamilton Smith)的研究结果,史密斯曾发现了限制酶,这是一把分子剪刀,能够把DNA精确地在特定序列上分割,比如,限制酶ECORI可以切割序列GAATTC,但是其中如果有一个字母改变(如GATTTC),那么限制酶ECORI就不会动它。把DNA用不同的限制酶分成足以测序的小片段后,桑格利用一个特殊的正在研究中的DNA基因图谱重建λ基因组,这个图谱显示限制酶作用的DNA片段上的位点,所以它能被桑格用作界标,使一个序列片段与另一个连接起来。

    想象一下,你正在根据一条规则(等同于限制酶)剪切一份纽约时报:只要单词“和”(with)出现在页面中,你就必须剪掉单词“今天”(today)前面的一部分。现在用单词“和”和“那”(that)来重复这个过程。即使一个人不会阅读,只要知道做剪切试验的每张报纸上这些词的特性(限制位点),就能帮助把报纸再次放回一起[5]。对于病毒,桑格的限制酶方法是唯一有效的手段,但是因为它是手工操作的,又慢又乏味,所以它不能为细菌基因组测序提供有效方法,更别说为30亿碱基对的人类基因组测序了。

    正值DNA测序的工作全面展开之时,我们的受体研究也迅速发展。我们在果蝇(Drosophila melanogaster)中寻找肾上腺素受体的对等物,它是生物学中最集中研究的生物之一。我们隔离并排列果蝇的基因,叫作真蛸胺(octopamine)受体,它可能是我们自己的肾上腺素受体的进化先驱。在昆虫中,化学信使真蛸胺发挥了类似兴奋或沮丧的作用,就像肾上腺素对人类的作用一样。我的真蛸胺研究取得了很大进步,不但在国际会议上发表演说,同时又为生物技术和制药厂做一些顾问工作,我越来越受到大家的欢迎。但是这条20年前自从我走进卡普兰的实验室就遵循的研究路线现在要结束了。

    我很幸运地处在一个鼓励开辟新途径的环境中。因为我的实验室在国家卫生研究院内部规划中,我的研究预算可以让我安全地冒大险。我大多数同僚们宁愿谨慎些,尽管我们允许冒险,我们不必写资助申请,而且也摆脱了保守派的评论,在那场无休止的竞争中,资金有限,委员会成员们宁愿资助那些他们感到安全的项目和人员。人类基因组学提供了足够的诱惑鼓励我跃入一个未知的领域,尽管我们这项工作能带来的好处还不确定。

    我可以转入基因组学研究,同时为保险起见,也保留自己的受体研究以防失败。但是在国家卫生研究院工作5年后,克莱尔仍然没有得到终身职位,而且好像也不可能得到了。因为她是我实验室众多成员中的一员,对于委员会而言,不可能区别她为最成功的项目所做的独特贡献。幸运的是,国家酒精和药物滥用研究所想建立一个受体研究实验室,给她提供了一个建立自己小组的机会。我不想解散我原来的受体研究课题组,也不想让她从零开始,我正打算在刚刚出现的基因组学领域建立一项全新的事业,我只把组里对这方面感兴趣的人带走,而让她来接管我的受体工作。

    这个决定似乎很符合逻辑,但是却是一个难下的决定。我不仅要在职业上与我曾经一起愉快地工作过的同事们分道扬镳,而且我还要离开我努力了19年的受体领域研究,不管成败与否。如果在基因组学方面的新努力失败了怎么办?这个新安排对于我们的婚姻和日常关系有什么影响?我把转移看作是我们实验室的离婚:克莱尔将照看我的受体宝贝,我将拥有基因组学。另一方面,我希望这次转移会加强我们的关系,因为克莱尔现在能够得到更多关于她的工作的客观反馈,由于自己的努力,她会感到更有成就感。

    进入人类基因组学领域意味着不仅要跟上科学团体的速度,而且要跟上科学政策的速度。我很幸运,因为当我迈出了我的第一步时,我遇见了雷切尔·莱文森(Rachel Levinson),她的丈夫兰迪在克莱尔的新研究所工作。雷切尔是被国家卫生研究院主任詹姆斯·温家登任命的新工作组的行政秘书,该工作组考察国家卫生研究院所能提供给人类基因组学研究的贡献。我喜欢和雷切尔谈话,她很漂亮,而且知识渊博。雷切尔建议我同国家综合医学研究所的露丝·克什斯坦(Ruth Kirschstein)谈谈,因为露丝想确保任何一个NIH基因组成就都出于她的研究所,接受她控制和指导。雷切尔安排了一次见面以便我能告诉露丝NIH内部计划中的DNA测序情况进行得怎样。雷切尔1988年2月29日至3月1日在弗吉尼亚的雷斯顿组织了一个重要会议,我被邀参加。她代表温家登努力使国家卫生研究院在基因组研究核心的位置被确立。

    复杂基因组的专案咨询委员会的几项任务是令人难忘的。这是我第一次与人类遗传学领域的主要参与者相遇,比如诺贝尔奖获得者戴维·巴尔的摩(David Baltimore),沃利·吉尔伯特和吉姆·沃森。会议也标志着基因组领域研究的真正开始,会上温家登作了一项惊人的宣布:吉姆·沃森要来国家卫生研究院担任新成立的人类基因组研究办公室的副主任,给这个项目提供更需要的科学可信度。

    沃森的任命产生了许多暗流,是接下来几年中基因组研究的主旋律的序幕,这个主旋律就是激烈的政治斗争、游说和操纵。尽管沃森本人承认对摆在眼前的挑战感到不自在,但是一个见多识广的评论员相信留给他的这个职位是“权力的吸引,但不能像统治科学的未来那样统治人”。[6]

    我在雷斯顿听到的一些关于项目方向的说法令我震惊。沃森争辩说,我们的目标是搞出序列,让未来的一代科学家为怎样理解它而操心吧。我一贯相信确定对于测序是否有效的关键就是对序列的解释。许多出席的人同样争论说一旦我们有了基因组序列,我们也只是通过一台个人电脑找到了实际的基因所处的位置而已。但是真正的生命从来不是那么简单。另外一件惊人之事是,李·胡德把他们小组所研发的ABI测序仪描述成相当于亨利·福特的A型车,他想在认真测序之前花几年的时间建造一辆法拉利。

    我只是想继续做它。会后,我去看恩斯特·福瑞斯,告诉他我将承诺在基因组学方面有所提高,而且我需要他的支持,因为我的预算依赖于他。他很大方地给予支持,但是又警告说,因为我们所可以授权研究神经性疾病,为了获得他的支持,我将必须以与神经性疾病和大脑相关的基因组区域为目标。这似乎像一个合理的妥协。我离开之前,恩斯特提到他几年前就已经是沃森的博士后了,当沃森成为国家卫生研究院基因组中心的头头时,恩斯特承诺把我们联合起来,所以我能给沃森看我的DNA序列数据。

    我认为有几个基因组区域可能对于我的序列研究来说是块丰产田——比如说,X染色体短臂的尖端,那里有很多与疾病相关的基因已经图谱化,其中包括X染色体断裂,一种智力迟钝型疾病。另外一个有前途的位点是4号染色体的短臂尖端,那里我们希望找到亨廷顿疾病的原因,这是一种神经退化的毁灭性疾病。为了使我的研究保持在受体领域,我将同步收集受体基因的图谱数据。阅读和讨论过许多次后,我开发了一个测序X染色体的初步计划,作为启动人类基因组工程的方式。我现在知道在一个陷入困境的领域里,是不可能启动任何东西的。在实验室政治中,科学和数据只能位居第二,次于人格、骄傲和自负。

    沃森到达国家卫生研究院大院后不久,恩斯特·福瑞斯组织了会面,他和我一起步行到一号大楼,他在那里有他的办公室。简单介绍后,我给沃森出示从我实验室里的测序仪上读出的信息,告诉他我认为这些数据很好,可以继续关于人类染色体的工作了。他问我脑子里是否有具体计划,我呈递给他有关我的X染色体的计划。吉姆对我提供的数据和数据质量很感兴趣。他告诉我就在前天他拜访了李·胡德在加州理工的实验室,胡德甚至没有试图使用他自己发明的自动化DNA测序仪,而是使用了老式的放射性方法。为什么当其他每个人都放弃了ABI测序仪时,我却成功了?我告诉他有关我在测序过程中所做的努力,尤其获得了正确的化学引物。他询问起我的科学师承,我告诉他我怎样跟着生物化学家内森·卡普兰受训,“这就可以解释一切了,”吉姆说,“你是一个生物化学家。”

    甚至今天,一想起我是如何误解这个评论我就发笑。我当时就以其字面意义上把它当作对我的恭维,因为我自己对于我的训练很自豪,它延续了四代生物化学家,只是后来我才知道沃森对生物化学家并不十分尊敬。几年后,在一个国家卫生研究院组织的庆祝我们的人类基因组序列的座谈会上,我开玩笑说我很愿意回首过去的好日子,那时最坏的事情莫过沃森曾叫我“生物化学家”。

    吉姆问我需要多少钱才能开始。我回答,100来万美元吧。但是沃森坚持说这些钱不够,要开始X染色体的测序,要花500多万美元。他让我列出500万美元预算的清单。他会出席第二天的国会会议,并且他将要求国会增加预算以便我们能进行实验。

    在他的证明陈述中,沃森的言词很动听。他说我有世界上最好的测序实验室,他需要500万美元开始测序X染色体。在那段时间,在长岛(离纽约城大约60千米)的冷泉港实验室的一个草坪露天宴会上,沃森作为主任,自夸说:“人类基因组工程将要成功,我有这个小伙子,他能使自动测序仪工作起来。”[7]我在空中飘起来,自信我对X染色体测序做的努力一定会得到许可。我将领导第一次资助基因的人类基因组计划。

    我很快拟就吉姆要求的建议草稿。但问题是,不管出于多么好的意图,沃森是一个联邦政府的官员,像其他政府官员一样,他害怕自己做决定。一周后,在一次国家卫生研究院的会议上,很多人表达了对开始测序是否太早的顾虑:是否把资金花在基因搜索上,或者花在寻找基因组的地标(图谱)上更好一些?也许这种疑惑被以学院派为基础的研究者们表达出来并非偶然,他们没有想到他们一直觊觎得到的一大笔钱会用在国家卫生研究院的机构内的研究者们身上,而不是他们自己身上。但是吉姆比较好战,他指定我是启动工程的表率,解释说他想资助我的小组做一项有关X染色体测序的示范工程。

    罗伯特·库克迪根回忆说,测序政治是“多么的强烈,因为在分子生物学家中,对于大规模的测序,有相当多的反对者,甚至对于典型有机体,比如酵母、线虫和果蝇的测序也一样。当开始为人类DNA测序时,这些反对甚至更强烈……关于理想的测序方法和最好的策略也有相当多的争执……这些激烈的反对迫使沃森减少了他当初的承诺。”[8]

    沃森后来告诉我他想从我这得到一个更长的建议稿,大约20页,这让我感到他要遵循某一类型同行评论过程,不仅仅是推动我的计划。不久我意识到这项表面很合理的要求给我带来了麻烦,因为我一旦同意,我就要开一个可怕的先例。在这里,我是一个不需要任何资助的部门内的科学家,却要申请一个外部资助项目。在一次公开会议上,包括桑格在内的几位年长的科学家指出了我正在犯的错误,桑格已经和沃利·吉尔伯特一起研究他的测序方法。国家卫生研究院的科学家们总是很担心把院外同行的评议引进内部项目上,他们完全不打算为他们的研究而写资助申请。我能感到500万从我指间溜走了,这都是因为一刀切这种官场瘟疫。吉姆向我保证那不是问题,他催促我交给他一份书面材料。

    和我的小组花了几周时间辛勤地起草了一份有分量的研究计划后,我决定在冷泉港沃森领导的一年一度的实验室春季会议上亲自把文件交给他。他的反应并不快,姗姗来迟的反应也只是他以前曾经说过的话的较长版本而已:科学团体只是没有准备好基因组测序,如果他的支持者们、同盟者们和顾问们认为他要偏袒我,是因为我是国家卫生研究院的内部科学家,他会疏远他们。

    现在这些建议者们想让我写一份成熟的国家卫生研究院外部资助申请项目计划,这份计划应该包括这项研究领域的全景,不仅要包括我必须提供的我的团队现状,而且要考虑了来自像李·胡德和沃利·吉尔伯特这样的竞争对手的现状。我对于沃森个人、他的领导能力以及他履行自己诺言的能力的评价又跌了一个等级。

    也许这是笼罩在我的研究事业之上的阴云的前兆,这时候我决定该检测我的航海技能了,我渴望经历一次海上暴风雨。那时,我用我心爱的凯普岛瑞25D换取了一个大点的凯普岛瑞33,以一颗星星命名它为“天狼星号”,这颗星星位于猎户星云中大犬座之后,是天空中最亮的一颗星星。两个夏天里,我从切萨皮克海湾环游了1600千米,向东沿大西洋沿岸航行至科德海角,然后返回。我已经经历过一些暴风和恶劣的天气,但是现在我感到天狼星号和我正面临一次更大的挑战。暴风雨充满了浪漫和恐惧,两者给了我充分的理由来承受其中的任何一方。

    对于东海岸的水手们来说,这里很明显可以赢得一枚“蓝色水域”勋章:航行1100千米去百慕大。这样,我将穿越神秘百慕大或者魔鬼三角地带,它位于百慕大岛屿、迈阿密和圣胡安之间,百慕大群岛以经常出现莫名其妙的失踪事件而出名,曾经有5架携带战术弹道导弹的战机“复仇者”在起飞后不久就在这个区域消失了,还有油轮“独眼巨人”无痕迹消失等。魔鬼三角地带是地球上仅有的指南针指向正北的几个地方之一。在百慕大也能感受到墨西哥暖流的强大力量,这是大西洋中一股强大的暖流,在墨西哥海湾形成,由佛罗里达流向海特拉斯角,向上至南塔基特海岸,然后到达欧洲,这股暖流使英国远离了冰河世纪。墨西哥暖流产生了它自己的天气,尤其当风迎着海流方向刮时,风把海浪刮得又高又陡。但是这些水流也养育了多种多样的海洋生命,大量的海豚和鱼类聚集在那里。

    虽然我很大胆,但并不是莽撞之徒,为了避免飓风,我决定在5月初航行。尽管我最初尝试着独自航行,但是我错误地认为有一名船员将会更安全些。达里尔·道尔(Daryl Doyle)也想横穿大洋,他是位于布法罗的纽约州立大学的生物学主席和教授,他曾经在伊利湖上航行过(达里尔在2006年去世)。达里尔带来了他的朋友赫伯(Herb)。我们装载了燃料、几听金枪鱼和丁提穆尔炖牛肉,于1989年5月14日在盖尔斯威尔告别克莱尔出发了。我告诉她我将在5天后在阳光明媚的百慕大见到她,我故意没有核查天气预报,想在没有任何预先警示的情况下处理路上遇到的一切。

    风很轻,我们的行程很慢。当我们越来越艰难地漂过明镜似的水面时,达里尔做了意想不到的事,他对着大海大叫引诱海神:“我宁愿要飓风也不要无风!”有人正在听着呢。17日早上9点钟,海浪高达4米多,而且继续推高。到下午3点,我们确信我们已经驶出了墨西哥暖流,希望海浪能低一点,事实却正好相反。收音机天气预报说百慕大有暴风雨。我的航行日志上也记载了这次“垂直的蓝色海水”,到下午6点,风如此猛烈以至于我们不得不落帆航行。由于船有被海浪打翻并颠覆的危险,所以我配置了大风骑士,它是一个半球形的重型袋状织物,用大绳拴在船后,使船尾始终接触海浪。

    坐在这么一条小船的操舵处,在大浪之间穿行心情又舒畅又充满恐惧。立起的浪峰和我们的桅杆一样高,16米。当海浪开始破碎并把我们的船尾向旁边推时,大风骑士又把我们拽回来,像一个伟人从灾难中把我们拯救出来。18日的午夜,风速降到了25或者35海里/小时,但是全体船员已经筋疲力尽了。就在我一打盹的时候,赫伯确定我们无法从百慕大三角中安全通过,他以90°的转弯改变了我们的航线,避开百慕大三角,把我们所有人都置于危险中。

    当我发现他所做的事时,我很生气,我把两个同行的船员送到下面过夜,关上船舱盖。直到现在,我已经30多个小时没合眼了,达里尔把我们所有的咖啡豆都散落到舱底了,因此让我无法有效地集中注意力。在这种紧急情况下,我服了安非他明。穿上我应对险恶气候套装——充气式救生夹克,系上安全带,随身听里播放着罗伊·奥比逊、埃尔顿·约翰的歌声,我以9海里/小时的速度兴高采烈地在月光下的大浪中一上一下地航行着,离陆地有几百千米,这是我一生中度过的最不可思议的航海之夜。

    第二天早上,暴风雨停了,我打开舱门,让达里尔和赫伯把他们的安全带系上,出来掌舵,而我要加固一个地方。后来从他床垫的情形我知道了,在暴风雨最高峰时赫伯已经十分害怕,他躺在铺位上尿裤子了。现在他一看见巨浪,就惊慌,努力把船转向,以致于大家互相碰撞,几乎要翻转过来。海水倾泻进舱口,我冲上甲板,发现赫伯正在水里把船向后拽,他的安全带救了他。我没有看见达里尔,下一个浪把赫伯冲到甲板上,重重地撞了一下,当我把船转回原航线时,我发现达里尔像一块湿抹布一样垂在帆下桁上。安全带没有在他身上,而是在他旁边悬挂着。

    我们最后在5月22日凌晨两点钟到达百慕大,这已是出发后第8天,共行程1500千米。我的两名船员直奔飞机场,我给克莱尔打电话,她那时确信我已经丧生了。就在我感到最兴奋、感到生存有望的时候,她已经核查了保险金条例(我把另一条船命名为百慕大快感号纪念我的这种感觉)。克莱尔第二天来看我,但是我没有陪她多久,我连续睡了两天。那时我并不知道,百慕大之旅将标志一场战斗的开始,这是一场更漫长、更艰辛、更有意义的生存之战,在这场战争里,我的科学、我的婚姻和我的名誉几乎处于危如累卵态势。当我完成了人类基因组的测序这段航行时,我同样感到难以置信地高兴,那种震撼人心的喜悦与11年前去百慕大时感受到的一样。

    回到国家卫生研究院后,我再次回到撰写X染色体的测序计划中来,这项提案现在已经完成了60多页。如我所担心的一样,因我而导致的内部项目争议已经形成相当大的敌对派,所以我决定在人类基因组学界中寻找同盟者。我联系了托马斯·卡斯基(C.Thomas Caskey),他当时是贝勒医学院人类遗传学系的主任和X染色体的专家,他同意与我合作。当我和里斯合作的时候,他建议我从Xq28号染色体的短臂处开始,这段基因上映射了很多疾病基因,包括X染色体断裂。汤姆的实验室正和埃默里大学的一个年轻研究者斯蒂芬·沃伦(Stephen Warren)合作,他已经组合了一个柯斯载体克隆文库——大约有3万碱基对长度的几段人类DNA——这几个片段覆盖了Xq28区域很多次。沃伦和安东尼·卡雷诺(Anthony Carrano)一起工作,后者是劳伦斯里弗莫尔国家实验室(一个能源部的实验室)的人类基因组工程的主任。为避开国家卫生研究院内、外部资助的争议,我把我宏伟的1989年的计划打印在空白纸上,而不是外部资助表格上。我们的目标是用12年完成X染色体的测序,但是计划真正的主旨是计划3年时间测序Xq28的420万个碱基对,同时减少每对碱基对测序费用,从3.5美元降到0.6美元(今天,我们的费用是每对碱基0.0009美元)。

    我最终收到了一封信,这是一封面试函——“反向实地访查”——安排在1990年3月29日,在弗吉尼亚州阿林顿市的水晶城万豪酒店。当时人类基因组研究中心有一个特殊的评论委员会,由许多科学家组成,这些科学家都有意于在未来的基因组测序方面担任主角。其中包括来自剑桥的巴特·巴瑞尔(Bart G.Barrell),来自斯坦福的罗纳德·戴维斯(Ronald Davis),来自索尔科学院的格伦·埃文斯(Glen Evans),来自冷泉港的托马斯·马尔(Thomas Marr),旧金山加利福尼亚大学的理查德·M·梅尔斯(Richard M.Myers),俄克拉何马州立大学的布鲁斯·罗和布鲁克海文国家实验室的F·威廉·斯达蒂尔(F.William Studier)。简·彼得森(Jane Peterson)代表沃森基因组中心参加面谈。

    在这次沉闷的相遇几年后,几乎每个委员会的成员都接着申请由自己的中心来做基因组测序工作。那天我出现在他们面前时他们似乎为一个目的所联合,现在想来这个目的就是:在他们做之前,阻止任何其他人得到任何钱。询问列表很清楚表明,委员会认为技术尚不成熟,基因图谱不够,我们没有计划一个新方法。当托马斯·卡斯基正准备飞回得克萨斯时,他告诉我这是他职业生涯中最感到羞辱的一次经历。

    我后来得知有两份竞争计划已经争取了委员会的同意。一份来自李·胡德,他计划测序T细胞受体区域,这是身体免疫抵抗系统的主要部分;另一份是沃利·吉尔伯特,他计划测序的首个活物种的基因组,为微生物山羊支原体(Mycoplasma capricolium),它会引起绵羊和山羊的肺炎。最主要的是,他想尝试一种没有任何早期数据说明的能真正奏效的新方法。

    沃森和我一样担心基金评审的结果,他告诉我如果我愿意再次尝试的话,他将设立一次新评审。后来的几个月,我们协商了修订后的计划要包含的内容,以及提出其他供研究的染色体。艾文·科克尼斯(Ewen Kirkness)是我实验室的一名博士后,他已经提取了不同的神经传递素γ氨基丁酸的受体,并且已经在15号染色体上提纯了一个新受体,该受体处在一个中间区域中,这个区域与两个人类遗传背景相关联,它们分别是天使人综合征和普拉德威利综合征。直到20世纪80年代后期,人们还几乎无法理解这些不同寻常的疾病,那时,有的科学家意识到基因的源头可能会产生不同的结果:来自母体染色体的“留有印记的”基因控制一些过程,而来自父亲的基因控制其他过程。普拉德威利综合征会引起智力迟钝、肥胖和几种发育畸形,这种疾病发生在那些继承了母亲的双份15号染色体的人群中,正常状态应该是从双亲那里各遗传一个。天使人综合征会引起智力迟钝、典型的愚蠢行为和癫痫症,这种病也和15号染色体有关,但是得此病的人缺乏母亲一方的机能型基因。波士顿儿童医院的马克·拉朗德(Mark Lalande)正在研究胚胎,他渴望看见这个区域的基因被测序,所以保证要与我们合作。我也把与亨廷顿病有关的区域加进了计划中。缺陷基因是这个破坏性的神经紊乱症的诱因,8年前,缺陷基因已经被确定位于4号染色体的短臂尖,可是实际的基因还没有被发现,尽管一大批科学家——大约有60个来自6个不同的团队——已经被南希·威克斯勒(Nancy Wexler)召集到一起去做这方面的研究。南希这样做有她个人的理由:她和她姐姐均有“患这种病的风险”,因为她们的母亲、叔叔和外祖父都死于这一遗传的、无法治愈的、知名的神经错乱症。这些科学家们正在尝试用每种可行的方法帮助她,除了基因组测序。

    这批科学家中的一些成员认为测序是未经试验的方法,是不可能奏效的,而其他科学家担心它会从他们的研究那里占用能量和资源。我反驳说,我在国家卫生研究院有独立的资金,他们什么也不会损失;他们的研究者们没有一人对尝试基因组测序法感兴趣。就像我一再发现的:很大一批人类遗传学者只关心他们是否赢得了发现疾病基因的比赛,而不是尽可能快地完成比赛。亨廷顿病的基因搜寻者们给我的印象也不例外。除非他们能从中得到好处,否则他们将反对任何新的方法,即使这个新方法可能会使我们更快地分离基因。

    一个重要而且可以理解的例外是南希本人,她就像任何一个生活在疾病阴影中的人一样,只要能发现给她们家族带来这么多痛苦的缺陷基因,她愿意做任何事。南希对这个团队施压并且建议他们尝试着和我合作。没有人能提出一个合理的反对论据,所以决定让马塞诸塞综合医院的詹姆斯·居塞拉(James Gusella)给我的由迪克·麦克白领导的小组提供三份复制品,其中囊括了4号染色体尖上的10万对碱基。结果证明缺陷基因正处在目标区域的边缘位置上。总之,我接受了他们,因为我有更大的目标,即创建有效快速的DNA测序法。我感到如果我与亨廷顿团队创建了良好的工作关系,那么如果我成功了,他们下次就可能会给我更有研究价值的复制品。

    另外一个目标是肌肉损耗失调肌强直性营养不良。这次我的运气好了一些,肌强直性营养不良研究小组的头目是安东尼·卡雷诺,是我那倒霉的X染色体基金申请的一名合作者。签了一份同意书后,我收到了3份19号染色体的复制品,其中包括含有基因的区域中的10万对碱基,同意书上写着,我将和他们一起分享数据和荣誉。安东尼亚·马丁—盖拉多(Antonia Martin-Gallardo)是一名来自西班牙的博士后,带领我的19号染色体研究小组,该小组是我用从我的内部预算中转出的资金投资建立的。那时甚至直到今天,我仍相信成功是感动那些批评家的最好策略:好的数据将最终战胜争论。

    用霰弹枪法,测序开始很快进行了。这些复制品以柯斯载体的形式存在,DNA延伸至3.5万对碱基那么长,它们被打包于一个噬菌体中,所以它们能被放入埃希氏菌中。首先我们用声波把许多DNA复制品分散成小片段,每个大约有1500对碱基。统计上,通过随意选择1000个片段,测序300~400对碱基,理论上我们至少覆盖了10次柯斯载体中DNA的每对碱基(350×1000=350000)。

    但是当我们试着测序DNA时,那并不意味着我们将不会遇到任何问题。因为那时的软件设计最多只有处理几百个序列的能力,而要处理1000以上时,我们不得不求助于乏味的手动操作。为了取得重大进步,我们需要比当时所用的更强大的计算机和更好的软件(尽管我的同行不这么认为)。为了达到那些要求,我开始雇用一些精于计算机的科学家。

    其中之一是马克·亚当斯(Mark Adams),他来自密歇根州大学,面貌酷似麦考利·卡尔金(Macaulay Culkin),戴一副大眼镜,态度诚挚,在1989年底,我曾经见过他。我记得当时的印象是,这个瘦瘦的年轻人在研究所时已经开了一家软件公司作为兼职。马克对基因组工作很兴奋,同意第二年就开始。我们购置了强功能的太阳牌计算机,我寻找软件工程师帮忙开发新方法解译基因密码,这些等待读取的基因密码已经开始在我们的电脑里堆积起来了。感谢盲人程序师马克·达布尼克(Mark Dubnick),我们也用一种新方法观察DNA,马克·达布尼克用一种特殊的键盘系统,它可以以最快的速度表达他的思想,比我们能理解的速度还要快。我们甚至尝试用它来读取基因密码,然后以音乐形式反馈给我们,看是否这种实现能帮助我们探测基因结构中的改变。

    但是不管我们试用哪种方法,我们发现用现有方法解读人类基因密码实际几乎是不可能的,甚至在我们努力组装了染色体序列的长串后也是如此。在细菌序列中有效发现和阐释基因的软件不能研究更复杂的人类基因组,在复杂的人类基因组里基因被无意义的DNA(基因内区)分裂成小段(编码顺序),就像一部电视剧被无意义的广告分隔开。以这种方式,一个基因经常以小块和小片的形式被展开成几十万到几百万个基因密码字母。我们采用了最先进的程序搜寻它们,但是软件不能区分真正的基因和无效数据,后者由随机选出的四字母的基因密码产生。

    我提出一个寻找有效基因的方法,该方法通过寻找信使RNA的对应物来确认该片基因是否为有效基因。不管何时,一个真正的存在于人类基因组的基因,都将有一个相对应的信使RNA分子,这是一个基因的删节版本,只包含细胞制造蛋白质所需要的基因密码的碱基对。通过把这个瞬时RNA转换成可以测序的cDNA,我们就可以确定我们的基因预测。

    我们开始从不同的人类组织测试cDNA文库,主要是大脑和胎盘。我们的探针是我们曾经从4号染色体和19号DNA的计算分析中预测到的基因序列。如果在一份克隆的cDNA中找到代表一个从基因密码预测来的基因,它的存在将证明基因是真实的而不是人造的。但是,不管这种方法在逻辑上多有效,我们几个月的辛苦工作仅仅确定了序列中的几个真实基因。怪不得当cDNA方法在早期讨论基因组计划阶段被提出以替代[主要是悉尼·伯伦纳(Sydney Brenner)和保罗·伯格(Paul Berg)提出的]基因测序时,它们被很快叫停。

    尽管有这些障碍,我仍然感到我是在正确的道路上。1990年我更加确信这一点,那时我被邀去日本参加一个讨论会,主办者是DNA测序仪的厂商应用生物系统公司。在那里,我发现我的基因组研究被看作是处于领先位置的。很多日本研究团队都集中在cDNA克隆分离和测序,我和他们交谈了很长时间,主要是关于我利用cDNA克隆来确定基因组序列中已预测的基因。对于我的数据他们很激动,因为它验证了他们自己的方法论。尤其有两个日本科学家对我的想法印象深刻。一位是大阪大学的冈山洋人(Hiroto Okayama),他和保罗·伯格(Paul Berg)已经开发出一种方法有效克隆cDNA,现在正在研究一种方法使他们确认克隆体覆盖了整个基因序列,所谓全长的cDNA。

    这是一个屡被提及的主要问题,使cDNA研究十分棘手:当mRNA被从组织中隔离出来时,很不稳定;在被完整克隆之前,它有可能分裂成小片段。其他问题包括反转录酶,它被用来把瞬时的mRNA信息转变成更稳定的cDNA。这个酶在完成任务之前会削减mRNA。我真是太熟悉这一现象了:当我把cDNA用在我的肾上腺素受体研究工作上时,我丢失了一段克隆末端的基因。

    另一个人是松原建一(Ken-ichi Matsubara),他是大阪大学的分子细胞生物学院的主任,日本基因组工作的领导,同时也是文部省(日本教育、科学及文化部)的顾问:两个人都相信克隆的全长cDNA的测序工作将要成为基因组测序工作的一个基本平台,或者甚至成为完全的替代物,尽管这个方法已经完全被美国和英国基因组专家否决。我和松原签了份分享基因数据的合同;富裕的日本人在其他国家资助的基因组研究上不劳而获,沃森对此很烦恼,他给松原写信,威胁说要拒绝共享科学数据,在信中他使用了类似“人类基因战争”[9],“如果有战争,我就要战斗”这样的容易成为大标题的语言,沃森宣称,“如果你是个懦弱者,那在这个世界上你哪里都去不了”。

    在我12个小时的归家的航途中,我一直在想日本人的全长cDNA测序方法,如果人体中所有的cDNA都被分离克隆和测序,那么分析人类基因组将会是多么容易啊!我想到自己10年来就为找到只是一个克隆的cDNA的单个基因;还想到为了查找一个基因,使用霰弹枪法来读取1000个基因组序列密码是多么的低效率——通常只是一个基因的一部分——想到找到对应的克隆的cDNA来证明那个基因的存在是多么困难。

    我突然觉得自己好像一下子掉进了13千米的太平洋海底:我正在错误的DNA世界里使用正确的测序技术。如果我能把快速随机霰弹枪测序法和cDNA克隆结合起来会怎样呢?如果我只是随机地挑一个克隆的cDNA,然后一口气给它测序又会出现什么情况?我的测序仪器可以一次性读取400对左右的碱基,足够在基因数据库中找到一个配对,就像发现人类基因目录的一个索引。

    因为知道一个已知序列是从克隆的cDNA中获取的,而克隆的cDNA是从易破坏的mRNA中取得,比如mRNA是从人脑中分离出来的,这告诉我们它本身包含重要的信息,第一,这是一个真实、明确的基因的一部分;第二,基因是大脑功能的基本要素。比较起来,基因组序列什么也没告诉我们。如果我转向测序1000个随机选择的克隆的cDNA,我可能会发现几百个基因,每一个我都可以通过传统的基因测序来确定。这个想法让我激动万分,我迫不及待地回来尝试这一重要实验。

    第二天早上,我一走进实验室就召集了我的小组的高级成员,我肯定他们对于这一新思路也同样感到兴奋,但是我碰到了一堵疑惑的墙。麦克白和其他人的底线是我的主意很有可能失败,并且可能使资金要从基因组测序工作中撤走。他们用了与其他怀疑cDNA方法的人同样的论据。现在的权威的说法是,人体组织的基因表达将只涉及少量表达清晰的基因,它们淹没了任何稀有的、表达不清的基因的信号。我们截取的任何信使RNA将可能朝这些显性基因倾斜。但是虽然这个论点对一些组织是有意义的,但是它不可能应用到人脑中,人脑依赖大量基因让我们可以思考,其中有些基因以很低的水平表达。斯克里普斯诊所小组的一项研究就表明一半的人类基因被用在大脑里。

    我想起了纳特·卡普兰的建议,不要脱离实验随口立论:答案最终取决于世界实际上是怎样工作的,而不是取决于当前的权威说法。幸运的是,我发现我小组里有人被我的观点激起了兴趣。一星期前,马克·亚当斯从密歇根大学来到我们这里,我们必须考虑在X染色体测序工程申请失败后,他打算做什么,X染色体测序工程是起初吸引他来我们实验室的原因。我们讨论过利用人类大脑cDNA文库来尝试我的cDNA随机选择和测序试验,他同意马上开始。直到许多年后,我才知道麦克白和其他人是怎样在我背后攻击马克的,他们攻击他太认真地看待我的这一主意了,他们关心的是潜在的分散资源。事实上,他们没有理由担心,因为我们有足够的资金在许多领域同时向前。如果我们需要更多的钱,我将会努力争取到。

    来自沃森的基因组基金最近的资助现在到位了,它资助测序丰富基因区而不是测序整个染色体。沃森和我10月份在我的基因组测序分析会议上相遇,会议在南卡罗莱纳州的希尔顿·海德岛上举行,我略述了我的计划,准备测序亨廷顿的4号染色体区、19号染色体的肌强直性营养不良区和15号染色体的普拉德威利区。他也同意我的方案是可靠的,因为它将吸引疾病基因搜寻者,而且他喜欢这个方案,它将帮助结束漫长的寻找导致亨廷顿症基因的过程。

    沃森也确定这次我将会有好结果,因为被选出来组成评论委员会的科学家们真正的兴趣在于看到基因组工程有实质性进展。但是我还是非常恼火他没有把他前三个诺言坚持到底,我们关系仍然很好,而且我觉得他真诚地想看见我的计划能获得资助。毕竟,我们都是基因组学和人类基因测序的真正的信徒。

    在这次会议上,我还记得另外一件将在未来承载重大意义的事件。我和沃森组织了为期一天的研讨会,会上,他大声与制药公司代表争执关于谁将能从基因组工程获得基因专利权。他也呼吁双方一致同意转让序列数据,只要研究人员一确定数据是精确的就马上这样做。在接下来的几年里,这次争吵将一直萦绕在我脑海里。

    突然我发现我的科学生活改变了。从我实验室里的测序仪里显现出的结果明显表明测序随机选择克隆的cDNA将会获得大胜利。我很高兴,但是为了确信我们没有被数据误导或犯错,大量的工作还有待完成。对我们的挑战是只有300~400个基因密码字母的cDNA就可以确定我们有足够的信息识别相应的基因。我们想展示这个方法的所有价值,包括把cDNA序列图谱还原回基因组。我们也尝试了操纵cDNA文库看是否有有效的方法能去除常规基因的影响,以便我们能“看见”稀有的基因。

    就在我们越来越多地研究克隆的cDNA时,实验室里的气氛也被刺激得兴奋起来了。1990年前,不到2000个人类基因被确定和测序,其中只有10%——比如肾上腺素受体——来自大脑。每天我们的测序机器都在运转,每天我们能够发现20~60个新的人类基因。每天啊!这个数字几乎难以想象,因为它相当于我们在数月的基因组测序过程中解码得到的基因的10多倍,这个数字比我10年前为了找到肾上腺素经历了难以置信的磨难用传统的方法得到的大60倍。我们将要把生物学翻个个儿。