惊人的假说 - 3 - 《第一推动丛书·生命系列(共5册)》

第14章　视觉觉知^[116]

宇宙就像一部展现在我们眼前的伟大的著作。哲学就记载在这上面。但是如果我们不首先学习并掌握书写它们所用的语言和符号，我们就无法理解它们。

——伽利略

现在让我们总览一下到目前为止我们所涉及的领域。本书的主题是“惊人的假说”，即我们每个人的行为都不过是一个拥有大量相互作用的神经元群体活动的体现。克里斯托弗·科赫（Christof Koch）和我认为探索意识问题的最佳途径是研究视觉觉知，这包括研究人类及其近亲。然而，人们观看事物并不是一件直截了当的事情，它是一个具有建设性的、复杂的处理过程。心理学研究表明，它具有高度的并行性，又按照一定的顺序加工，而“注意”机制处于这些并行处理的顶端。心理学家提出过若干种理论试图来解释视觉过程的一般规律，但没有一种更多地涉及脑中神经元的行为。

脑本身是由神经元及大量支持细胞构成的。从分子角度考虑，每个神经元都是一个复杂的对象，常具有无规则的、异乎寻常的形状。神经元是电子信号装置。它们对输入的电学和化学信号快速地作出反应，并将它们的高速电化学脉冲沿轴突发送出去，其传送距离通常比细胞体直径还要大许多倍。脑中的这些神经元数目巨大，它们有许多不同的类型。这些神经元彼此具有复杂的连接。

与大多数现代计算机不同，脑不是一种通用机。在完全发育好以后，脑的每一部分完成某些不同的专门任务。另外，在几乎所有的反应中，都有许多部分相互作用。这种一般性观念得到了人脑研究结果的支持，这些研究包括对脑损伤者的研究以及使用现代扫描方法从头颅外进行的对人脑的研究。

视觉系统的不同的皮质区的数目比人们预料的要多得多。它们按一种近似等级的方式连接而成。在较低级的皮质区，神经元到眼睛的连接最短，它们主要对视野中一小块区域中的相对简单的特征敏感，尽管如此，这些神经元也受该区域所处的视觉环境影响。较高级皮质区的神经元则对复杂得多的视觉目标（如脸或手）有反应，对该物体在视野中的位置并不敏感。（目前看来）似乎并不存在单独的皮质区域与视觉觉知的全部内容相对应。

为了理解脑如何工作，我们必须发展出描述神经元集团间如何相互作用的理论模型。目前的这些模型对神经元进行了过分的简化。尽管现代计算机比其上一代在运算速度上快得多，但也只能对数目很少的一群这类简化神经元及其相互作用进行模拟。尽管如此，虽然这些不同类型的简化模型仍显得原始，却经常表现出一些令人吃惊的行为。这些行为与脑的某些行为有相似之处。它们为我们研究脑所可能采取的工作方式提供了新的途径。

以上阐述的是背景知识。在此基础上，我们着手解决视觉觉知问题，即如何从神经元活动的角度来解释我们所看见的事物。换句话说，视觉觉知的“神经关联”是什么？这些“觉知神经元”究竟位于何处？它们是集中在一小块地方还是分散在整个脑中？它们的行为是否有什么特别之处？

让我们首先回顾一下第2章曾概述的各种观点。视觉觉知究竟包括哪种心理学处理过程呢？如果我们能够找出这些不同的处理过程在脑中的确切位置，或许会对定位我们所寻找的觉知神经元有所帮助。

菲力普·约翰逊—莱尔德认为，脑和现代计算机一样，具有一个操作系统。该操作系统的行为与意识相对应。他在著作《心理模型》（Mental Models）一书中，在更加广阔的背景下提出了这一思想。他认为，有意识和无意识过程的区别在于后者是脑中高度的并行处理的结果。正如我已在视觉系统中描述的那样，这种并行处理就是大量的神经元能够同时工作，而不是序列式一个接一个地处理信息。只有这才能使有机体有可能进化成具有特殊的、运转快速的感觉、认知及运动系统。而更为序列式的操作系统对所有这些活动进行全局控制，这样才能够快速、灵活地作出决定。粗略地打个比方，这就好像一个管弦乐队的指挥（相当于操作系统）控制着乐队所有成员同时演奏一样。

约翰逊—莱尔德假定，虽然这个操作系统可以监视它所控制的神经系统的输出，它能利用的只是它们传递给它的结果，而不是它们工作的细节。我们通过内省只能感觉到我们脑中所发生的情形的很少一部分。我们无法介入能产生信息并传给脑的操作系统的许多运作。因为他将操作系统视为主要是序列式的，所以他认为“在内省时，我们倾向于迫使本来是并行的概念进入序列式的狭窄束缚中”。这是使用内省法会出现错误的原因。

约翰逊—莱尔德的观点表达得很清楚，又很有说服力。但是，如果我们希望从神经的角度理解脑，还必须要识别该操作系统的位置和本质。它不一定与现代计算机的许多特性相一致。脑的操作系统可能并不是清晰地定位于某一特殊位置上。从两层意义上说，它更像是分布式的：它可能涉及脑中相互作用的若干分离的部分，而其中某一部分的活动信息又会分散到许多神经元。约翰逊—莱尔德对脑的操作系统的描述使人多少想起丘脑，但是丘脑的神经元太少了，以至于无法表达视觉觉知的全部内容（虽然这是可以验证的）。似乎更有可能的是，在丘脑的影响下新皮质的部分神经元（而不是全部神经元）可以表达视觉觉知。

我们寻找的觉知的神经关联会处于脑功能等级的哪个阶段呢？约翰逊—莱尔德认为，操作系统处在处理等级的最高层次，而雷·杰肯道夫认为觉知与中间层次有更多联系。究竟哪种观点更合理呢？

杰肯道夫关于视觉觉知的观点^[117]是基于戴维·马尔（David Marr）的2.5维图而不是三维模型的思想的（大致说的是第6章所描述的以观察者为中心的可见表面的表象）。这是由于人们直接感受到的只是视野中物体呈现的那一侧；物体后面看不见的部分则仅仅是推测。另外，他相信对视觉输入的理解（即我们感觉到的是什么）是由三维模型和“概念结构”（conceptual structure，即思维的另一种堂皇的说法）决定的。以上就是他的意识的中间层次理论。

下面的例子有助于理解这个理论。如果你看见一个背对着你的人，你只能看见他的后脑勺，而看不见他的脸。然而，你的脑会推断出他有一张脸。我们会这样进行推理，因为如果他转过身来，表明他的头的正面并没有脸，你会感到十分惊讶。以观察者为中心的表象是与你所看见的他的头的后部相对应的。这是你所真实感觉到的。你的脑所作出的关于其正面的推断是从某种三维模型表象得到的。杰肯道夫认为你并不直接察觉这个三维模型（就此而言，同样你也没有直接察觉你自己的思想）。正如一句古语所说：未闻吾所言，安知吾所思？

由于初读杰肯道夫的著作^[118]时不容易理解他的语言，我把他的理论的倒数第二种说法放在脚注中。^[119]如果我对他的理论的理解正确的话，他的观点应用于视觉即“形态上的差异”（包括一个视觉目标的位置、形状、颜色、运动等）是与一种短时记忆有关（或由它引起/支持/投射）的表象，这种表象是一种“胜者为王”机制（一种选择机制）的结果，而注意机制的作用使它更加丰富。

杰肯道夫的观点的价值在于，它提醒我们不要假设脑的最高层次必定是视觉觉知中涉及的唯一层次。我们面前的场景在脑中的栩栩如生的表象可能涉及了许多中间层次。其他层次可能不够生动，或者如他所推测，我们可能根本不能察觉它们（的活动）。

这并不意味着信息仅仅是从表面表象流向三维表象：几乎可以肯定双向流动是存在的。在上面的例子中，当你想象一张脸孔的正面时，你所感觉到的正是由无法感知的三维模型产生的可感知的表面表象。随着这一主题的发展，两种表象之间的区别或许还需进一步明确，但它对我们试图解释的问题给出了一种最初的、粗略的看法。

目前尚不清楚这些层次在皮质中的准确位置。就视觉而言，它们更可能对应于脑的中部（如下颞叶及某些顶区），而不是脑的额区。但是杰肯道夫所指的究竟是视觉等级系统（图52）中哪个部分，仍有待于探索（第16章将就此进行更详细的讨论）。

在看了一些心理学家对这个问题的观点之后，我们现在再从那些了解神经元、它们的连接以及发放方式的神经科学家的角度来看这个难题。与意识有关（或无关）的神经元的行为的一般特征是什么？换句话说，意识的“神经关联”是什么？从某种意义上说，神经元的活动对意识是必不可少的，这看起来是合理的。意识可能与皮质中某些神经元的一种特殊类型的活动有关。毫无疑问它具有不同的形式，这取决于皮质的哪些部分参与了活动。科赫和我假设其中仅有一种（或少数几种）基本机制。我们认为，在任意时刻意识将会与瞬间的神经元集合的特定活动类型相对应。这些神经元正是具有相当潜力的候选者的集合中的一部分。因此，在神经水平上，这个问题为：

·这些神经元在脑中位于何处？

·它们是否属于某些特殊的神经元类型？

·如果它们的连接具有特殊性，那其特殊性是什么？

·如果它们的发放存在某些特殊方式，那其特殊方式是什么？

怎样去寻找那些与视觉觉知有关的神经元呢？是否存在某些线索暗示了与这种觉知相关的神经发放的模式呢？

正如我们已经看到的，心理学理论对我们有若干提示。某些形式的注意很有可能参与了觉知过程，因而我们应当研究脑选择性注意视觉目标的机制。觉知过程很有可能包括某些形式的极短时记忆，因而我们还应探索神经元储存和使用这种记忆时的行为。最后，我们似乎可以一次注意多个目标，这对觉知的某些神经理论提出了问题，因此我们从论述这个问题开始。

当我们看见一个物体时，脑子里究竟发生了些什么呢？我们会看到的可能存在的、不同的物体几乎是无限的。不可能对每个物体都存在一个相应的响应细胞（这种细胞常被称为“祖母细胞”）。表达如此多具有不同深度、运动、颜色、朝向及空间位置的物体，其可能的组合多得惊人。不过这并不排除可能存在某些特异化的神经元集团，它们对相当特定的、生态上有重要意义的目标（如脸的外貌）有响应。

似乎有可能的是，在任意时刻，视野中每个特定的物体均由一个神经元集团的发放来表达。^[120]由于每个物体具有不同的特征，如形状、颜色、运动等，这些特征由若干不同的视觉区域处理，因而有理由假设，看每一个物体时经常有许多不同视觉区域的神经元参与。这些神经元如何暂时地变成一个整体同时兴奋呢？这个问题常被称为“捆绑问题”（binding problem）。由于视觉过程常伴随听觉、嗅觉或触觉，这种捆绑必然也出现在不同感觉模块之间。^[121]

我们都有这种体验，即对物体有整体知觉。这使我们认为，对于已看见的物体的不同特征，所有神经元都产生了积极的响应，而脑通过某种方式相互协调地把它们捆绑在一起。换句话说，如果你把注意力正集中在与你讨论某个观点的朋友身上，那么，你脑中有些神经元对他的脸部运动反应，有些对脸的颜色反应，听觉皮质中的神经元则对他讲的话有反应，还可能挖掘出储存这张脸属于哪个人的那些记忆痕迹，所有这些神经元都将捆绑在一起，以便携带相同的标记以表明它们共同生成了对那张特定的脸的认知（有时候脑也会受骗而作出错误的捆绑，比如把听到的口技表演者的声音当作被模仿物发出的）。

捆绑有若干种形式。一个对短线响应的神经元可以认为把组成该直线的各点捆绑在一起。这种神经元的输入和行为最初可能是由基因（及发育过程）确定的，这些基因是我们远古的祖先的经验进化的结果。另一种形式的捆绑，如对熟悉物体的识别，又如熟悉的字母表中的字母，可能从频繁的、重复性的体验中获得，也就是说，是通过反复学习得到的。这或许意味着参与某个过程的大量神经元最终彼此紧密地连接。^[122]这两种形式的相当永久的捆绑可以产生一些神经元群体，它们作为整体可以对许多物体（如字母、数字及其他熟悉的符号）作出反应。但脑中不可能有足够多的神经元去编码几乎无穷数目的可感知的物体。对语言也是如此。每种语言都有大量的但数目有限的单词，而形式正确的句子的数目几乎是无限的。

我们最为关心的是第三种形式的捆绑。它既不是由早期发育确定的，也不是由反复学习得到的。它特别适用于那些对我们而言比较新奇的物体，比如说我们在动物园里看见的一只新来的动物。在多数情况下，积极地参与该过程的神经元之间未必有较强的连接。这种捆绑必须能够快速实现。因此它主要是短暂的，并必须能够将视觉特征捆绑在一起构成几乎无限多种可能的组合，只不过也许在某一时刻它只能形成不多的几种组合。如果一种特定的刺激频繁地出现，这种第三种形式的瞬间的捆绑终将会建立起第二种形式的捆绑即反复学习获得的捆绑。

遗憾的是，我们并不了解脑如何表达第三种形式的捆绑。特别不清楚的是，在集中注意的觉知时，我们究竟每次仅仅感知一个物体，还是可以同时感知多个物体。表面上看，我们每次能感觉的绝不仅一个物体，但这是否可能是错觉呢？脑真的能如此快速一个接一个地处理多个物体的信息，以致它们好像同时出现在我们脑海中吗？也许我们每次只能注意一个物体，但在注意之后，我们可以大致记住其中几个。因为我们并不确切知道真相，所以我们必须考虑所有这些可能性。让我们先假设脑每次只能处理一个物体。

究竟哪种类型的神经活动可能与捆绑有关呢？当然，意识的神经关联可能仅包含一种特殊类型的神经元，比如某个特殊皮质上的一种锥体细胞。一种最为简单的观点是，当这个特殊神经元集团的某些成员以一个相当高的频率发放（比如大约400或500赫兹），或维持一段适当长时期的发放，此时觉知便出现了。这样，捆绑仅对应于皮质神经元中相当小的一部分，它们在皮质中若干不同的区域同时高频发放（或都发放很长一段时间）。看起来这会有两个结果：这种快速或持续性的发放将增强这个兴奋的神经元集团对所投射到的神经元的影响，而这些被影响的神经元对应于此时脑所觉知的物体的“意义”。同时，这种快速的（或持续的）发放将激活某种形式的极短时记忆。

然而，如果脑能同时精确地觉知不只一个物体，那么这种观点就不能成立。即便脑每次只处理一个物体，它也必须区分目标和背景。为了理解这一点，不妨想象在一个视野中靠近视觉中央的地方，恰好有一个红色的圆和一个蓝色的方块。那么，对应于觉知的某些神经元将会快速发放（或持续发放一段时间），有些标识红色，有些标识蓝色，其他一些标识圆，当然还有一些标识方块。脑又怎样知道哪种颜色与哪种形状相互搭配呢？换句话说，如果觉知仅仅对应于快速（或持续）的发放，脑多半会将不同物体的属性混在一起。

有许多方法可以解决这个困难。或许只有当脑注意某个物体时才会形成对它的生动的觉知。或许注意机制使对被注意的物体反应的神经元的活动增强，同时削弱对其他物体反应的神经元的活动。倘若如此，脑只能随着注意机制从一个物体跳跃到另一个物体，一个接一个地进行处理。毕竟，当我们转动眼睛时，情形是这样的。我们先注意视野中的一部分区域，然后转而注意另一区域，如此下去。由于我们不动眼睛就能同时看见多个物体，故注意机制的速度必须比上述情况要快，并能在眼的两次转动之间工作。

另一种替代的解释是，注意机制以某种方式使不同的神经元以多少不同的方式发放。此时的关键在于相关发放。^[123]它基于这样一种观点，即重要的不仅仅在于神经元的平均发放率，更是每个神经元发放的精确时间。简单起见，让我们仅考虑两个物体。对第一个物体的特征反应的神经元都在同一时刻以某种模式发放，相应于第二个物体的神经元也都同时发放，但发放的时间与第一个神经元集团不同。

用一个理想化的例子可以把这个问题讲得更清楚。假设第一集团中的神经元发放很快，或许它们还会再次发放，比如说是在100毫秒以后。同样，在第二簇发放后过100毫秒又再次发放，如此下去。假设第二群神经元也同样每隔大约100毫秒发放一簇高速脉冲，但是只在第一群神经元处于静息状态的时候才发放。这样，脑中的其他部分不会把这两群神经元的发放混在一起，因为它们从不会同时发放^[124]（图57）。

3 - 图1

图57　时间轴上每根短的竖线表示一个神经元在某一时刻的发放。第一条水平线显示了标识“红色”的神经元的发放，下一条线则是标识“圆”的神经元的行为，等等。因为表示红色的神经元和表示圆的神经元大致在相同时间发放，而它们与表示蓝色的神经元的发放时间相差很大。脑因此可推断出圆是红色的而不是蓝色的。这种情况常被说成表示“红色”和“圆”的神经元的发放是相关的（表示“蓝色”和“方块”的神经元也是如此），而互相关（比如“红色”和“方块”之间）为0（为了说明问题，这个例子被大大地简化了）

此处的基本观点是：同时到达一个神经元的许多脉冲将比不同时刻到达的同样数目的脉冲产生更大的效果。^[125]其理论要求是同一群神经元的发放有较强的关联，同时不同群的神经元之间关联较弱，甚至根本没有关联。^[126]

让我们回到主要问题上，即定位“觉知”神经元并揭示使它们的发放象征着我们所看见的东西的机制是什么。这就像试图侦破一个神秘的谋杀案。我们了解受害者（觉知的本质）的一些线索，还知道可能与犯罪有关的许多杂乱的事实。哪方面进展看来最有希望呢？由此下一步又该怎么做呢？

最直接的线索将是在现场捉住嫌疑犯。我们能否发现那些行为一直与视觉觉知有关的神经元呢？一种可能的办法是设置一种环境[如第3章描述过的观看内克（Necker）立方体]使进入眼睛的视觉信息保持不变，但知觉会发生变化。当知觉改变时，哪些神经元会改变其发放，或改变发放的方式，而哪些神经元不会改变？如果一个特定神经元的发放不随知觉改变，这就提供了一个“它不在现场”的证据。另外，如果它的发放确实与知觉有关，我们还需确定它是“真凶”还是“从犯”。

让我们换一种策略。我们能否将案发地点限定在某个特定的城镇、一个区或建筑物中的单元呢？这将使我们的搜索变得更有效。在我们的问题中，即我们能否大致说出视觉觉知神经元在脑中可能的定位呢？显然，我们推测它在新皮质。虽然我们不能完全忽略新皮质的紧密的近邻，如丘脑和屏状核，以及在进化上比较古老的视觉系统（older visual system）和上丘，更不能忽略纹状体和小脑。视觉觉知不太可能存在于听皮质等区域，因此我们可以将注意力主要集中在图48所示的许多视觉皮质区域。或许我们能发现证据表明某些区域比其他区域被更紧密地牵涉视觉觉知。

这尚不足以找到凶手，但可能将我们引向正确的方向。罪犯可能是某种特殊类型的人，比如说，一名强壮的男子，一名心理失常的青少年，或者一群匪徒。在此处，可能涉及哪些类型的神经元呢？是兴奋性神经元？还是抑制性神经元？是星形细胞，还是锥体细胞？如果它们是在皮质上，那么在皮质中哪一层或哪些层才能找到它们呢？

另一种策略将是寻找它们之间是否有某些形式的通信联系，从而使之露出马脚。如果这是一帮匪徒所为，他们是否在汽车里使用了移动电话？用神经学的术语说，觉知是否依赖于仅仅出现在脑中特定位置上的某些特别形式的神经回路呢？

或许有人会寻找犯罪的动机。凶手犯罪能得到某种利益吗？他是否能得到经济上的好处呢？倘若如此，赃款被运到哪里去了呢？如果我们能在那里找到的话，我们或许就能追查到凶手。用神经的术语讲，视觉信息被发送到脑中的哪些部位了？这些部位又是如何与皮质视觉区域连接的呢？

此外，有人会问是否有某些特殊的行为将我们引至嫌疑犯。这或许是神经元群之间的相关发放，或许是这种或那种形式的节律或模式发放。如果我们怀疑是一群匪徒所为，谁最可能是头目呢？谁决定了匪徒们的行动？我们相信，觉知过程中经常涉及脑对哪种解释最为合理进行判断。这可能是一种包含某些神经元集团的一种“胜者为王”机制。如果我们能发现这种机制，那么胜者的神经本质也许能将我们指向觉知神经元。其作案时是否用过什么特殊的武器呢？正如前面所述，我们很有把握地猜测极短时记忆是觉知的本质特征。同时，某些形式的注意机制或许协助产生生动的觉知，因此，我们所知道的关于这些在神经水平的工作的任何知识都将把我们引向正确的方向。

简单地说，通过大量的实验手段能从观念上将我们引导到所寻找的神经元及它们的行为。现阶段，因为我们要解决的问题十分困难，我们不能忽略任何哪怕看起来只有很少希望的线索，现在，让我们更仔细地检查这些不同的途径的本质。

第15章　一些实验

仅仅通过纯粹的逻辑思考，我们不能获得关于经验世界的任何知识。

——阿尔伯特·爱因斯坦

猴子脑中的一个特定神经元也许会对视野中某块特定区域的颜色敏感。但是我们又如何确定它直接参与了对该颜色的知觉呢？比如，也许它只是脑把注意引向视野中那块区域的系统的一部分。倘若如此，一个人由于脑部损伤而失去了感知真实颜色的神经元，那么他所看到的世界只有黑白两色，但他的注意仍可能被引向一个色块。

这不只是一个抽象的可能性。牛津的阿兰·考维（Alan Cowey）及其同事详细地研究^[1]了一个由于脑部损伤而失去了颜色知觉的人（通俗地讲，他看不见颜色，只能看到黑色、白色及不同浓度的灰色）。他们指出，实验中只要把两个小的颜色方块（被调节成等亮度）紧挨在一起，被试就能说出两个方块的颜色是否相同。而事实上该被试坚决否认他能感知两个方块的颜色。如果两个方块不挨着，他便无法完成这个任务，他的判断完全是一种猜测。这相当清楚地表明，脑在不感知颜色时仍能利用关于颜色的部分信息。

为了发现猴子脑中某些神经元的反应是否与它所见到的事物有关，斯坦福大学的威廉·纽瑟姆（William Newsome）做了一系列卓越的实验。实验中选择的皮质区域是MT区（有时称之为“V5”）。这里的神经元对运动响应良好，但对颜色没有直接反应，或者根本不响应（见第11章）。已经有实验表明，该区域受损伤后猴子对视觉运动的响应变得困难。不过这种障碍常常在几周后逐渐减弱，这或许是脑学会了使用其他通路的缘故。

继其他人的早期工作，纽瑟姆和同事们首先研究MT区的单个神经元对选定的运动信号怎样作出反应^[2]。这些信号是由显示在电视屏幕上的快速变化的随机点图组成的。一种极端情况是所有这些瞬变的点都朝一个方向运动。这种运动很容易被识别。另一种极端是使这些点的平均运动为零，这就像更换电视频道时，屏幕上有时会看到“雪花”一样。观察者必须报告运动是沿给定的方向还是相反方向。当平均运动为零时，结果是随机的。

纽瑟姆和同事们使用了这些闪烁图案的各种组合。如果所有的运动朝一个方向，猴子（或人）总能正确地发出信号报告该运动方向。如果只有部分点朝一个方向运动而其他各点随机运动，则观察者有时会犯错误。沿该特定方向运动的点所占的比例越小，犯错误的次数就越多。通过改变这个比例，就有可能画出一条观察者的准确度与具有相同运动方向的点所占百分比的变化关系的曲线。^[127]使用一种特殊的数学手段，可以找出那些最有效的方式判断运动方向。

他们总共研究了200多个不同的神经元。其中大约1/3的神经元判断的准确度与猴子相当。有些判断的准确度很差，但另一些对运动的判断的准确度比猴子要好得多。那么，既然猴子脑中有这些皮质神经元，为什么它不能更成功地作出判断呢？最可能的回答是，猴子不能仅仅选择一个神经元（即判断最有效的那个）来控制它的反应。它的脑必定使用了一群神经元。现在还不清楚它是如何做到这一点的。

这个实验的确说明了作出选择所需的视觉信息存在于MT区的神经元的行为之中，因此我们不能说那些神经元不能完成这个任务。遗憾的是，这并不能证明它们确实执行了这个任务。

纽瑟姆的下一个实验则更深入一步^[3]。他和同事们提出了这样一个问题：当猴子进行较难的鉴别任务时，如果我们能适当地刺激MT区的神经元并使它们发放，猴子的判断能否得到改进呢？

从技术上讲要仅仅刺激一个神经元并不容易。幸亏在皮质MT区，具有相似反应形式（即对视野中一个特定部位的一个特定运动方向反应）的神经元通常彼此形成一簇。这样用电刺激靠近目标神经元的那一小块区域，很有可能使这些具有相似特征的神经元一起受到刺激。

他们一共做了62次实验。其中大约半数情况下电流刺激明显改善了猴子对运动的鉴别能力。这是一个相当惊人的结果。它意味着通过使视皮质中适当位置的神经元兴奋，我们可以改变猴子对特定视觉刺激的反应方式。电流必须加在这一特定位置才有效。如果电流刺激皮质MT区其他位置则对猴子完成这种特殊任务几乎没有影响。

这是否意味着MT区的一小块区域包含在识别那种运动的神经相互关联之中呢？这当然是可能的，但要肯定这个结论还有不少困难。

可能有一种反对意见是，虽然猴子表现出了恰当的（鉴别）行为，但是实际上它并没有看见任何东西。它仅仅像个自动机器那样作出反应，而并没有视觉觉知。要确切地回答这种反对意见，就必须完全了解猴子和人的视觉系统；因此，目前我们只能假设猴子具有视觉觉知，直到有证据表明并非如此。

人们还可能争论说，即便猴子具有视觉觉知，但它在完成这个特殊任务上并未形成视觉觉知。看来这不大可能，因为在这一任务中猴子和人作出的选择是类似的，也就是说，他们的心理测量曲线是相当一致的。猴子的表现并不比人差很多。这很可能是二者的脑运用了相似的机制；不过，还有一个困难。

如果一个人重复进行这项任务，他的行为差不多常会变成机械的了。他会报告说他几乎没有瞥见这个运动，尽管如此，他的选择却比随机情况要好得多。由于不能用语言向猴子描述这个任务，故它比人更难训练。纽瑟姆的猴子可能经受了过度的训练，因此它们的行为或多或少变得机械了，而几乎没有什么视觉觉知参与。

我怀疑这种反对意见是否很重要。因为当所有的闪烁光点向一个方向运动时，我们很清晰地看到了这个运动，几乎可以肯定猴子也看到了。遗憾的是，由于猴子已能近乎很好地完成了任务，在这种情况下刺激电流引起的差异微乎其微。或许可以进行这样一种实验，先让猴子学习鉴别另一种运动刺激（如一个有朝向的棒）的运动方向，并在它被过度训练之前进行这种运动光点的测试。这种实验具有一定的风险，因而并不容易做，但或许值得一试。

一种更激烈的反对意见是，虽然皮质MT区的神经元的行为看上去与猴子的鉴别有关联，因而也可能与视觉觉知有关，但这并不意味着这些特定的神经元就是产生觉知的地方。它们可能通过发放影响其他的神经元（或许是视觉等级的其他部位），而那些神经元才是真正与觉知相关的。

要回答觉知这个问题，唯一的方法是研究其他皮质区域。如果我们在其他地方不能发现具有相似的鉴别能力的神经元，则MT区的神经元与觉知相关的可能性便增加了。从长远考虑，在我们更多地了解全部视觉区域，特别是它们如何相互连接之前，我们不可能寄希望于能将视觉觉知的区域限定下来。无论如何，纽瑟姆的一些实验在这一研究方向上迈出了非常重要的第一步。

如果视野中的某些刺激引起有关神经元发放，我们自然会猜测该神经元可能是与那些刺激相关的神经对应物。不过，正如刚才解释的那样，这种结论并非必然。是否有某些更有效的方法可以缩小搜索觉知神经元的范围呢？我们能否找到这样一种情况，其中视觉输入保持恒定，而知觉却在变化？那样我们便可尝试去寻找猴子脑中哪些神经元的发放随输入而变化；更重要的是，哪些神经元是随知觉而变化。

一个显著的情况是观察内克立方体（图4）。此时图形保持不变，但当我们把它看作三维时，开始时知觉是一种形式，然后又变成另一种形式，如此下去。目前并不清楚脑中什么部位具有关于三维立方体的知觉。我们应该研究某些容易在猴子视觉系统中定位的情况。

一种很值得注意的可行性是基于已知的双眼竞争现象。当两只眼睛接收与视野中同一部分有关的不同视觉输入时，这种情况就会出现。头部左侧的初级视觉系统接收视野中双眼凝视点右侧的输入信息（右侧则与此相反）。如果两侧的输入不能融合，而是先看到一个输入，再看到另一个，如此不断交替，则这两种互相冲突的输入被称为“竞争的”。

你可以在旧金山的博览会看到一个颇具戏剧性的双眼竞争的例子。它是由萨莉·杜宁（Sally Duensing）和鲍勃·米勒（Bob Miller）设计的。[4]在博览会的演示中，观察者把头放在一个固定的位置上并要保持凝视点不动。通过一面适当放置的镜子（图58），观察者的一只眼睛能看到他面前的另一个人的脸，而另一只眼睛看到的是侧面的一个空白的屏幕。如果观察者在这个屏幕前晃动他的手，则在他的视觉中，脸从原来的位置上被抹掉了！手的运动在视觉上非常显著，从某种意义上吸引了脑的注意。若不注意的话，是看不见脸的。如果观察者移动他的眼睛，脸又会重新出现。

在某些情况下消失的只是脸的一部分（图59）。例如，有时还会留下一只或两只眼睛。如果观察者看的是一个人脸上的笑容，此时会出现脸消失了而只留下微笑的情况。由于这个原因，这种效应被称为“柴郡猫效应”（Cheshire Cat effect，是以《爱丽丝漫游奇境记》中的猫命名的）。你可以用一个简单的袖珍镜子做试验。结果非常有趣。如果被观察者和观察者的手后面都是均匀的白色背景的话，实验效果会更好。

3 - 图2

图58　博览会参观者使用的“柴郡猫效应”演示的示意图。其中提供的是一个双面的镜子，以便观察者可以方便地使用任何一只眼睛作为消失的视野。这种设置允许观察者使用自己的手来产生消除效应

3 - 图3

图59　观察者坐在图58所示的仪器前并保持凝视。如果他晃动右手，使得镜中手的影像穿过另一个人的脸的部分影像，脸的那部分就会消失。如果他移动眼睛，脸又会再次出现（注意，镜子把右手影像成左手）

到目前为止尚未对猴子进行这种实验。在麻省理工学院进行过一种简单得多的实验：尼科斯·罗格赛西斯（Nikos Logothetis）和杰弗里·萨尔（Jeffrey Schall）训练猕猴对看到的向上或向下运动的水平光栅作出判断。[5]为了产生双眼竞争，向上运动的光栅被投射到猴子的一只眼睛，而向下运动的投射到另一只眼睛，并使两个影像在猴子的视野中重叠。结果猴子交替发出信号表示它看到了向上和向下的运动，这和我们作出的反应是一样的。请注意，到达猴子眼中的运动刺激总是一样的，而猴子的感受大约每秒钟改变一次。^[128]

皮质MT区主要检测运动而对颜色不感兴趣。当猴子对运动的感觉有时向上有时向下时，短时间内MT区的神经元的行为是怎样的呢？回答是，有些神经元的发放与感觉有关，其余的神经元的平均发放率则相对地保持不变，与猴子当时看到的运动方向无关（实际数据要比这简单的描述杂乱得多）。

这一结果表明，在某一时刻，不可能所有的视皮质神经元的发放都与我们的视觉感受有关。当然，如果有更多这样的例子，情况就会更好些。遗憾的是，这并不能准确地限定出觉知神经元的位置。如同对纽瑟姆的实验的解释一样，真正的关联或许是视觉等级系统其他地方的神经元的发放，而它们受到了MT区的那些神经元发放的影响（至少是部分受影响）。拉马参准曾经提出^[6]，这种竞争可能不是一种真实运动的竞争，而是一种形状的竞争，其真正的位置或许在于视觉等级系统较低的层次，或许是皮质V1区或V2区。同样，即使某些觉知神经元确实位于MT区，目前的结果并不能证实它们是哪些神经元。它们在哪些皮质区呢？哪些类型的神经元趋向于随知觉而不是视觉输入而改变呢？正如对纽瑟姆的结果的讨论一样，这里同样存在着猴子被过度训练的可能。尽管这种可能性不大，因为训练对竞争的影响很小，但仍会引起忧虑。再说，即使有所保留，这些也是很重要的实验。进一步的研究将会把我们引向用神经术语来解释视觉觉知。

在其他条件下，是否还会出现视觉输入不变而知觉却由于某种原因发生变化的情况呢？当然，有时观察者会突然“看见”一个原来并未发现的物体，如图9中的隐藏着的达尔马提亚狗一样。但要在猴子身上进行这种研究并不容易。人们会说：“瞧，我现在看见一条狗。但我以前没看见过。”让猴子告诉我们这些则困难得多。此外，一旦观察者从图中辨认出那条狗，在随后的实验中他通常能直接认出它。因而要多次重复同样的实验是困难的。而这种重复正是取得科学的可靠结果所必需的。

一种可能性就是研究从觉知中逐渐消失的图像在脑中产生的影响。这些影像是稳定在视网膜上的（回想一下，我们通常通过各种各样小的眼动来防止这种消退）。最初通过在眼球上放置一个小的装置来将图像稳定在视网膜上，这使眼睛感到很不舒服。它能将选定的光学图案投射到视网膜上。不管眼睛如何运动，图案一直保留在视网膜上的同样位置，因而会逐步褪去。20世纪50年代时进行过多次这类实验，但此后，虽然产生稳定的影像的装置更精密也更舒服，但这类实验似乎却不再进行了^[7]。

人们或许认为这种消退过程主要发生在视网膜，因而对我们来说兴趣不大。但看来这不大可能是真的。这些早期的研究表明复杂的图像并不总是以一个整体消退^[8]。一条直线常被作为一个整体，但是构成一个方块或三角形的几条边却可能独立地消失。锯齿形的图形不如弧形稳定。格式塔心理学家所说的“好的图形”比“差的图形”的活动更具整体性。如果有一个图案是一个大写字母B，并有粗糙的弯曲线穿过，弯曲线通常比字母B更早褪去。这表明消退主要发生在脑中，而不是在眼睛里。因此我们值得去做一些尝试，比如训练一只猕猴，使它能在清醒状态下用信号表示它所见到的东西。将各种不同的图案固定在它的视网膜上，观察当部分影像从觉知中褪去时哪些神经元受到了影响。

另一种可能性是对拉马参准的引人注目的实验报道（图19）进行进一步研究。人为地损坏猴子皮质V1区的一小部分可造成一个局部盲区（称为“盲点”）。该实验涉及由静止的两条未排成一线的平行线段在触及这个盲区时产生的表观运动。如果我们能训练猴子用信号报告，区分运动和静止、对准和错开、中断和连续等各种情况，那么这项研究就有可能在猴子身上进行。据我所知，迄今为止还没有人做过这种尝试。

已经有人在猴子的真正盲点做了一项简单的实验（关于我们盲点的心理学描述，请见第3章）。在V1区有一个区域与盲点相对应。在这里皮质仅接受来自一只眼睛的直接输入，而另一只眼的光感受器不能覆盖视野中的这一部分（回想一下，脑中一侧的V1区的大部分神经元均接受来自双眼的输入，虽然它只处理视野对侧一半的信息）。人们或许认为盲点区域内的神经元仅对来自一只眼的信号有反应。令人吃惊的是，这并非事实。里约热内卢联邦大学的里卡多·伽塔斯（Ricardo Gattass）和同事们已经证实，猕猴的盲点区中有些神经元确实对来自双眼的输入有反应^[9]。这种令人意想不到的、来自在该区域是局部上盲的眼的输入，或许直接或间接地来自邻近的接受双眼输入的皮质组织。不管它来自何处，实验表明，V1区盲点上的神经元按第3章所述的方式发放脉冲对信号作出反应，对外界图形实现填充。同时，这决定性地否定了丹尼特（Dennett）的观点（在第4章作过概述）。这样简洁的例子却说明了一个普遍原理：无论何时你清楚地看见视觉场景的某个特征，那么一定有一些神经元在发放，它们的活动显而易见地象征那个特征（另一个关于这个原理的例子是第11章描述的对主观轮廓的神经反应）。

与通常的视觉输入引起的神经反应的例子相比，这个特殊的盲点现象没给我们提供多少关于觉知神经元定位的信息。如果它能像早期建议的那样扩展一下，研究对于不变视觉输入下的感觉的变化情况（图19），那对我们的探索是有所帮助的。

另一个途径是研究在哪些情况下不同的视觉输入会产生相同的知觉，或者至少是产生了这种知觉的某些组成单元。一个例子是索尔克研究所的汤姆·奥尔布莱特（Tom Albright）和合作者在猕猴皮质MT区做的实验。结果表明，即使所研究的运动物体有相当大的差异，MT区的某些神经元的发放也具有非常一致的特性。比如，一块波纹穿过视野运动，它们在MT区引起某些神经元的发放，与一根直棒在相同位置朝相同方向运动的效果大致相同。尽管图案不同，但它们的运动很相似（他们把这称为“形状—线索不变性”）。

到目前为止他们尚未证实这种神经元在类型、定位或发放行为上是否存在特别之处。如果它们是觉知神经元，我们也许希望，不管输入信号是什么，它们的发放（或是其中某些特性）总与视觉知觉相关。

由于至今证据仍不充分，因而有理由提出这样一个问题：人们能否精确地研究在动物警觉及处于无意识状态下同一个神经元的行为？由于技术上的原因，当动物被麻醉而处于无意识状态时做这样的实验是很困难的。不过有实验比较了猫在警觉状态和慢波睡眠时的情况。^[129]

1981年神经科学家玛格丽特·利文斯通（Margaret Livingstone）和戴维·休伯发表了这样一个实验^[10]。他们研究的神经元大多在皮质V1区。^[130]动物的眼睛是睁开的，因而即便在慢波睡眠时V1区的神经元也对放置在动物面前的屏上由计算机产生的视觉信号作出反应。当他们记录到某个特定神经元的反应时，他们把动物唤醒，并用它刚看到的同样刺激再次测试。

当动物清醒时，他们研究的每个神经元的反应形式与睡眠时大致相同，也就是说，如果它对视野中某个位置的具有一定朝向的直线敏感，那么无论动物是处于清醒状态还是睡眠状态，它的最佳刺激都是一样的，只是清醒时通常信噪比要好一些。^[131]不管怎样，有相当数目的细胞的发放率在动物清醒后比睡眠时要高。或许这没什么可惊讶的，而令人感兴趣的结果是，皮质较低层次（第5层、第6层）的反应的改变比高层更为显著。

他们使用一种化学物质（有放射性的2—脱氧葡萄糖）来证实这个一般性结果。这种物质可以显示在这些皮质层次由视觉刺激产生的平均行为。这些行为是在大约半小时内的平均结果。一种情况下动物处于清醒状态，在动物睡眠时则使用一种不同的放射性同位素作为对比。结果大致是相同的。当动物有意识时，皮质较低层次的行为有显著改变，较高层次的变化却很小。

这促使人们得出这样一个广泛的推论，它远超过目前的证据。这就是，皮质较高层次的活动主要是无意识的，而至少有部分低层神经元与意识有关。我必须承认我过分地喜爱这个假设。如果确实如此，那将是十分美妙的。但我不能全身心地接受它，或许有其他原因使得慢波睡眠时较低层次的活动变弱。

通过研究注意机制，我们能够得到对有关觉知的任何知识吗？关于注意的神经机制的实验研究已经进行了一段时间。一些实验是在清醒的猴子身上做的。他们记录了当猴子在完成特定视觉任务时脑多个部位神经元的发放。也有一些实验对人使用如第8章所描述的PET扫描。我不打算重复所有这些实验；相反地，我将只简述其中一个实验及其结果。

马里兰州贝塞斯塔（Bethesda）的国立精神卫生研究所的罗伯特·德西蒙（Robert Desimone）和同事们曾经训练猴子凝视视觉显示一侧的一个点并（目不转睛地）注意该显示的某个特征^[11、12]，随后闪现了各种信号。实验者研究了在皮质V4区的一个特定神经元对该位置上的视觉显示的响应。V4区的神经元对颜色更敏感。假设研究的神经元对具有一定朝向的红色棒有反应，而绿色的棒对它没有影响（当然，此时V4区中未被研究的其他神经元，有些也会对绿色棒而不是红色棒有反应），每次显示均包括两种颜色棒，一根红色的（对该神经元是有效刺激），而另一根为绿色（无效刺激）。二者均在神经元的感受野内。当猴子注意红色棒占据的位置时，神经元的发放与猴子不注意时相同，或者更高些。^[132]然而，在那些猴子注意绿色棒的实验中，这个对红色敏感的神经元的发放降低了。因此，注意不仅仅是个心理学的概念。它的影响可以在神经元水平上观察到。当猴子注意某处时，对被注意刺激敏感的神经元发放会增强，而当猴子注意其他位置时，尽管眼睛的位置以及输入的视觉信息与上次完全相同，那个神经元的发放也会减弱。

他们这样描述所得的结果：

V4区的神经元……具有如此大的感受野，以致许多刺激都落入其中。人们也许期望这样的细胞的行为就反映了其感受野内所有刺激的特征。然而已经发现，当猴子将其注意局限在一个V4区……细胞的感受野的一个位置时，该细胞的反应首先由被注意位置上的刺激决定，就好像感受野围绕着注意到的刺激渐渐“收缩”一样。

由于理解它们并不容易，我就不详细描述他们的结果了。他们指出，关于注意的探照灯的简单理论似乎并不正确。要解释它们需要更复杂的机制，而这种机制尚未建立。

丘脑是否参与了注意呢？作为“皮质的入口”，丘脑具有许多相当不同的区域，其中有些与视觉有关。从眼睛到皮质的主要通路需要经过侧膝体（lateral geniculate nucleus，缩写为LGN）。侧膝体是丘脑的一部分（见第10章的描述）。（灵长类）其他丘脑视觉区位于称为“丘脑后结节”的区域。^[133]它是一个大的丘脑核，比侧膝体显然要大得多。

贝塞斯塔的国立眼科研究所的戴维·李·罗宾逊（David Lee Robinson）和同事们在猴子的丘脑后结节的一部分做了大量实验。看来，引起丘脑后结节反应的特征依赖于它们来自视皮质的输入，而不是来自上丘。^[134]

如果通过化学手段使丘脑后结节的一小块区域的抑制增强，猴子转移注意会更困难；相反，降低抑制将使转移变得容易。其他人进行的一些实验表明，丘脑后结节扮演的角色是抑制来自无关事件的输入。对三名丘脑损伤患者的研究表明他们形成注意有一定困难。对正常人的PET扫描显示，当视觉任务分散注意力时，丘脑后结节的活动增强。这些干扰物使得被试用更多的注意来完成任务。所有这些结果（综述文章见参考文献13）有力地表明了丘脑的这些部分与在视觉注意的多个方面密切相关。^[135]

这里尚有广阔的领域可以从事进一步的工作。需要进一步更细致地研究上面提到的每个丘脑后结节区的准确连接。比如说，几个视网膜区域对应区的连接方式有何不同？我们能否更准确地了解丘脑后结节的每个特定部位如何影响注意，以及它如何与相关的各个皮质区域的神经元相互作用呢？进一步的实验工作应当能回答这些问题（我在第17章对关于丘脑后结节不同区域的一些推测性想法进行了讨论）。

我们从对丘脑的研究中得到了多少关于视觉觉知的神经机制的知识呢？既然注意对觉知是重要的，忽略它将是愚蠢的。为了揭示视觉的奥秘，我们不仅需要了解新皮质如何工作，而且需要了解侧膝体和丘脑后结节。

有关的实验能否在人而不是猴子上做呢？这种实验的优点在于被试可以口头报告他们的体验，而猴子做不到。然而，出于伦理学原因，不太可能将电极插入一个人的脑中。不过，有时为了医学治疗必须这样做。从头颅外面研究脑波也是可能的，但这些结果通常更难以解释。

这个方法最初是由在加利福尼亚州立大学旧金山分校工作的本杰明·里贝特（Benjamin Libet）开展的。他喜欢在人体上做实验，因为他有理由相信别人是有意识的（他对猴子是否也有意识则并不那么有信心）。在过去，不仅是心理学家和神经科学家，还包括职业医生，都对关于意识的任何实验工作持严肃的怀疑态度。对于外科医生和麻醉师而言，他们几乎唯一的兴趣是如何在手术过程中对病人麻醉，以使病人察觉不出所发生的事情。这样做，部分是为了减轻病人的痛苦，部分是为了防止病人控告他们（里贝特告诉我，在他获得终身教授职位以前，他很明智地不在清醒的人身上做意识实验）。

里贝特的主要工作涉及自发运动前的某些脑波，以及脑中这些事件与被试出现试图或希望运动的觉知出现的时间有怎样的关系。^[136]他的结果表明，对于这种形式的有意识的觉知，必定存在某个最短时间（100毫秒左右）的神经活动。这个时间的精确值或许依赖于信号的强度以及环境。

他的其他一些更新的工作是关于刺激丘脑的一部分——腹基复合体的效果。腹基复合体主要与触觉和痛觉等感觉有关。这种实验是在一些病人身上做的，在丘脑的这一部分安插电极可以减轻他们难以控制的疼痛。虽然这些实验^[15]并不涉及视觉，但可能与盲视（如第12章所讨论的）的解释有关。因此我将对它们进行描述。

被试的丘脑接受了一定数量的刺激。然后，他（或她）需要判断刺激在何时出现（如果必要的话可以猜）。更精确地说，要判断刺激是出现在一种特殊的光点亮的1秒内，还是随后另一种不同的光点亮的1秒内。被试按下提供的两个按钮中的一个来表明他的选择。如果他不知道刺激何时出现，他就必须猜测，因而平均来说有50%的正确性。当刺激及反应结束以后，他需要按下三个按钮中的一个来表示他是否曾经察觉到了刺激。如果被试在通常的位置上曾察觉到了刺激，即便非常短暂，他也应按第一个按钮。如果他无法确定，或者认为他可能感受到了什么，就按第二个按钮。如果他只是觉得什么也没感觉到，则按第三个按钮。

里贝特及其同事们设计的实验十分复杂，因而我将只叙述其大致结果。刺激是由每秒72次的电脉冲组成；在不同次实验中会传递不同数目的脉冲，其幅度保持不变。结果表明，即便脉冲序列过于短暂而不足以引起觉知，被试的成绩也比随机选择要好。而要察觉刺激（即便这种觉知有不确定性）需要相当长时间的序列。

里贝特及其同事们解释说，这暗示着形成觉知需要一定时间的脉冲刺激。遗憾的是，在这些实验中他们并没有系统地改变刺激的强度。但这些及较早的工作已表明，提高一个固定时程的序列的强度可以改变被试的反应，即从无觉知状态到有觉知状态。简而言之，在躯体感觉系统中，一个弱的或短暂的信号能影响行为但不引起觉知，而较强或较长时间的同样形式的刺激能使觉知出现。由较强或较长时间刺激引起的精确的神经行为尚有待确定。

这一结果意味着，当试图解释盲视时，我们不能忽视一种类似的解释，即，从侧膝体到诸如V4区的通路太弱，不足以产生视觉觉知，但足以对人的行为产生影响。

虽然本章描述的实验尚不能得出任何关于视觉觉知的精确的神经关联的强有力的结论，但它们确实表明通过实验途径来研究意识是可能的。只要我们热情而执着地追求，这样的实验最终一定能促进问题的解决。

另一个平行的途径是试图猜测答案的一般本质，并把它仅仅作为进一步实验的指导。没有这种指导，实验便无法进行，其中一些猜测性的观点将在下一章概述。它们至今尚未形成一个和谐的观点集合，而更像是尝试性建议的大杂烩。不过我们将看到，它们之中的一些观点可以合理地组织在一起。

第16章　种种推测

无论何时我宁愿犯一个前进中的错误，只要它充满不断自我改正的种子。而你就抱着你的僵化的真理去吧！

——维弗雷多·帕雷托（Vilfredo Pareto）^[137]

在一个指定时刻，某些神经元的发放与视觉感知的某些特性有关联。到此为止所概述的实验将有助于我们识别这些神经元。在猴子脑的一侧的视觉皮质区域大约有5亿个神经元。是否存在一些线索能将我们引向所寻找的神经元呢？

存在这样一种可能性，即虽然在任何特定时刻这些神经元中只有一小部分会成为觉知神经元，但它们全都具有扮演这一角色的潜力。从双眼竞争时神经元的行为来看，这似乎不大可能（见上一章的讨论）。不过也有可能有些非觉知神经元却在某些场合起这种作用。更为可能的是存在若干种形式各异的视觉觉知，对应于简单特征的觉知可能十分短暂，生动的视觉觉知则维持的时间更长一些；或许还有一种更深层的形式，它确实是与视觉有关的，但并不与好像出现在脑中的视觉“影像”相对应。我在概述戴维·马尔的观点（见第6章）和杰肯道夫的观点（见第14章）时已经涉及了这个问题。为了把问题简化，让我们把话题集中到生动的视觉觉知上（此时杰肯道夫的观点大致等同于马尔的2.5维图）。

我们的视觉世界的内部图像有一个显著的特征，那就是它组织得相当好。心理学家会很乐意向我们展示它并不像我们常常想象的那样有规律——即，我们对相对大小和距离的判断并不总像工程师的图纸那样精确。但在一般情况下我们观察周围环境的时候很少会把它们弄混。真实的外部世界永远存在于那里，这是事实，因而脑可以利用这一点来检验它可能作出的任何暂时的判断。但是，即便如此，当我们的脑产生一个关于眼前的视觉世界的符号表象时，该表象在空间上仍组织得非常好。

如果视觉等级所有层次上的神经元都对它们所响应的特征在视野中的精确位置十分敏感的话，这就不会让人感到十分惊讶了。但我们已经看到这并非事实。有的神经元对复杂物体（如一张脸）的反应特别好，而不管这张脸是直接位于动物的凝视中心，还是稍微偏向一侧，甚至比正常的正上方位置更偏一些，该神经元的反应都几乎一样好。这是合理的。对于所有的高层次特征，几乎不可能在每个可能的位置上都有一个独立的神经元与之相对应。不可能有足够多的神经元来完成这个任务。

另外，V1区的神经元，确实对有关特征（诸如朝向、运动、颜色、视差等）在视野中的准确位置敏感。它们之所以能做到这一点，是因为那些特征相对简单且固定不变。同时，这也得益于Ⅴ1区中处理出现在凝视中心附近的特征的神经元特别多。

在1974年，心理学家彼得·米尔纳（Peter Milner）发表了一篇颇具洞察力的文章。^[138]在文章中他主张，基于上述原因，初级视皮质（如Ⅴ1区）也像高层视皮质一样被紧密包括于视觉觉知中。他猜测，其实现机制可能涉及了从视觉等级高层的神经元向低层的大量反馈^[1]。目前尚不清楚这些反馈的确切功能。由于它们是皮质之间的连接，它们都来自那些传递兴奋性的神经元。关键问题是它们的强度有多大。对此见解各异。有一种可能是，虽然这些反馈足以调节由其他输入引起的任何发放，但通常仅靠它们的强度尚不能使细胞快速发放。这可能意味着其作用对于后续的几个阶段来说太弱，不足以产生影响。如果区域C反向投射到区域B，而B同样也反向投射到区域A，人们就可能怀疑，除非从C直接反馈到A，否则在C发生的事件能否间接地通过B而对A产生足够的影响？我们将此图解为：

3 - 图4

（仅显示回传通路）。C能影响A吗？或许我们需要一条附加的通路（显示在另外那两条通路的上方）来做到这一点。

3 - 图5

因此我们会问，猴子脑中的哪些皮质区域直接反向投射到了V1区？

参照图52的连接示意图我们可以看到，几乎所有不高于V4和MT层次的视觉区域确实有直接返回V1的连接，大多数等级上更高层次的区域则没有这种连接。这是否意味着仅仅是图52中较低部分的神经元直接与生动的视觉觉知有关呢？

由于皮质V2区也很大，并具有完全的视网膜区域对应，作为一种替代，或许我们只需考虑那些向V1或V2有反向投射的区域。这将涉及更多的皮质区域，但不包括颞下区域（那些名字以IT开始的区域）。

我相信这些观点会包含一定的真实性，但其论据是站不住脚的，无法作为引导我们探索的依据。它有所暗示，但并不令人信服。此外，更新的工作^[2]表明向回投射到V1区的皮质区域比最初想象的要多。此时最好是在探索问题的过程中暂且将此事记在心里，但并不过多地相信它。在这一阶段，最重要的是更多地去了解关于这些众多的皮质反馈的解剖学和行为学。

另一种可行的策略是研究在某种意义上觉知是否需要脑与自身的通信的参与。用神经学的术语说，这或许意味着像杰拉尔德·埃德尔曼（Gerald Edelman）曾经提出的那样^[3]经过一步或多步之后能回到出发点的再进入通路是必不可少的。然而问题是，很难发现一条通路不是再进入的。从该判断规则来看，海马是意识的确切位置（由于它的大部分输入来自内嗅皮质，而它的大部分输出回到那里，故是属于再进入的），但事实并非如此。这个反面的结果表明，我们必须小心地使用再进入规则。

再进入通路最简单的形式也许就出现在仅仅两个皮质区域之间。例如，区域A投射到区域B，而区域B也投射到区域A；但通常这种情况总会出现，它并不能给我们更多的帮助。我们能否将再进入的观点更加精确，并使之更加有用呢？

回忆一下，对于许多皮质区域，如果区域A投射到区域B的第4层，那么区域B并不投射到区域A的第4层。反向投射避开了那一层。我们可以用符号表示为：

3 - 图6

其中实线箭头表示“进入第4层”。这表明我们只需在少得多的情况下寻找两个彼此投射到第4层的皮质区域，用上面的约定，即：

3 - 图7

在图52的等级中，同层次上的皮质区域之间存在这种情况，但不总是如此。MT、V4和V4t就是明显的例子。

这个观点对我很有吸引力。很容易得到一些理论上的论据，使它具有一定的学术地位。遗憾的是，这种所谓的第4层的精细的神经相互连接细节尚未得到仔细研究。这种观点确实值得关注。

让我们来尝试一种相当不同的途径。到目前为止我们主要在谈论皮质区域。我们能否更进一步，试着猜测一下皮质的哪些层参与了表征觉知呢？或者更进一步，在这几层中哪些类型的神经元可能参与了呢？现在我们确实有了为数不多的零散的证据。

有一类引人注意的皮质神经元，它们是第5层的一些锥体细胞。它们是投射到皮质系统之外的唯一的神经元（我指的皮质系统是大脑皮质及丘脑、屏状核等与此紧密相关的区域）。可能有人争辩道，在脑中，从某一部分传到其他部分的应当是神经计算的结果。我已经说过，视觉觉知可能就对应于这些结果的一个子集。这使人们对这些特殊的锥体细胞感到好奇。它们还有其他不寻常的特性吗？（归根结底，科学家所谓的“证明”就是在对一个物体或概念的许多显然不同的方面终究达成一致）事实上，其中一些神经元能以一种特殊的形式发放。许多神经科学家发现这种神经元^[139]趋向于“成簇”发放。他们将电流注入皮质切片上的许多不同的单个神经元中，发现其发放模式有三种类型^[4]。第一种对应于抑制性神经元，第二种是大多数锥体细胞，但第三种神经元看来大部分是第5层较大的锥体细胞，它们在这种环境倾向于成簇发放。这些细胞的顶树突延伸到皮质的顶层（第1层），在那里它们可能接受前面提到的反向投射的输入。

所有这些证据相当粗糙，仍使人不禁怀疑这些第5层的锥体细胞是否与觉知密切相关。即使第5层的锥体细胞确实表达了皮质计算的“结果”，也不能由此得出在各个皮质区域上所有这样的神经元发放时就产生了某种形式的觉知。形成觉知或许还需要其他一些机制，比如说，某些特殊的短时记忆形式，如本章后面讨论的回响回路。

虽然这些观点还只是推测，但是它确实勾画出了一种重要性，即当一个神经科学家报告某些实验结果时，他应当知道他所记录的神经元在哪一层，如果可能的话，还应知道它是哪种类型的神经元。在研究警觉的动物时，这通常会有技术上的困难，尽管更加精心设计的新方法能使之变得容易些。

更为一般的观点认为我们应更为密切地注意皮质的各个层次。虽然一个神经元的树突和轴突经常延伸到几层，但细胞体位于哪一层，也许在正常胚胎发育过程中是由遗传确定的（与之相反，神经元的连接细节则主要受它的经历影响）。如果确实存在某些特殊类型的皮质神经元，其发放与我们所看见的相关，那么我们可以期望这些神经元的细胞体仅仅位于一个或少数几个皮质层或亚层中。

脑试图理解进入眼睛的信息，并以一种紧凑的、组织良好的方式来表达它，其结果就是视觉觉知。但除非它对生物体真的有用，否则没必要这样做。可能有几处不同的区域需要它。这些信息在脑中被送到了哪些部位呢？两个明显的部位是海马系统（包括事件记忆的临时储存或编码）和运动系统（特别是它的较高的规划层次）。我们能否从这两个目的地跟踪回传连接来确定皮质上视觉觉知的位置呢？

遗憾的是，目前这种方法带来的困难比它要解决的困难更多。视觉觉知很可能与其他感觉（如听觉和触觉）的信息在某个阶段结合。当你喝一杯咖啡时，你能感觉杯子的外观及用手摸的感觉，还有咖啡的气息和味道。高级视觉区域确实投射到了多重感觉的皮质区。目前尚不清楚的是，2.5维略图的生动的表面视觉觉知，以及三维模型的不那么形象化的信息，哪一个与送到海马及运动系统的视觉觉知的类型关系更密切？或许二者均是需要的。

目前对皮质视觉区、多重感觉区与海马结构之间的解剖学连接已经了解很透彻了（图52）。它们清楚地表明，视觉区中如V4和MT区以及颞下皮质，并不直接投射到海马。视觉信息必须通过其他皮质区才能到达那里。遗憾的是，当前我们关于这些区域神经元的行为的了解还相当肤浅，还需要进一步研究。

目前对到运动皮质的通路已开展了一些研究，但仍有待深入。此外，还有其他路径更为间接地到达运动皮质。从皮质有大量通路到纹状体，有趣的是这些联结也来自第5层的一些锥体细胞。信息从那里传向丘脑的一部分，再传到皮质的多个运动和前运动区。还有一个通路从皮质到小脑，然后返回丘脑，再到皮质。这些通路中的一些或许参与了“无意识的”、相当机械的活动。如果我们希望了解各种形式的视觉以及其他感官的觉知，还需要更多地通过实验对脑的这些部位进行研究。

觉知神经元的发放常常可能就是有关的神经网络决策而得的结果，这是它的特点之一。作出公正的妥协是个线性过程，作出一个敏锐的决策则是高度非线性的。比如说，选举美国总统是一个非线性过程，按比例选代表则更接近于线性，至少在每个人投完选票以后是这样的。神经元及经扩展而形成的神经网络，其行为是高度非线性的，原则上这是没有困难的。

对于神经元而言，这个机制很可能像总统选举那样是个胜者为王的过程——有许多神经元相互竞争，但仅有一个（或极少数）能获胜，这就是意味着它的发放更为剧烈，或以某些特殊形式发放，同时其他所有神经元则被迫发放更慢，或者根本不发放。

这在人工神经网络中是很容易实现的，只需使每个神经元具有兴奋性输出，同时抑制其他所有竞争者即可。活动最强的神经元有希望压制所有的对手（就像在选举中那样）。但对于真实神经元而言就不那么简单了，因为大多数情况下单个神经元的输出只能是兴奋性的或抑制性的，而不能二者兼有。有许多种策略可能避开这个困难，比如，使得所有兴奋性神经元刺激一个抑制性神经元，而后者反过来又抑制所有的兴奋性神经元，那么对平均抑制优势最大的那个神经元则有可能成为胜者。设计一个能令人满意的执行胜者为王操作的神经网络需要一定的技巧，但确实是可以做到的，特别是允许有不止一个获胜者的话。

似乎没理由认为自然界不曾进化出这种机制。问题在于如何发现在脑中正在进行这种操作的准确位置。到目前为止我们对皮质内部及附近的高度复杂的局域回路的了解还不够，不能有很大帮助。当然，随着我们知识的增加，这将有所改变。人们也许会发现皮质内的神经相互作用十分复杂，以致其中不包含简单的机制。但也可能这种关键过程使用了一些特殊的神经策略。我们所能做到的只有密切注视种种有希望的迹象。觉知并不总要求在两个或多个选择中作出决定[如同看内克（Necker）立方体]，这使问题变得复杂化。在其他情况下，在不同来源的信息间达成妥协或许更为有效，例如利用不同的深度线索判断视野中一个物体的距离。反之，在判断一个物体是否在另一个物体的前面并部分遮挡了它时，决策是必不可少的。

迄今为止我们寻找觉知神经元可依赖的线索相当少，虽然它也指出了一些有希望的方向。我们是否还有更多可循的途径呢？研究短时记忆的神经机制能否使我们获得关于视觉觉知的一些有用的东西呢？事实上似乎可以肯定没有短时记忆我们便不会有意识，但它应该短到何种程度，它的神经机制又是什么呢？

回想一下可知，记忆有两种主要类型。当你主动回忆某件事情时，必定在你的脑中某些地方有神经元发放来表达这个记忆。然而，你能记住许多事情，诸如自由女神像，或者你的生日，但在某一时刻你并不在回忆它们。一般情况下，这种潜在的记忆并不需要相关的神经发放。在储存记忆时，许多突触连接的强度（以及其他参数）被改变了，使得在给定合适的线索后，所需要的神经活动能被重新生成。这样记忆就储存在脑中了。

活动回忆和潜在记忆，（这两种记忆形式中）哪一种参与了我们所感兴趣的极短时记忆呢？比较可能的是活动形式的记忆，即，你对一个目标或一个事件的立刻的记忆很可能是以神经的主动发放为基础的。这又是怎样发生的呢？我认为至少有两种可能的发生方式。

第一种机制是，神经元具有的某些内在特性，如由于它的许多离子通道的特点，一旦它被激发之后，可能会持续发放。这种发放会持续一段时间后消退，或者该神经元在接收到某些使它停止发放的外界信号之前一直发放。第二种机制则有很大差别，它不仅涉及神经元本身，还与其他神经元的连接方式有关。可能存在一些“回响回路”，即由神经元组成的一个闭环，环上的每个神经元要使下一个神经元兴奋，并保持这种活动性不断地循环。这两种机制都可能出现，它们并不互相排斥。

此外，是否可能具有某些潜在形式的短时记忆呢？这将意味着参与的神经元开始受到刺激而发放，继而停止发放；但如果有一个足够强的线索唤醒潜在记忆而成为活动记忆，这些神经元会迅速再度开始发放。但是，除非第一轮的发放在系统中留下了某些痕迹，否则这又怎能发生呢？或许，有关的突触强度（或其他神经元参数）能瞬间改变，可以在短时间内体现这种短暂的潜在记忆。事实上，是否有实验证据表明存在这种突触的瞬间改变呢？附带提一下，克里斯托夫·冯·德·马尔斯博格（Cristoph von der Malsburg）在前面提到的一篇相当难以理解的理论文章中曾提出了这种变化。

克里斯托夫有所不知，此前已有一些关于瞬间突触改变的实验证据。它们最早是在20世纪50年代被发现的，其位于神经和肌肉结合的地方（即激发肌肉的神经与该肌肉接触的地方）[5]，离脑很远。不久以后，在海马也发现了类似的瞬间突触改变（综述见参考文献6）。当轴突脉冲到达一个突触时，它几乎同时改变了该突触，以使该突触强度增加。一个快速脉冲序列可产生一个较大的增长。这种突触强度的增加随后以一种复杂的方式衰减，有的较快，约50毫秒；而慢者衰减时间在几分之一秒到一分钟左右。这正是短时记忆所涉及的时间。还有一些证据预示短时记忆也出现在新皮质的突触上。看来，这主要是由突触的输入一侧（突触前侧）的改变引起的，并可能牵涉附近的钙离子，以及突触结合处附近的突触囊泡的运动。^[140]无论是何原因，几乎可以肯定它是存在的。其大小是可察觉到的。

遗憾的是，现在关于这些瞬间改变的工作极少，这主要是由于突触强度的长时程改变（一个当前很热门的话题）更容易研究。大多数神经网络的理论工作也没有考虑这种情况。因此我们处于很奇怪的境地：一种对意识（特别是视觉觉知）可能是十分重要的现象，同时被实验学家和理论学者忽略了。

或许这种突触权重的瞬间改变对短暂维持回响回路也是重要的。有关突触强度的增加有助于回路保持其回响发放。

如何防止这种持续的发放过度传播并影响其他回路，解决这个问题更困难。脑中有大量的复杂回路，因此如果回响回路确实存在的话，要限定它的准确位置几乎是不可能的。这种类型的回响（与活动的短时记忆有关）是否可能仅出现在一个或少数特殊的位置呢？是否有迹象表明，这种回路在构建时与附近具有相同形式的回路多少有些隔离，从而使记忆不会以一种无控制的方式传播呢？

有一条回路被认为可能参与了极短时记忆。它从丘脑投射到皮质第6层的一类锥体细胞，而这些细胞又有信号返回丘脑的同样部位。这些丘脑神经元和皮质神经元都只有极少的向侧边伸展的轴突侧枝，这样它们可能极少与其近邻有相互作用^[7]。这使它们具有刚才提到的部分隔离性质。

对通路的研究主要集中在皮质V1区及其到侧膝体的连接。其中从侧膝体到第6层的锥体细胞的前向通路，看上去很弱。回传通路从第6层到侧膝体，具有极大量的轴突，可能是从侧膝体到第4层这一主要的前向连接的5～10倍。这本身很令人吃惊，特别是很难发现它们具有什么功能。然而，有关这一通路的大多数实验是在动物被麻醉情况下进行的；此时极短时记忆可能很弱甚至不存在，因而动物是无意识的。利文斯通和休伯在数页前提到的文章中，指出他们发现侧膝体神经元的活动在慢波睡眠时降低了。这可能会产生影响。虽然信号能从侧膝体传到皮质V1区（如他们发现的那样），但这些信号不够大，无法维持任何回响活动。现在已经知道有来自脑干的通路可以在慢波睡眠期改变侧膝体的活动（同时，通过延伸也可改变丘脑其他部分的活动）。

那么可以假设这些第6层的神经元与意识的一个关键因素——维持体现极短时记忆的回响回路——紧密相关。这与早期的一般观点是一致的，即主要是皮质较低层次的活动一般与意识有关，特别是与视觉觉知有关。

是否可能存在与所有皮质区域关联的这种回响回路呢？换句话说，是否所有的皮质区域都在第6层具有锥体细胞投射到丘脑的某些部位，并从那里向回投射到同样那些第6层的锥体细胞呢？很遗憾，我们对此尚不完全清楚。或许只有感觉处理（它们具有可察觉的第4层）的低层及中间层次具有这种短时记忆形式所需要的第6层的回响回路。这也是杰肯道夫提出的有意识的觉知所需要的。或许一个到第4层的较强的输入能使第6层的回响回路激起更大的活力。如果所有这些都被证明是真的，这就把脑结构和杰肯道夫的假设有意义地联系在一起了。这种可能性令人振奋。

让我们先把这些推测放到一边。是否有证据表明神经元的持续发放与短时记忆的某些形式有关联呢？在前人工作^[9]的基础上，耶鲁大学的帕特丽夏·戈德曼—拉基克（Patricia Goldman-Rakic）和她的同事们做了这样的实验^[8]。他们训练一只猴子凝视电视屏幕中央的一个点，同时在屏幕其他地方随机地呈现一个目标刺激。当目标不再呈现，经过一段延迟后，要求猴子把眼睛移到刚才目标所在的位置。实验者研究了动物脑前额叶区视觉神经元的反应。通常当目标在屏幕的一个特定地方呈现时，有一个特定的神经元会对它作出响应，其他的神经元则会对屏上不同地方的目标作出响应。引人注目的是，这种神经元通常在刺激被撤掉后许多秒内仍能维持发放，直到猴子作出反应。此外，如果这种活动不再保持下去（这偶尔也会发生），猴子很可能会出现错误。简而言之，看来这些神经元像是对应视觉特定的空间位置的工作记忆系统的一部分。^[141]或许在脑中其他地方还有这种系统对应于其他类型的工作记忆。这样我们至少有一个例子是神经元的持续发放参与了短时记忆1，尽管其他情况下的证据还有怀疑。

注意到这是一个单一的任务，因此猴子可能在延迟中在脑中重复这个任务。如果猴子必须执行两种迥然不同的任务的话，神经元的活动情况又会如何，尚不得而知。我们也不了解维持这种持续发放的神经机制。就像对注意的研究一样，我们可以说对短时记忆的神经机制的研究已经开始，但要揭示其奥秘还需大量的实验工作。

1.遗憾的是，这些神经元的发放方式并不能证明回响回路的存在。

第17章　振荡和处理单元

预言是一件困难的事情，特别是如果它涉及未来的话。

到此为止我还很少谈及可能解决捆绑问题的方法。一个物体（或事件）的不同特征在脑中对应于不同的神经元发放。捆绑问题即如何将这些神经元捆绑在一起。如果在一个感知时刻察觉到不止一个物体，这个问题就尤为突出。捆绑的重要性在于它可能至少对某些类型的觉知是必需的。在第14章曾提到捆绑可能通过有关的神经元的相关发放来实现。一种非常简单的相关发放形式是所有牵涉的神经元同时以一种节律形式发放（虽然节律对相关而言并非本质）。图57是一个理想化的例子，它显示了神经元每100毫秒有一簇发放，频率约为10赫兹。频率在此附近的节律称为“α-节律”。从头皮记录到的脑波（即脑电波图，EEG）是相当杂乱无章的信号，从中可以探测到这种节律以及其他节律。是否有实验证据表明由神经元组成的群体中存在相关发放呢？

一段时期以来人们已经知道，嗅觉系统中出现了具有振荡形式的相关发放^[1]，但直到最近才在视觉皮质中清楚地观察到这种振荡。最令人振奋的结果来自德国的两个研究小组。法兰克福的沃尔夫·辛格（Wolf Singer）、查尔斯·格雷（Charles Gray）及他们的同事们在猫的视皮质观察到了振荡现象^[2]。这些振荡的频率为35～75赫兹，常被称作“γ振荡”，或不那么精确地被称作“40赫兹振荡”。马尔堡的莱因哈德·艾克霍恩（Reinhard Eckhorn）和他的同事们独立地观察到了这种振荡^[3]。他们使用了一种用于探测“场电位”的电极，能够特别清楚地观察到这种现象。大致说来，场电位所显示的是电极附近的一群神经元的持续变化着的平均活动，它很像是在鸡尾酒会上在一大群人中听到的叽叽喳喳的谈笑声。

这些实验比较新，而更新的实验结果仍不断出现。在这里，我仅给出一个非常简单的描述。

正如前面叙述过的，当视野内出现适当的刺激时，视皮质的一些神经元会变得活跃起来，并以一定的节律形式发放。在它们附近的平均的局部电活动（场电位）常表现为在40赫兹范围内的振荡。这种神经元发出的脉冲并不随机出现，而是和局域的振荡“合拍的”（图60）。一个神经元会合拍地发放由两三个脉冲形成的短簇。有时它也可能根本不发放；但当它发放时，经常是与它的一些神经元“同伴”近似同步的。这些振荡并不很规则。它们的波形更像一条随手画出的粗糙的波，而不像具有恒定频率的非常规则的数学上的波。

辛格和同事们经常发现，当使用两个离得不太远的电极作记录时，如果其中一个电极附近的神经元发放，它们趋向于与另一个电极附近的神经元的发放同步。甚至当两个电极分隔达7毫米远，场电位还可能具有同位相振荡。不过这种情况更多出现在使它们兴奋的运动刺激是属于同一个物体而不是两个物体的时候^[4]。只是目前支持最后一个陈述的实验证据还相当少。另外有实验表明，运动光棒能在第一视区和第二视区的相应位置引起同位相的节律发放，这正说明同步可以出现在不同皮质区域的神经元之间^[5]。此外，也有实验表明同步可以出现在大脑两半球皮质之间^[6]。

3 - 图8

图60　一些神经元以40赫兹节律发放的示意图（一个40赫兹的振荡每25毫秒重复一次）。光滑曲线表示局域场电位。它测量的是附近许多神经元的平均“电活动”。短的竖线表示的是一个神经元的发放。现在请注意，当这个神经元发放时，它是如何与由局域场电位表达的邻近神经元的发放“合拍”的（在画场电位时，我把绘图惯例倒了过来）

德国的这两个研究小组都认为，这些40赫兹振荡可能是脑对捆绑问题的解答。他们提出，标志同一个物体所有不同属性（形状、颜色、运动等）的神经元通过同步发放将这些属性捆绑到一起。科赫和我将这一观点推广了一步，认为这种与γ振荡（35～75赫兹）合拍（或在此附近）的同步发放可能是视觉觉知的神经关联^[7]。这种行为将是其他理论家提出的相关发放的一种特殊情况。

我们还认为，注意机制的主要功能可能是选择一个被注意的物体，然后帮助把所有神经元同步结合起来，这些神经元对应于脑对这部分视觉输入的最佳解释。我们猜测，丘脑是“注意的器官”，它的某些部分控制注意的“探照灯”在视野中从一个显著目标跳向另一个。

这些开创性的实验是在猫被轻度麻醉时进行的。在猫被深度地麻醉（使用巴比妥盐）的情况下没有观察到振荡，但此时神经元的活动性无论怎样都极度降低了，因而这一结果本身并未提供很多信息。最近的实验是在清醒的猫上进行的（查尔斯·格雷在同我的私人通信中提到了此事）。这里也存在40赫兹的振荡，因而振荡并不是麻醉引起的伪迹。一些新的实验使用了轻度麻醉的猴，在皮质第六区的也发现了振荡^[8]。在清醒的猴子皮质MT区的实验表明，使用运动棒作为视觉输入时能观察到振荡^[9]，当呈现伪随机运动的点组成的图案时则不然^[10]。目前尚不能解释这种行为上的差异。这更像是振荡参与了图形/背景的鉴别，而不是视觉觉知。艾伯哈德·菲尔兹（Eberhard Feltz）及其同事们在清醒的猴子的运动/躯体感觉皮质的实验中^[11]也清楚地观察到了振荡，特别是当猴子完成一项需要注意的复杂的操作任务的时候。

观察到的振荡通常是相当短暂的^[12]。它们持续的时间常常依赖于所用的视觉信号呈现的长短。正如一些理论预测的那样，不同位置的神经元集团间的相关振荡仅持续几百毫秒。总的来说，很难让人们相信外部世界在我们的脑中留下的生动逼真的景象完全依赖于如此杂乱、难以观察到的神经活动。

现在你或许会感到迷惑，就像警察在侦破一个困难的谋杀案的初期状态一样。这里线索很多，但没有哪个能令人信服地指出这个谜团的可能的解答。这就是公众最难以体会的那一类警察工作——沿着众多相当弱的线索进行系统的、费力的追踪。对于视觉觉知方面的科学探索也是如此。我们都想知道答案，但若不仔细地检查不同的“痕迹”，就不可能找到答案。可能有许多线索最终被证明是误导甚至完全是错误的。

从所有这些考虑当中我们可以知道，视觉觉知可能有若干种形式；推而广之，一般说来意识甚至可能有更多的形式。我们能否找到某种方法把视觉觉知的这些不同形式同灵长类动物视觉系统的结构和行为联系起来呢？

回想一下我所描述的视觉处理有三个可能阶段：一个阶段非常短暂，大致对应于马尔的要素图；一个更为持久和生动，大致对应于他的2.5维图和杰肯道夫的中间层次；还有一个三维的以物体为中心的过程，它并不对应于我们所真实看到的东西，而是对我们所看到的物体的某些推测。我生动地看到一个特定物体的轮廓和可视表面，这些表明它是茶杯，并具有推断出的三维形状。通常“看”这个词包括这么两种用法。如果我说“你看见那边的那个杯子了吗？”，我在两种意义上使用了看这个词。我可能仅仅是指杯子呈现在我面前的可视表面，也可能指所推断的整个杯子的三维形状。注意，2.5维图和三维模型是一类问题的两种推断，即它们都具有对这个视觉输入的解释，并且都可能是错的。我们对单词的日常用法可能并不精确地描述脑的真实行为。

有一种观点认为视觉处理的每个层次都有某个丘脑区域与之对应^[142]，我称之为处理假设。从同一个丘脑核团接受输入的皮质区之间有什么共同之处？这个关键问题人们很少提及。

我们都知道在灵长类视觉系统中侧膝体（丘脑的一部分）主要与V1区有关联。灵长类丘脑有一个很大的部分被称为“丘脑后结节”，丘脑的其他视觉区都位于这里（见第15章）。它具有大量不同的亚区，其中一些亚区可能由若干更小的区域构成。是否每一个区域都与视觉处理的某一个阶段相关呢？这有两种可能性。一种可能是，这些亚区（其中三个是主要的，即前部、侧部和中部丘脑后结节）可能各与戴维·马尔理论中的一个阶段（即要素图、2.5维图和三维模型）或某些类似的东西有较强的关联。另有一种可能，即更小的、数目更多的小亚区各与范·埃森的视觉等级（图52）的一个层次有强相关。当然，这两种可能都具有一定真实的成分。

“强相关”是什么意思呢？丘脑向皮质发出的连接有两种形式：一种连接到第4层（或第3层）；另一种则避开了这些中间层，通常有很多向第1层的投射。第一种类型连接可能是驱动性的，第二种则更像是对已经发生的事件进行调节。我指的强相关是那些到中间层的驱动性连接。在这个简短的考虑中我暂时放下另一种类型。

最简单地说，处理假设就是任何一个皮质区域仅仅与丘脑的某一部分密切相关。这种观点并非完全不可信。皮质V1区只与侧膝体密切相关，而与丘脑其他部分没有关系。人们发现，形成马尔的要素图（或某些类似的东西）的特征确实在V1区出现。在那里标识的信息对应于相当简单的局部特征，如视野中一小部分图像的朝向。科赫和我设想V1区可能是十分短暂形式的视觉觉知的所在地^[7]。我们认为这并不需要注意机制。实验表明^[13]，猴子的注意并不影响V1区神经元的发放，这可以认为是对这种提法的支持。

我们对其他部分的丘脑连接的细节尚不够了解，不能判断出假设是否正确。除了V1区以外，每个皮质区域是否仅仅与丘脑后结节的一个部分有强的连接呢？如若不然，它们又是怎样连接的呢？要回答这个问题还需要更多的实验。也有可能一些丘脑区域恰好与参与视觉觉知的皮质区有强的连接。

那么，假设的三维模型阶段又怎样呢？这种情况我们几乎不知从何下手。心理学家欧文·比德曼（Irving Biederman）认为这种表象将基于他称为“几何子^[143]”的某些原始的三维形状^[14]。一些理论家（如托马索·波吉奥）则认为我们脑中所具有的是一个物体的一系列二维视图，以及在它们之间进行内插的能力^[15]。这两种观点很可能都是对的。如果所有这些确实存在的话，它们在猴子脑中究竟发生于何处尚有待确定。由于缺乏这些知识，要评价处理假设是困难的。许多乍看起来很美妙的假设常常由于实验的不确定性而停滞不前。

不管怎么说，处理假设确有某些吸引人之处。它表明，我们或许将意识和无意识这两个词用于许多有差异的活动中。它们或许应该由某些短语如“处理单元”或者在某些情况下由“觉知单元”代替。每个觉知单元具有它自己的半全局表象，通常覆盖几个皮质区域。它们可能具有各自的特征处理时间，各自对应于极短时记忆的特征时间（如，V1区非常短，高级皮质区域则较长些），以及，更重要的是，它自己的特殊的表象形式：V1区的简单特征，下一个更高皮质表达的2.5维物体，等等。每一种形式的处理单元的特性会依赖于那种特殊表象的内容和组织。有可能每个特殊的丘脑区域都使用它自己的注意形式，允许它的皮质区域集团中的神经元发送信息到丘脑的神经元，而丘脑的神经元又将信息反馈回去，如此通过某种方式来协调它们的发放。这里还有一种推测性的观点（在第16章描述过），即丘脑—皮质—丘脑回路可能是紧密地关系到极短时记忆的回响回路。

当然，在许多不同皮质区域之间有复杂的、并不通过丘脑的直接连接，如图52所示。处理假设并不意味着神经元活动仅有一种流动方式，即不一定是从较低处理单元到较高单元。几乎可以肯定存在多个方向的信息流动。

这并不意味着丘脑自己能产生觉知的所有不同形式。除了丘脑以外，形成觉知还需要各个皮质区域的电活动，这就像指挥演奏乐曲的管弦乐队一样。^[144]（由此）至少可以说，如果你对视觉觉知或者意识的其他方面感兴趣，那就不能忽略丘脑。有人或许会无视那“微不足道”的侧膝体，说它不过是一个中继站。但是研究视觉系统的学生会问：“那为什么一定要有丘脑后节结呢？”这并不是脑中一小块不重要的区域；事实上，它在灵长类进化过程中变得越来越大。它可能具有某些重要的功能，但那又是什么呢？尽管在细节上比较含糊，处理假设确实提出了一种可能性。

丘脑是意识过程的一个关键参与者。这并非一个新观点。很早以前怀尔德·彭菲尔德（Wilder Penfield）^[145]就提出过这个观点^[16]。詹姆斯·纽曼（James Newman）和伯纳德·巴尔斯（Bernard Baars）在新发表的一篇文章^[18]中扩展了后者的观点（这在第2章有过简短的讨论），提出，丘脑区的称为“层内核”的某些核团把信息传播到他们所假想的全局性工作空间。这些核团中有一个称为中央核，与视觉系统密切相关。它们主要投射到脑的一个重要的部分——纹状体，也有较少的一部分投射到许多皮质区域。纹状体与运动系统有很强的连接，但它的某些部分也可能涉及更具有认知特性的问题。它是脑中帕金森病侵袭的部位之一。

每个层内核向外发出何种具体信息，尚有待探索^[146]。纽曼和巴尔斯也很强调丘脑的网状核的作用（在第10章描述过）。就像我曾经考虑的^[19]，他们相信网状核可能参与了对注意的控制。目前还不清楚网状核在丘脑中是否能执行所要求的选择性的程度。它或许只有一个功能，就是当脑处于睡眠或清醒等状态期间全面控制丘脑和皮质的活动。如果丘脑确实是形成意识的关键，网状核很可能参与了意识的某些控制。

这里还需简述一下另一个脑区，即屏状核^[20]。它是靠近“脑岛”（皮质的一部分）附近低级皮质区的由神经元组成的薄片。其输入主要来自皮质，而大部分输出也返回到皮质，因而它犹如皮质中的一颗卫星。它接受来自许多皮质区域的输入，并可能向它们全体发回连接。皮质某些视觉区域（但不是全部）投射到它的一部分，（在猫脑中）形成一个单独的视网膜区域对应图。这些视觉输入与其他屏状核的输入可能有所重叠。近几年似乎很少有关于猴子屏状核的工作，因而上面所说的可能有某些不准确之处（例如，那里可能有两个视觉投射图）。

屏状核的功能尚不为人所知。为什么所有这些信息会汇总到一个薄片呢？人们或许会猜测屏状核具有某种形式的全局功能，但没有人知道那是什么。尽管它只是脑中一块相当小的区域，但也不可完全忽视它。

处理单元很有可能存在一个等级式系统。从某种意义上，有些可能对其他的部分执行某种类型的全局控制。还有一些神经元群（如屏状核和丘脑的层内核）向皮质有很广泛的投射，它们可能就扮演着这种角色。

回顾前面两章可以看出，目前并不缺乏看似合理的观点和实验。令人失望的是，目前看来还没有一些观点能以令人信服的方式组织在一起，以形成一个详尽的、貌似正确的神经假设。如果你觉得我就像在丛林中摸索道路，那你是完全正确的。研究前沿领域时，情况通常会这样。但现在我确实感觉到比十年前对“关键问题是什么”有了更深刻的理解。我甚至常对自己说，我能瞥见某些答案。不过，这是人们长久地研究一个问题时产生的一种共同的幻觉。我们已经探索到了较高的层次，因此，即使道路还很漫长和艰难，我们已经看到了探索的最佳方向。

尽管有所有这些不确定性，在仔细考虑所有这些非常分散的事实和推测之后，是否有可能描绘出一些全局性的示意图（哪怕是尝试性的），用来大致指导我们穿过面前的丛林呢？让我抛弃那些谨慎，勾画一个可能的模型。现实可能比它要复杂得多，而不大可能更简单。

意识是与某种神经活动相关联的。一个合理的模型认为这些活动发生在皮质的较低层次，如第5层、第6层。这种活动性表达了主要发生在皮质其他层次上的大部分“计算”的局部的（暂时的）结果。

并非较低层次上所有的皮质神经元都能表达意识。表达意识时，起最主要作用的是位于第5层的大的“成簇”的锥状细胞，例如向皮质系统外投射的那些细胞。

除非这些特殊的较低层次的活动由某些形式的极短时记忆维持不变，否则它不能到达意识。有理由认为，这可能需要一个有效的回响回路，从皮质第6层到丘脑，再返回到皮质第4层、第6层。如果缺乏这个回路，或者第4层太小，就不可能维持这些回响。因此仅有一些皮质区域能表达意识。

处理单元（其中仅有一些与意识有关）是这样一些皮质区域的集合^[147]，它们处于视觉等级的同一层次上，并彼此向对方的第4层投射。每个这样的皮质区域集合都仅与丘脑的一个小区域有强连接。这样的区域通过同步发放协调与它相关的皮质区的电活动。

丘脑与注意机制密切相关。在进行物体标识操作（特别是图形/背景分离）时所需的特殊捆绑，通常具有调谐的发放形式，它的节律通常在40赫兹范围内。

参与意识的区域可能影响（不必是直接的）自主运动系统的一部分（二者之间可能有某些无意识的操作，如思考）。

再重复一下，意识主要依赖于丘脑与皮质的连接。仅仅当某些皮质区域具有回响回路（包括皮质第4层、第6层）并具有足以产生明显的回响的强投射时，意识才可能存在。

对于这个似乎合理的模型就讲这么多了。我希望不会有人把它称为克里克（或克里克—科赫）的意识理论。在我写下这个模型时，我内心对于材料的取舍颇为踌躇。如果它是别人提出的，我会毫不犹豫地指责它是一碰就塌的纸房子。因为它是拼凑起来的，并没有足够的关键性实验证据支持它的各个部分。它唯一的价值在于可能推动科学家和哲学家从神经的角度考虑这些问题，从而加速意识方面的实验进展。

更加哲学性的问题又是怎样的呢？我确信当我们完全理解了意识的神经机制时，这些知识将回答两个重要问题：意识的一般本质是什么？进而使我们可以有意义地谈论其他动物的意识的本质，以及人造机器（如计算机）的意识：意识给有机体带来了哪些好处，从而我们可以发现为什么会有意识。最终或许会发现，视觉觉知的出现是因为它的详细信息需要发送到脑的若干不同区域。把这些信息彻底明晰化可能比把它们以隐含的方式沿着不同的通道传递更有效。具有一个单独的清晰的表象也可以防止脑的一部分使用对视觉场景的一种解释，同时，另一部分使用另一种相当不同的解释。当信息仅需要被送到一个地方时，它会按照经验而不必通过意识便可以到达那里。

真正被证明存在困难或不可能建立的是意识的主观本质的细节，因为这将依赖于每个有意识的有机体使用的精确的符号体系。除非我们能够把两个脑以一种足够精确而详细的方式联系到一起，否则我们无法直接把一个脑中的符号体系传递给另一个脑。即便我们能够做到这一点，它或许还有自身的问题。但是，如果不了解意识的神经关联，我并不相信这些问题中的有哪个能得出会思考的人们能接受的答案。

我特别要对那些目前相当活跃地工作在脑（特别是视觉）研究领域的许多科学家说几句话——正是他们所持有的相当保守的态度，阻碍了实验研究的顺利进行。

他们过于看重那些我含糊略过的许多复杂问题。他们不应该用这些错误和忽略作为他们不面对本书的广博的信息的借口。在我们观看时，脑中发生了些什么呢？忽略这个全局的问题而只研究视觉的某些特殊问题，这种做法现在是行不通的。一个门外汉会认为这种态度过于狭隘，而事实正是如此。就像我试图表明的那样，目前视觉觉知问题在实验和理论上都是可以进行探索的。此外，如果我们积极地面对这个困难，我们就会开始从一个全新的角度考虑问题，寻找先前显得无关或很少有兴趣的信息（如动态参数或者短时记忆）。我希望不久以后每一个研究人类及其他脊椎动物视觉系统的实验室都在墙上张贴有一条醒目的标语，写着：

3 - 图9

第18章　克里克博士的礼拜天^[148]

作为人类，真正重要的是我们自己主观的精神生活，包括感官感受，感情，思想，有意志的选择。

——本杰明·里贝特

意识问题的研究已经提到日程上来了。我们已经了解了视觉系统的复杂性，以及视觉信息是如何按一种准等级的方式进行处理的（这种准等级方式只有部分是我们了解的）。我还概述了关于视觉觉知的神经机制的几个观点，并简要提出了可能有助于揭示它的机制的几个实验。我们显然还未完全解决这个问题，那么，到目前为止已经得到了些什么结果呢？

科赫和我正在试图去做的就是使人们，特别是那些与脑研究有密切关系的科学家，相信现在是严肃地对待意识问题的时候了。我们猜测，真正有用的可能是那些关于意识的一般性的探讨，而不是某些详细的建议。本书所讨论的那些设想并不是一些详细拟定的、有条理的观点。相反，它们还在发展之中。我相信，我们尚未发现将意识概念化的确切途径，而仅仅是在朝这方向摸索着前进。这正是实验证据如此重要的原因之一。新的结果会引出新的观点，也会使我们察觉出旧观念中的错误。

哲学家们试图去寻找解决这个问题的更好的方法，并想指出我们目前思考中的谬误，这当然是正确的。但他们仅仅取得了极少的实质性进展，这是由于他们是从外部观察系统的。这使得他们使用了错误的术语。从神经元的角度考虑问题，考察它们的内部成分以及它们之间复杂的、出人意料的相互作用的方式，这才能从本质上解决问题。只有当我们最终真正地理解了脑的工作原理时，才可能对我们的感知、思维和行为作出近于高层次的解释。这将有助于我们以一种更加正确和严谨的方式理解脑的所有行为，以取代我们今天的那些模糊的庸俗观念。

许多哲学家和心理学家认为目前从神经元水平考虑意识问题的时机尚不成熟。事实恰恰与此相反。仅仅用黑箱方法去描述脑如何工作，特别是用日常语言或数字化编程计算机语言来表达，这种尝试为时尚早。脑的“语言”是基于神经元之上的。要了解脑，你必须了解神经元，特别是了解巨大数目的神经元是如何并行在一起工作的。

读者也许会接受所有这些观点，同时又抱怨我更多地用推测而不是用铁一样的事实来谈论意识话题，并且回避了归根结底最让人困惑的问题。我几乎没有涉及可感受的特征（如“红颜色”的红）的问题，而仅仅将它推到一旁并期盼有个最好的结果。简而言之，为什么“惊人的假说”如此惊人呢？脑的结构和行为是否存在某些方面可以向我们暗示，为什么从神经角度了解觉知如此困难呢？

我认为某些暗示是存在的。我已经描述了脑这个复杂机器的一般工作情况。它可以在一个感知时间内迅速地处理总量巨大的信息。脑是个丰富的相互关联的信息的载体，它的许多内容是连续变化的，然而这台机器却能设法保存它刚刚所做的各种运行的记录。我们通过内省得到了非常有限的体验，但除此以外并未遇见任何机器具有这些特性。因而内省的结果显得比较奇特，这也不足为奇了。约翰逊—莱尔德也提出过一个类似的观点（这在第14章引述过）。如果我们能构建一台具有这些惊人特性的机器，并能精确地跟踪它的工作，我们会发现掌握人脑的工作原理就容易得多了。就像现在我们了解了DNA、RNA和蛋白质的功能之后，关于胚胎学的神秘感已大部分消失了，关于意识的神秘特性也将消失。

很明显，这引出了一个问题：在将来，我们能否造出这样的机器？如果能的话，它们看上去是否具有意识呢？我相信，最终这是可以实现的，尽管也可能存在着我们几乎永远不能克服的技术障碍。我猜想，短期之内我们所能构造的机器就其能力而言与人脑相比很可能非常简单，因此，它们只可能具有形式非常有限的意识。或许它们更像是一只青蛙甚至是一只低等的果蝇的脑。在理解产生意识的机制之前，我们不大可能设计一个恰当形式的人造机器，也不能得出关于低等动物意识的正确的结论。

应当强调的是，“惊人的假说”是一个假说。我们已有的知识已足以使它显得合理，但尚不足以使人们就像信服科学——证实了许多关于世界本质（特别在物理学和化学方面）的新观点——那样信服它。其他关于人类本质的假设，特别是那些以宗教信仰为基础的观点，它们的证据更站不住脚，只不过这本身并未成为否定这些观点的决定性的论据。只有科学的确定性（及其所有的局限性）才能最终使我们从祖先的迷信中解脱出来。

有人会说，不管科学家们怎么说，他们确实相信“惊人的假说”。这只在有限的意义上讲是对的。如果没有一些先入为主的思想指导，你不可能成功地解决一个科学难题。因此，泛泛而论，你首先应信奉这些观点。但对一个科学家来说，这仅仅是暂时的信仰。他们并不盲从于它们。相反地，他们知道，或许某些时候推翻某个珍爱的观点会取得实质性的进展。我不否认科学家对于科学解释有一种先入为主的倾向。这种倾向是有道理的，不仅仅是因为这支撑着他们的（科学）信念，更主要是因为近几个世纪以来科学已经取得了如此惊人的成功。

下一件需要强调的事是，意识研究是一个科学问题。科学与意识之间并没有什么不可逾越的鸿沟。如果从本书中能学到些什么的话，那就是我们现在看到了用实验的方法可以探索这个问题。那种认为只有哲学家可以解决这个问题^[149]的观点是没有道理的。过去的两千年哲学家有着如此糟糕的记录，因而他们最好显得谦虚一些，而不要像他们常常表现的那样高高在上。毫无疑问，我们那些关于脑的工作原理的暂时性观点需要澄清和扩展。我希望能有更多的哲学家学习有关脑的足够的知识，以便提出关于脑工作的观点，并在与科学证据相抵触时，放弃自己所钟爱的理论。否则他们只会受到嘲弄。

历史上，宗教信仰在解释科学现象方面的记录是如此之差，几乎没有理由相信这些传统宗教会在将来表现得更好。意识的许多方面，如可感知的特性，完全有可能是科学所不能解释的。过去我们已经学会了生活在这种局限当中（例如，量子力学的局限），它们仍将伴随着我们的生活。这并不意味着我们将被迫去信仰宗教。不仅仅大多数流行的宗教信仰是相互矛盾的，而且从科学准则来看，它们是建筑在如此脆弱的证据上，以至于只有那些盲目忠诚的人才会接受它们。如果教徒们真的相信死后会有生命的话，那么他们为什么不设计一些有力的实验去证实这件事呢？或许他们不能成功，但至少可以尝试下。历史表明，许多神秘现象（如地球的年龄），过去教会认为只有他们才能作出解释的，现在都已被科学的探索代替。此外，真实的答案通常与传统宗教给出的解答相距甚远。如果宗教曾经揭示了些什么的活，那就是证明了它们通常是错的。这种情况在解答科学探索意识问题时显得格外强烈。现在，唯一的问题是如何着手去解决它以及何时开始。我极力主张应该立刻开始研究。

当然，有不少受过教育的人士认为，“惊人的假说”是如此的合理，并没什么惊人的。我已在第1章简要地谈到了这一点。我猜想这些人常常并未理解这一假说的全部实质。我自己有时也发现很难回避头脑中有个小矮人“我”的想法。人们很容易就滑到了那个观点当中。“惊人的假说”说的是，脑行为的所有方面都来自神经元的活动。这并不是说，我们用神经术语解释了视觉处理的所有各种复杂阶段以后，就可以因为“看”这一行为确实是“我”所做的，从而草率地假设它的某些特征不需要解释。例如，除非有一些神经元的发放标志着你脑中的缺陷，否则你就不可能觉察这个缺陷，并不存在一个不依赖于神经发放的独立的“我”去识别缺陷。同样地，你通常不知道某些事情在脑中发生于何处，因为在脑中并没有这样一些神经元，它们的发放标志着它们或其他神经元在脑中的位置。

读者有理由抱怨本书所讨论的问题极少涉及他们所理解的人类灵魂。我没有讲述任何关于人类最具特色的能力——语言，也没谈论我们如何求解数学问题，或是问题的一般求解。即使对视觉系统我也几乎没有提到视觉想象，或是我们对绘画、雕塑、建筑等的美学感受。没有一个词讲述我们在同自然界的接触中所得到的真实的愉快。自我觉知、宗教体验（它可能是真实的，尽管通常对它的解释是错误的）等话题完全被忽略，更不要说坠入情网了。一个教徒可能会断言，对他来说与上帝的关系才是最重要的。科学对此又能说些什么呢？

现在这种批评是完全有道理的，但倘若将这些内容加入本书，那就会显得对科学方法缺乏正确的理解。科赫和我之所以选择考虑视觉系统，是因为我们感觉到，在所有可能的选择当中，在这方面最容易取得实验上的突破。本书清楚地表明，尽管这种突破并不容易，但它确实有取得成功的机会。我们的其他假设是，一旦我们完全理解了视觉系统，将更容易研究“灵魂”的那些更迷人的方面。只有时间能够说明这种判断是否正确。新的方法和观点可能会使得其他的探讨途径更有吸引力。科学的宗旨是解释人脑的所有方面的行为，其中包括音乐家、神秘主义者以及数学家的脑的行为。我并不认为这能很快实现，但我确实相信，只要我们不断进行这种探索，我们迟早会有透彻的理解。这一天或许就在21世纪。我们越早开始，我们就能越早地得到对自然本质的清晰的认识。

当然，有些人会说他们并不想了解思维如何工作。他们相信，理解自然便是亵渎她，因为这消除了对她的神秘感和本能的敬畏感，这些感觉是我们面对那些知之甚少并且留下深刻印象的事物时产生的；他们更喜爱古代神话，即便它们已经和现代科学有明显矛盾。我并不同意这种观点。对于我来说，现代的宇宙观——它比我们的祖先所想象的要古老得多，也大得多，并且充满了神奇的、难以预料的物体，如快速转动的中子星——使早期以地球为中心的世界显得过于自大和狭隘，这种新的知识并没有减少对其的敬畏感，反而大大增加了这种效果。我们关于动植物结构（特别是我们身体的结构）的详细的生物学知识也起到了同样的作用。赞美诗的作者写道：“我是多么神奇和美妙啊！”但他也只不过是非常间接地瞥了一眼精巧和微妙的分子结构的本质而已。进化过程中包含了许多我们祖先一无所知的奇迹。DNA的复制机制，尽管其本质是那样简单和优美，令人难以置信，但在进化过程中却变得十分复杂和精细。如果一个人看到这些而并不感到很神奇的话，那一定是感觉迟钝。认为我们的行为是以大量相互作用的一群神经元为基础的，这并不会贬低我们对自身的看法，相反，会大大扩展我们的观念。

有报道说，有一位宗教领袖看到一幅很大的单个神经元的示意图后叫道：“脑就是像这样的啊！”虽然单个神经元是一件精密的、设计良好的奇妙的分子机器，但我们的脑并不是由单个神经元构成的。真实的脑的情况是：神经元有数十亿个，它们之间的相互作用模式十分复杂且不断发生变化，而这些神经元相互之间的连接方式从细节上说因人而异。我们平常用来描述人类行为的方式是经过删节和近似的，它只不过是我们真实自我的一种模糊的描述。莎士比亚说过：“人是一件多么伟大的艺术品！”如果他生活在现代，一定会给我们写出衷心庆贺所有这些伟大发现的诗篇。

如果“惊人的假说”能最终被证明是正确的话，它也不太可能被广泛接受，除非它的表达方式能迎合大众的想象力，并能满足他们的需要，以他们所容易理解的方式形成对世界和自身的和谐观点。具有讽刺意味的是，虽然科学的目标恰恰是形成这样一种统一的观点，但是许多人发现，目前大多数的科学知识过于没有人性，过于难以理解。

这并不奇怪，因为大多数科学研究的是物理、化学等领域及其相关学科（如天文学），这些都与大多数人的日常生活多少有些距离。将来这会有所改变。我们可以期望更准确地理解直觉、创造力和美学享受等精神活动的机制，以便能更清楚地掌握它们，并像希望的那样更好地从中得到乐趣。自由意志（见跋）将不再神秘。这就是为什么如果以一种过于幼稚的方式理解我们的假说就会产生误解而一无所获。深入洞察脑的神奇的复杂性会使我们产生惊奇和赞叹，而这种复杂性我们今天只能隐约地感受到。

尽管仅从科学事实中我们可能无法推断出人类的价值，但是，如果假如科学知识（或非科学知识）对我们如何形成价值观没有影响，那也是没有说服力的。我们需要运用灵感和想象来构成一个新的世界体系，但建筑在错误基础上的想象最终是不会成功的。我们可以做梦，但现实已经无情地敲响了大门。即使我们所感知的现实大多是我们的脑构想出来的，它也必须与现实世界一致，否则最终我们会对它越来越感到不满。

如果科学事实足够明显，并被很好地确认，而且是支持“惊人的假说”的，那就可以说人具有非实体的灵魂的观点就像“人具有生命力”这个古老的观点一样是不必要的。这与当前数以亿计的人的宗教信仰是直接矛盾的。人们又怎样接受这种激进的挑战呢？

或许有人会自我安慰地相信大多数人会被实验证据说服而立即改变他们的观点。令人遗憾的是，历史证明恰恰相反。当今关于地球年龄的证据已确凿无疑了，但是在美国有数百万原教旨主义者仍然固执地坚持那种幼稚的观点，按《圣经》字面推断地球年龄比较短。他们也否认在这漫长的时期内动植物出现了进化，发生了剧烈变化，虽然这一点也早已被确认。这很难使人相信他们关于自然选择过程的言论是无偏见的，因为对宗教教条的盲从早已预先决定了他们的观点。

在我看来，有几种原因导致了人们固执地坚持这些陈旧的观念。在幼年时影响我们的一般观点，特别是道义上的观点，常常在我们脑中根深蒂固。要改变它们是十分困难的。这有助于解释为什么宗教信仰被一代又一代地传下来。但这种观点最初是怎样产生的？为什么它们常常是错误的呢？

原因之一是我们对全面解释世界和我们自身的本质有着非常本能的需要。各种宗教都用一种一般人所容易理解的方式提供了这样的解释。应当记住，我们的脑正是在人类处于狩猎采集者的时期发展起来的。在一小群人的合作当中，在邻近的竞争部落间的敌对行动中，到处存在着强大的选择压力。甚至在20世纪，在亚马孙丛林中，在厄瓜多尔的偏僻地区，部落人员死亡的主要原因是部落间相互格斗所造成的伤害。在这种环境中，一种共同的信仰能增加部落成员的凝聚力。这种需要不太可能是因为进化而在我们脑中建立起来的。毕竟，我们高度发达的脑仅仅能使我们足够机敏地生存和繁衍后代，它不是为了发现科学事实而不断进化的。

从这种观点来看，这些共同的信仰并不必完全准确，只要人们相信它们就可以了。我们最有特色的能力是能流利地处理复杂的语言。我们不仅能用语言表达外部世界的事物和事件，还能表达更为抽象的概念。这种能力导致了人的另一种突出的特点，即我们具有几乎无限的自我欺骗能力，但这很少被提及。我们的脑发展成为从可用的有限的证据中去猜测最合理的解释，它的本质特征使得在缺乏科学研究训练时，我们几乎不可避免地陷入错误的结论中，对于那些相当抽象的事物尤其如此。

最终的结果尚有待观察。或许“惊人的假说”被证明是正确的；或许，某些接近于宗教的观点会变得更加合理。当然还有第三种可能，即事实支持一种全新的替代观点，从一种与许多神经科学家如今所支持的唯物主义观点以及宗教观点都显著不同的角度来看待“心—脑”问题。只有时间和更多的科学工作能使我们作出决定。不管答案是什么，要达到它，唯一切实可行的方法是进行仔细的科学研究。所有其他的途径都不过是吹口哨给自己壮胆罢了。人类对世界具有无止境的好奇心，不管传统和宗教仪式曾在一段时间内有多大的魅力以消除我们对其合理性的怀疑，我们永远也不会满足于昨日的猜测。我们必须不断地追求，直到形成了关于我们生存的浩瀚宇宙以及我们自身的明了的、合理的图像。

关于“自由意志”的跋

意识，意志使它充满活力……

——托马斯·哈代（Thomas Hardy）

从许多方面来说，“自由意志”是一个老话题了。许多人认为它是一件理所当然的事，因为他们感觉到，通常他们可以自由地想干什么就干什么。律师和神学家必须面对这个问题，但总的来说哲学家对这个问题已失去了兴趣。心理学家和神经科学家几乎从不提及这个问题。那些关心量子测不准原理的少数物理学家和别的科学家，有时猜测不确定性原理也许会是“自由意志”的基础。

1986年以前，我本人还没有注意“自由意志”。当时，我收到老朋友的一封信，情况才有所改变。他叫卢斯·里纳尔蒂尼（Luis Rinaldini），是一位阿根廷生物化学家。20世纪40年代后期，我与他在剑桥第一次相遇。卢斯和他的夫人现居住在门多萨（Mendoza，阿根廷的一个省城），该城靠近安第斯山脉。有一次他在美国访问期间，想会见一些人，谈谈他的一些想法。当我们在纽约会面时，他告诉我，他与他的朋友在门多萨已经组成一个讨论组，他们对“自由意志”很感兴趣。随后，他写信给我，更详细地谈到了这一问题。

直到那时，我浑然不知我个人关于“自由意志”已有了一种理论。但是，从他谈到的一些方法，我能看出，我的一些思想有别于他。那时我把它写出来，十分简短，我坚信我发现了一些什么，并把它寄给他，整个内容不足三十行。我曾把它给哲学家帕特丽夏·丘奇兰德（Patricia Churchland）看过。这样做的部分原因是使这个问题的叙述不至于太傻。她十分乐意给予帮助，在词语上加以明晰化，并附加了一些注记，她认为我的想法似乎是合理的。下面的内容就是我寄给卢斯稍加扩充的版本。

我的第一个假设是：人脑的某个部分与制订进一步行动的计划有关，但不一定执行它。我也假定人可以意识到这个计划，即，至少可以直接回忆起来。

我的第二个假设是：人不能意识到这部分脑所执行的“计算”过程，而只知道它作出的最终“决定”，也就是计划。当然，这些计算将依赖于这一部分大脑的结构（部分由于进化，部分由于过去的经验），也取决于来自脑其他部分的当时输入。

我的第三个假定是：执行这个计划或那个计划的决定受到同样的限制。换句话说，人可以直接回忆起决定是什么，但不知道作出这个决定的计算过程，即使可能知道一个计划在进行中。^[150]

于是，如果这种机器（这是我信中使用的字眼）能像人一样决定自己的行为，即有一个“自身”的映象，那么这种机器看来便具有“自由意志”了。

决策的实际起因可能是十分清楚的（帕特丽夏添加的），即：可能是决定性的但却是混沌的。一个非常小的扰动可能造成最终结果的巨大差异。由于这一点，输出结果在本质上成为不可预测的，所以，使得“意志”看起来似乎是“自由”的。当然，意识活动也可能影响决策机制（帕特丽夏附加的）。

这样一种机器能够试着解释自己为何作出某种选择（运用内省法），有时会得出正确的结论。而在另一些时候，它将不知不觉，或者更可能进行虚谈，因为它没有意识到作出选择的理由。这意味着一定存在着一种虚谈的机制，只要给出一定量的证据，不管它们是否会产生误导，脑的某部分总会得出一个最简单的结论。正如我们已经看到的，这一切太容易发生了。

这就是我的自由意志的理论。显然，它依赖于对意识的理解（这是本书的主要议题）、大脑是如何计划（和执行）行为的以及我们如何进行虚谈，等等。我不知道整本书里是否真的有点儿新东西，尽管这里的某些细节并没有被包括在以前的解释中。

在那之后，我心满意足地将事情丢在一边。接着我在纽约会见了卢斯，随后他访问了加利福尼亚州的拉霍亚（La Jolla），得以同保罗·丘奇兰德（Paul Churchland，帕特丽夏的丈夫）讨论这个问题。我本不想在这个问题上多加思考，但是，一旦引起了我的兴趣，我就发现自己一天到晚在思考着它。

我想知道“自由意志”可能位于脑的哪个部位。显然，“意识”牵涉到大脑几部分的相互作用，但是，大脑皮质的某个特殊部位应当与其有种特别关系，这个想法不是不合理的。人们可能期望，这部分接收来自感觉系统高级水平的输出，又要馈送到运动系统的高级计划水平。

在这一点上，我偶然找到了一个有利于我的理论的证据，这就是安东尼奥·达马西欧（Antonio Damasio）及其同事关于一位大脑受损妇女的病例的描述^[1]。她受损伤后，表现出对事物没有反应。她一声不响地躺在床上，脸上带着警惕的表情。她能用眼睛追随别人，但不能自觉地与人讲话。她对任何提问都不回答，虽然看起来她是理解这些问题的。她只是用点头加以答复。她能用极慢的语调重复词汇和一些句子。总之，她的反应极其有限，又总是一成不变。

一个月以后她获得了很大程度的康复。她说她以前不能交流时，并不感到不安。她能跟上交谈，但她感到“没有什么可说的”而不开口，她的头脑是“空”的。我马上想到“她失去了意志”！那么，大脑的什么部分受损呢？文献中指出，受损部位靠近波罗德曼（Brodmann）区的24区^[151]，在一个叫作“前扣带回”的地方。如果大脑被一分为二，它就位于上顶部的内表面上。我高兴地得知，这部分接收许多来自高级感觉区的输入，又在靠近运动系统的高级水平。

索尔克研究所的特里·塞吉诺斯基小组在工作周内有多次午茶会。这是讨论最新实验结果的理想场合，比如提出一些新的想法，或者只是关于科学、政策和一般新闻的闲聊。我参加过一次午茶会，并对帕特丽夏和塞吉诺斯基说，我已经发现了“意志”的部位！它就在“前扣带回”上及它的附近。当我与达马西欧讨论此问题时，我发现他也有类似的想法。他帮助我补充了有关这部分脑区的解剖学上的联系。它与大脑另一侧的对应部分有极强的联系——正如我们所知，尽管裂脑人有两个独立的“意志”（见第12章），而我们正常情况下只能有单个“意志”在起作用。再则，大脑一侧的这一区域有极强的投射到两侧的胼胝体（运动神经系统的重要部分），这也正是我们从单一意志当中所要预料的结果。的确，这一切看起来十分理想。

过了一段时间，我读了一篇迈克尔·波斯纳（Michael Posner）写的文章。在论文中他也提到了一种罕见的病症，由于一种特殊类型的脑损伤引起的“异己手”症。例如，患者的左手可以活动，做一些十分简单的、刻板的动作，但他拒绝对此手负责^[2]。例如，此手可能自发地抓住放在近旁的某个东西，但有的时候不能把它放下，不得不用右手把它从东西上拿开。有一位患者发现，他不能用他的意志力使“异己手”放开物体，但如果大声地喊“放开！”，也许“异己手”会把抓住的东西松开。

那么“异己手”症是什么部位受损导致的呢？可能是靠近或正好在前扣带回上（如果“异己手”为左手，那么损伤位于右脑），也可能是胼胝体的相应部分受损，以至于左侧区域发出指令不能到达由受损的右边区域控制的左手。再则，正如第8章提到的，某种选择性过程前扣带回处于活动状态，这可以从这部分血流增加上看出。

“自由意志”位于或靠近大脑的前扣带裂上，这一想法可能有点儿新意^[152]。实际上，事情可能会更复杂。脑前区的其他部位也可能与其有关联。我们需要的是更多的动物实验、“异己手”和对有关病例的仔细研究，其中首要的是，对视觉意识的神经生物学有更多的了解，并由此增加对其他形式的意识行为的了解。这也是把这些建议附在本书末尾的原因。