13.6 CCTM探测器语义
在前面讨论认知科学的神经-逻辑基础时(第4章),我们对于诸如蛙视觉系统的系统形式化地提出了简单探测器语义(SDS)的观点,并且简要讨论了相关的各种问题。现在,我们对于CCTM,也可相应形式化地提出简单联结主义探测器语义(Simple Connectionist Detector Semantics,SCDS):
(SCDS)
单元或者单元集表征激活它们(或者能够充分地激活它们)的事物。
在这里,我们继续运用同样的策略讨论,联结主义表征如何应对前面提及的各种问题。正如我们将要讨论的,SCDS在其正确性和完整性两方面都存在着严重不足。
真实原因或“纵向”疑难与非原因问题
前面提到的真实原因(right-cause)或“纵向”疑难(“depth” problem),是指如何在可能的众多因果链中分辨出真正与表征相关的那个因果链。而“非原因难题(no-cause problem)”是指当不存在(相关的)原因时,如何解释表征的语义难题。
真实原因
先来看一下麦克莱兰德和鲁梅尔哈特(McClelland and Rumelhart,1981)提出的,著名的关于1179个四字母单词的字母识别模型。
首先,每个单词是一个节点,在不同的位置上组成单词的每一个字母是一个节点,每个字母的特征是一个节点。其次,这些节点被归为三层:特征层、字母层和单词层。最后,节点间的连接存在两种方式的兴奋和抑制。相邻层的节点间具有兴奋和抑制连接,但同一层内的节点间只有抑制连接。这一系统吸引人的地方,不在于其与真实世界的联系(这点很值得思考),正如麦克莱兰德和鲁梅尔哈特所承认的,这一模型“明显绕开了几个有关低层次加工的重要问题”(1981:383),其真正令人关注的地方是系统被相关刺激调整后而产生的行为。麦克莱兰德和鲁梅尔哈特记录下了两件事:第一,“每一特征能否被检测到,具有某种概率p……[概率将]……随着所呈现视觉性质的变化而变化”(1981:381)。第二,“我们根据系统探测的单元[此时单元处于刺激中]识别节点”(1981:379)。
这一模型没有真正的输出节点。输出是依照特殊的规则,将暂存的所有节点的激活样式整合后读取。给予系统反应强度:“在反应强度的基础上,在每一次任务循环后,程序能够计算出正确的选择对象被读取的概率和非正确的选择对象被读取的概率”(1981:407)。
字母和单词节点——“隐层”单元如何运作?这些单元作为与它们相连接的每一个节点的激活功能而被激活。以字母“T”为例,它是由聚焦于同一“视网膜”[4]区域的,中央垂直棱边探测器和顶部水平棱边探测器同时激活而激活。因而,“T”节点是因为垂直和水平棱边探测器激活的联合(在时间和空间上)而激活。单词节点的原理也是这样,只不过需要按位置顺序的四种激活发生联合。单词节点由四个字母-位置节点组激活,例如,“T”在第一位置,“A”在第二,“K”在第三,“E”在第四,就形成了“TAKE”。
(SCDS的)这些节点都能表征什么激活了它们,而激活它们的就是先前的激活节点。但是我们希望,当然是合理的希望,这个模型能够做到,字母节点能够探测真实世界的字母,单词节点探测器能够探测真实世界的单词。被识别的应该是系统之外的的字母和单词,而不是信息流中先前的节点。模型所依托的理论必须能够找到一种方式处理“激活”的转换——必须找到节点激活的真正原因。这也就是联结主义系统的真实原因难题。
鲁梅尔哈特和麦克莱兰德(1986b)的过去时态学习者模型也是这样,除了其中的A单元表征词根(word roots)而B单元表征过去时态的形式(past tense forms),两者都属于Wickelfeature表征。固定的解码网络(decoding networks)将A与B的表征,从语音表征(phonological representations)转换过来,并且又转换为语音表征,表征解释很明显是针对听觉的(鲁梅尔哈特和麦克莱兰德没有说明网络如何接受刺激,但最有可能是从键盘输入)。每一个Wickelfeature的要素都很复杂,为使计算方便,鲁梅尔哈特和麦克莱兰德在一定程度上对它们重新进行了编排。他们按照“声音”的四个维度进行划分,得到了构成字母的特征的10点要素:(1)阻断的辅音vs.连续的辅音vs.元音;(2)爆破音vs.鼻音,摩擦音vs.响音,高音vs.低音;(3)口腔前部、中部和后部;(4)浊音vs.清音,长音vs.短音。
现在的问题是:指派辨别这些特征的节点,事实上真的辨别了吗?“浊音”与声带的振动有关,而“前部”、“中部”和“后部”则与口腔发音位置有关,这些节点能辨别口形吗?或者,因果链只需回溯到由口形产生的声音特征(如果有的话)即可?[5]
非原因
前面我们已注意到,真实原因难题的极端情况是“没有原因”难题——我们应该如何表征那些不具有产生表征殊型(tokenings of representations)的东西?这些包括逻辑概念,如XOR;抽象实体,如数字、集合等;未来实体,如我们尚未出世的子孙后代;可能还包括社会角色,如作为纽约市市长。看一下线性阀阈单元表达XOR网络的例子。在这一模型中,存在一个隐单元(“内在的”),如果没有这一单元,XOR将无法计算。但是所有这些单元根本没有指派明确的解释,更不用说探测语义特征了。它的意义,更多地在于其在网络中起到的功能作用,而不是表征什么激活了它。
错误表征(析取)难题
就像我们讨论“蛙眼告知蛙脑什么”(第4章)的问题一样,这个问题也是由福多提出的,即人们所熟知的“析取难题”(disjunction problem)。对联结主义系统而言,这个问题可能是这样的:假设作为一个节点的“T”探测器的定义为,只要接触到字母“T”[6]时便获得开启(on)。然而,正像所有的装置偶尔都会出错一样,它也会偶尔地比如接触到“I”时也会激活。这样,现在的T探测器在功能上就等同于I探测器了,也就是说,它总体上是个“T或I探测器”。因而,似乎看起来错误表征是不可能的了,一个可能的错误表征的例子被理论转换成了纯粹的析取表征问题,这并不是我们所想要说明的。
蕴含难题
另一个联结主义探测器语义特征的问题,是如何确定表征间的语义关系。我们在前面看到,近似于人类认知的复杂表征系统,至少具有某些逻辑蕴含关系,而难题是网络如何能够获得这些关系?这就是联结主义系统的蕴含难题(entailment problem)。我们注意到,NETtalk可以说至少获得了一些原始关系:它能表征“a”是一个元音,其意义是如果一个“a”单元被开启,这一激活会扩散到它的隐“元音单元”并使之激活。但是,正如我们前面在语义网络中看到的,问题是如何控制这种传递仅仅认为是一种推理过程。
“作为什么”的表征,“横向”或“特征”问题
对探测器语义表征进行以下两方面的区分很重要。一方面,表征是对于或关涉(of or about)真实世界的什么的表征。再次回顾第4章“蛙眼告知蛙脑什么”。假设一只在自然生境的,功能健全的蛙,具有对于或关涉昆虫的表征。也就是说,作为历史事实,在野外是真实的昆虫开启了蛙的昆虫探测器。另一方面,表征是如何表征这样的事物——是将事物作为(as)什么进行表征。解决了这一问题,也就解决了我们称之为(第4章)“横向”或“质性”难题(“spread” or “qua” problem)。有人描述其中的一种特征可能是,“很小的事物(3个单位或者更少)”和一个“苍蝇大小的事物,1单位大小”。很明显这两种事物都不一定是昆虫。在我们看来(应该是可以这么说的),蛙对于“昆虫”的表征,可能无法与它对“一团小小的黑黑的不规则移动的东西”的表征区分开来。我们可能会知道,系统的表征是关于什么的表征,真实世界中的什么物体它正在追踪,但依然不知道它把它作为什么来表征——作为什么进行表征(what it is represented as)。而且还有一点我们需要注意,即表征可以因某事物作为具有某种属性,而不是另一属性的事物而描述这个事物,尽管它所有探测到的事物(或者甚至对于所有事物)都既有第一属性特征也有第二属性特征。引用德雷兹克(Dretske,1986a)的一个例子,电梯门上的电子眼可以探测门前是否有事物出现,尽管只有人(或神秘魂魄)才使用电梯,但我们不会把电子眼说成是“人(或神秘魂魄)探测器”[7]。探测器语义特征似乎非常有益于回答系统正在表征什么的问题——表征的是关于什么的表征。但在联结主义系统中,探测器语义如何解释“作为什么而表征(representationas)”呢?或许在第11章玫瑰和山羊的表征网络中能找到回答这个问题的线索。在那里,我们给每个节点指派了一个心理物理“维度”,如颜色、形状、气味和纹理,然后我们允许不同的激活层表征这些维度中的不同点:红的颜色、椭圆的形状、芬芳的气味、粗糙的纹理等等。于是,这些矢量就不仅仅由(因而是关于)一朵玫瑰或山羊而产生,而是把它作为具有红色的、椭圆形的、芬芳的等等特点,也就是作为玫瑰来表征。
结 论
这又会把我们引向哪里呢?如果一个系统需要另一个已经具有语义的系统给予它语义,那么我们把该系统的语义称作派生。而不需要其他语义系统给予语义的系统语义称为非派生。数字计算机典型地具有派生语义;人类的思维普遍来说是非派生语义[8]。我们所处的现状是,联结主义模型的输入层节点几乎都没有非派生语义。这就是说,在联结主义网络中,绝大多数节点或激活样式不具有非派生语义,不论它们得到的什么语义都是派生的——程序员通过符号给予它们。而程序员的表征系统,当然正是联结主义试图模拟的那种认知能力,因而在模型中预设这种能力是行不通的。