12.4 联结主义与联想主义的历史关联

我们已经介绍了联结主义机器的主要组成部分,以及它们是如何进行组织、计算和训练的。正如我们前面所指出的,这种近来迅速兴起的模型的思想发展脉络,可以向前追溯很多个世纪,包括经典联想主义(第1章)、巴甫洛夫与条件反射(第2章),拉什利与赫伯(第3章),感知器(第4章),以及鬼蜮模型(第6章)。现在我们更详细地探讨联结主义和联想主义的关系。

一定会有人对早期的联想主义工作网络与部分联结主义的工作网络在几何上的相似性,感到惊讶。这里,我们再次将詹姆斯(1980)与鲁梅尔哈特和麦克莱兰德的整体回忆模型进行比较。

它们之间有哪些一般性的关系呢?如果将第1章的“经典联想主义”与第11章的“经典联结主义”相比较,会发现前者似乎是后者的一种特例,从这个意义上说,完全能够设计一种联结主义工作网络,使其具有表征与联想能力。例如,可以用输入节点作为感知加工的感知传感器(sensory transducers)(思考NETtalk中的字母探测器),也可以使隐层单元能够对观念进行编码,还可以使输出单元产生行为(思考NETtalk的发音特征)。联结主义模型,还可以通过设定它的连接权值,使其获得感知间,观念间,或者感知和观念之间的相似特征(或对比特征),因为这种联想(连接权值),能够记录感知间等的在空间和(工作网络正在运行的)时间中的连续性。也可以认为,因感知间等的相似特征,而在NETtalk中产生隐层单元束,就是一种联想。相似特征与单元束集之间的因果关系是很难处理的,但休谟在他的理论中涉及了这一点,而且只有在分析这个问题时,他才使用了邻近和连续的概念。

除了联结主义具有普遍性和灵活性之外,联结主义与联想主义之间还有什么不同吗?柏克德(Bechtel)认为:“对于英国的联想主义者,联想的最普遍基础是在形成观念的过程中观念,或空间,或时间的相似性,这些工作网络的这种最基本特征使得它能够直接与感知觉相连接……337因此与pDp理论者提出的联结工作网络是有很大不同的。在联结主义的工作网络中并没有直接与感知输入或运动输出相连接的单元,只是有很多单元间接地与它们相连接”(Bechtel,1985: 57)。柏克德的观察可能只是发现两者之间的程度不同而已,对他来说,联结主义关注于输入和输出中间的中心加工部分,而联想主义却继续将理论扩展至周围神经。但是他没有从文献中给出这种不同的例子,也很难说明为什么原则上将联结主义模型扩展到周围神经是不可能的。

似乎某些联结主义模型和联想主义工作网络至少存在两点不同。第一,在联想主义工作网络中,获得联想的是观念,联想的建立是通过增强观念之间的通路(连接)。在局部(local)联结主义工作网络中,如Jets & Sharks网络,运用的是模拟的方式,联结主义工作网络中的一个节点模拟一种观念,节点间的连接权值模拟观念间的联想,并且它用于学习的联结原则主要是修改连接的权值。但在分布联结主义工作网络中,观念的模拟是用节点集合或节点矢量,并且矢量间不存在连接以及可变的连接权值——连接只存在于组成矢量的节点间。换句话说,并不存在从一个矢量到另一个矢量的变换原则,可以用于模拟系统中从一种观念到另一种观念的联想。第二,一般而言,对于联想主义,观念是感知觉的复制物,正如我们看到的,这也是联想主义认识论的主要特征。但是,因为联结主义的连接权值不能等于1,所以信息也就不是在输入单元和隐层单元间的复制。

12.5 联结主义的解释:pTC

我们首先需要强调,联结主义对认知解释的形式化表述,以及它的哲学寓意仍未达成一致意见。麦克劳克林(McLaughlin)对这一现状作了很好的总结:“一部分人认为联结主义并不属于常识心理学(folk psychology),而另一部分人却仍在努力维护联结主义属于常识心理学;一部分人认为联结主义属于一种准工具取向,用于探究意向的归属性(intentional ascriptions),另一部分人却认为联结主义与意向实在论(intentional realism)相吻合;一部分人认为,联结主义可以使人们放弃认知过程是在句法结构上对心理表征进行操作的观点,另一部分人却声称,联结主义提供了一种最有前景的对表征进行认知操作的解释;338一部分人认为联结主义与联想主义的无意识加工相融,另一部分人却认为联结主义是一种笛卡尔式的观点,即认为它支持认知状态就是意识,并且隐含着认知科学应当回避无意识加工的期望”(McLaughlin,1993: 164)。这里,我们并不是要激励所有人达成一致意见而开列这样一份清单,而是希望能从所有这些可能中,用心理学、神经学、哲学的术语,找出一种全面的、连贯的联结主义的形式化解释。斯莫琳斯基(Smolensky,1988a,1989)为这种解释提出了一个框架,称之为“联结主义的恰当定位”(proper treatment of connectionism,pTC)。

层次分解

人类的认知能力可以分解为三个最简层次,分别是概念层、次概念层和神经层。

概念层

第一个层次是“概念”(或“符号”)层。在这一层次上,认知结构可被分解为我们熟悉的概念单元,通过词汇或数据结构而获得认知结构,正如我们在“ShRDLU”中所看到的(见第5章):“金字塔”“放置”“盒”“内”(“put” “pyramid” “in” “box”)。这样的符号结构具有传统的语义解释,并且能够借助符号的形式或形状通过符号处理技术进行操作。

次概念层

第二个层次是次概念(或次符号)层(subconceptual level),是概念层描述的构成成分。次概念(也称为微特征)对应于单元(节点),而概念对应于集合、模式或节点矢量。既然联结主义系统中对认知的分类是通过模式或矢量的激活实现的,所以就存在两种类别的构成关系:模式-次模式的关系(子集)和模式-节点的关系(元素)。第一种属于概念-概念关系,而第二种则属于概念-微特征关系。它们虽然都反映了“部分-整体”的关系,但却有所不同(这里忽略了一个问题:概念和次概念/微特征区分的标准是什么?)。

神经层

第三层是神经层。这个层次构成神经科学所研究的神经系统的结构和操作。

知识与信息的加工方式

在认知功能中,有两种重要的不同类型的处理方式:知识与信息的加工。

有意识的应用规则

第一类知识是有意识地对规则进行应用[2]。这里阐释的规则,是指在一些“语言”系统(自然语言、程序语言、逻辑和数学的符号标识法)中,应用于概念层任务域中的规则,例如科学和法律。一般而言,这类知识是社会实践和建制活动的产物,但这并不是它的标识性认知特征的本质。对于有意识的应用规则,典型的例子是一位初学者让自己重复有意识地做这样的事情:旋转、迈步、摇摆(学习打网球),或是:“i”在“e”前而非在“c”后(学习单词拼写)。

直觉知识

第二类知识是直觉知识——如感知、(母语)语言理解和熟练的动作。这类知识是以明显迅速灵活的方式习得,而不能依靠内省通达(回顾福多的“模块”或“输入系统”)。

显而易见,作为一种认知功能,有意识地应用规则是在概念层中习得,而直觉加工是在次概念层习得。同时,我们也应该看到,这两种功能都能在神经层上实现或具体化。

联结主义模型层次

340现在我们要提出的问题是,就上面的那些区分,把联结主义模型放置在什么位置才是恰当的。再来看第一种区分,根据斯莫琳斯基的观点,pTC认为联结主义处于神经模型和传统符号模型的中间位置——涉及次符号模型(本章后文带有数字标识的引文均引自Smolensky,1988a原文):

(11)

次符号程式的基础层次,或次概念层,位于神经层和概念层之间。

对该层次的分析比神经学更为抽象(尽管它关注了神经结构的一般特征),但与传统符号模型相比,则更强调认知的动力特征。这与量子力学比经典力学更强调物理粒子的动力一样;经典力学只为现象提供一种非精确且仅是近似的解释,而量子理论的解释却足够精细且准确。下面让我们再来详细地分析这三个层次。

符号(概念)程式

概念层包含有意识的规则解释器,属于符号程式的自然域。符号程式与“文化”知识相关,如科学、法律,是在自然和科学的语言中形成的,可以将明确的指涉规则应用于“文化”知识。有效步骤理论、图灵机以及冯·诺依曼计算机程序,为我们提供了心智如何加工这些知识和执行这些指令的模型:

(3)

(a)在语言中形成的规则,能够为文化知识提供一种有效的形式规则(effective formalizatio);

(b)有意识的规则应用,通过一种虚拟机制,对这些规则进行序列解释,这种虚拟机制称之为有意识的规则解释器;

(c)这些规则是在用于有意识的描述任务域的语言中形成的——在概念层中形成(1988a:4-5)。

符号程式认为:

(4a,b)

(a)运行在直觉处理器(intuitive processor)中的程序包含语言的形式规则,这些规则能够获得序列性的解释;

(b)运行在直觉处理器中的程序是由其元素构成的,即符号,主要用于指涉有意识地对任务域进行概念化的概念。(1988a:5)

例如,回顾ShRDLU(见第5章)的例子,我们可以发现数据和指令能够依据常识语言获得形式化,如pYRAMID和MOVE。可以概括为:

(4)

无意识规则解释假设:运行在直觉处理器中的程序,具有句法和语义的特征,与在有意识的规则解释器中运行的程序非常相似。

符号程式的计算方式,具有严密和序列性的特征。在符号程式中具有:

(24)

(a)离散记忆的定位性,它的记忆项目不能相互作用;

(b)对离散记忆存储和提取的操作过程,记忆中的任何一个完整项目的存储和提取,可以发生在单个最简的(基础的)操作中;

(c)对离散学习的操作过程,按照有-或-无的方式获取新的规则;

(d)对离散学习的操作过程,按照有-或-无的方式得出结论。

(e)离散的类属性,它的项目要么属于这个类别,要么不属于。

(f)离散的产生式规则,其条件要么满足,要么不满足,由条件产生的动作要么执行,要么不执行。

在符号程式中,以上的认知层次与计算机系统的层次相类似。但在计算机系统中,确切地说明符号层如何在神经层上实现并不是符号程式的一部分。然而,斯莫琳斯基反对这种观点,至少有如下理由:

(5)

(a)依据假设(4)构建的人工智能系统,事实上似乎过于勉强、缺乏灵活性,因此并不能作为真实人类技能的模型。

(b)依据规则熟练地表达专业领域知识的过程,似乎对于很多重要的认知领域(如常识性知识)不切实际。

(c)假设(4)没有对知识如何在脑中获得表征作出实质解释(1988:5)。

次符号程式与符号程式

斯莫琳斯基关注的是直觉加工,例如“感知、熟练的动作、流利的语言行为……总之,是所有已习惯了的熟练行为”。联结主义模型能够在次符号程式上,对这些过程作出详细和确切的描述,而符号模型对此却无能为力。这使斯莫琳斯基认为,直觉加工的实现基础不是符号程式,而是次符号程式:

(7)

直觉处理器具有联结主义的某些结构(这些结构是对神经网络的一些最普遍特征进行的抽象模拟)。(1988a: 6)

斯莫琳斯基对直觉处理器的几种假设进行了对比。首先,(4a)对比:

(8a)

联结主义动力系统假设:在任意时刻,直觉处理器的状态可以通过数值(每个单元具有一个数值)矢量精确定义。直觉处理器的动力特征由一个微分方程控制,在这个方程中的各种数值参数构成了处理器的程序或知识。在学习系统中,这些参数依据另一个微分方程发生变化。(1988a:6)

第二,(4b)对比:

(8b)

次概念单元假设:直觉处理器具有任务域的语义特征,这种语义特征属于任务域中的意识概念。直觉处理器本质上是指由大量单元共同产生的复杂活动样式,每个单元都会对很多这种样式的产生发挥作用。(1988:6)

最后得出:

(8c)

次概念层次假设:通常只在次概念层,而不是在概念层,对直觉加工器完整的、正式的、精确的描述才易于处理。(1988a:6-7)

以上所述可以总结为(8),是“次符号程式的基础”(1988a:7):

(8)

次符号假设:直觉处理器是次概念的联结主义动力系统,这一系统认为在概念层上不可能对直觉处理器进行完整的、正式的、精确的描述。(1988a:7)

斯莫琳斯基指出(2.4节),这一特征使得次概念模型不能够实现概念模型——如果能实现,则都需要具有完整的、正式的、精确的特征。

最后,斯莫琳斯基阐述了(24)符号程式与次符号程式的计算方式的不同,次符号程式的计算是数据统计和并行的:

(25)

(a)次符号计算的知识,作为大的软(数据统计)约束集合形式化;

(b)具有软约束的推理基本上是一种并行加工;

(c)具有软约束的推理基本上是非单调性的[3];

(d)确定是不是一个次符号系统可用其是否采用统计推理(statistical inference)进行识别。

总之,符号程式的约束是不连续的、硬性的,它的推理是逻辑的、序列的,而次符号程式的约束则是连续的、软性的,它的推理是统计的、并行的。

次符号与神经

斯莫琳斯基反对将联结主义模型等同于神经模型:

(6)

神经结构假说:直觉处理器完成一件特殊的任务,它所使用的结构与脑完成这件任务所使用的结构相同。(1988a: 5)

之所以得出这个结论,是因为脑皮层与联结主义系统具有宽泛的对应关系。需要注意的是,图中之所以标有“负”的对应关系,是因为有些模型不能在硬件上直接实现,而另一些则涉及特征选择的问题,需要进一步在神经学中得到确认。还有一些进一步的争论,斯莫琳斯基并没有在这个图中列出,例如负权值难题和反向传播的生理机制难题,我们留在第13章中讨论。

模型与程式的关系

根据“pTC”(联结主义的恰当定位),脑的结构及其功能的特征(当然是在原则上)可在神经层次上得到精确描述。直觉处理器的特征(同样也是在原则上)可由联结主义模型在次概念层次上,即通过节点层、节点矢量、连接权值,进行精确描述。但是,有意识的规则应用与概念层的一般关系是怎样的呢?对于这个问题,人们的认识更加模糊,也具有更多的争议。一方面,正如我们前面指出的,节点矢量用于构成概念,如由节点组成的具有次概念解释的“杯子”概念。所以,联结主义工作网络似乎是在更高层次(节点矢量)上,能够给出(原则上)概念层认知——我们真实的认知活动,确切的描述。另一方面,我们的整个概念层组织器官,还具有自然语言、数理符号运算等能力。具有这些系统的概念层的活动,似乎可以由运行在如vNMs或pSs等传统的符号结构上的人工智能的传统符号表征图式(见第7章),得到精确描述。但必须强调一些事项:这两种模型的计算方式并不能相兼容,传统符号模型遵循(24)(见上文),而联结主义模型遵循(25)。

两种模型的综合理论

一种较吸引人的建议也许可称之为“综合理论(hybrid theory)”——这种理论用符号程式解释有意识的规则应用,同时用次符号程式解释直觉加工——两者都没有错误。但是斯莫琳斯基(1988a,第6部分)指出,这种建议是存在问题的。例如:(1)这两种理论是如何交流的?(2)综合系统是如何依据经验而演变——从有意识的规则应用转变到直觉?(3)综合系统如何阐释实际人类规则应用的易错性?(4)综合系统有助于我们更进一步理解有意识的规则应用如何在神经上实现吗?

pTC

鉴于这些问题,以及符号程式无法在次符号程式上实现,斯莫琳斯基选择了对立面,将次符号层作为结构基础,而符号层可看作是与次符号层近似的,实质上是一种派生物。pTC的解决方法是,用自然语言或传统“符号”表征图式得出的高层级描述,只是一种近似的描述——只能近似地描述人类真实的认知活动。这就如同经典宏观物理学,只能对微观物理学所精确描述的内容,给予粗略的近似描述一样。

近似执行

确切地说,“近似”是一种什么关系呢?在多数情况中,我们并不是很清楚,但是斯莫琳斯基提供了一个特殊的例子——能够直觉加工语言的联结主义系统,如何实现(近似地)一个产生式系统。在斯莫琳斯基(1988a,第6部分)中说明了这种情形是如何进行的。首先,语言能力是直觉知识,所以我们假设联结主义系统具有语言能力。然后,这种能力可以用于编码语言表达,作为活动样式。所有的活动样式都能够存储于联结主义的记忆中。因为这些表达中的一部分可以作为规则,从而我们可以使用这些规则解决问题。例如,我们能够在联结主义记忆中存储一组产生形式:

A(条件)→B(行为)

这样,给定输入A,联结主义完备样式就能回忆起整个产生形式。通过操作产生式规则得到了B,然后作为联结主义系统的输出,执行B。斯莫琳斯基总结道:

(16)

在自然语言中,能够表征和处理语言的结构,是人类直觉处理器的一种能力;次符号程式认为,这种能力可以在次概念的联结主义动力系统中模拟。通过将这样的语言能力与联结主义系统的记忆功能结合在一起,序列的规则解释就能实现。(1988a:12)

当然,这里还有很多东西需要说明,也有很多疑问需要解答:

(Q1)符号层、次符号层次与符号、次符号程式之间的关系是什么?

(Q2)符号程式与神经层之间的关系是什么?

(Q3)有意识的规则运用与符号、次符号层次及程式之间的关系是什么?

(Q4)直觉加工与符号、次符号层次及程式之间的关系是什么?

探究这些问题会使我们脱离现在想要阐述的内容,所以就此保留。

意识、认知和内容

现在我们已经获得了(理想的)联结主义模型的整体图景,既是一种在联结主义概念层(节点矢量)上实现有意识的规则应用的具体模型,也是一种在联结主义次概念层(节点)上实现直觉加工的具体模型。但是,我们仍未触及到如何使一种工作网络(或脑)状态成为一种意识状态或者一种认知状态的一般性解释。因为认知状态是表征的,所以我们也需要对表征状态的特征(及对表征的学习)给出一种解释。

意识

根据pTC,意识的必要但非充分条件如下:

(17)

意识:意识的内容仅仅反映了活动样式的大尺度结构:活动的次样式可以延伸到工作网络的大范围空间区域,并且能够在相对长的时间内保持稳定。(1988a:17)

显然,这种对意识的空间和时间的定义相当含糊,而且只有一个必要条件也不能令人满意。我们想知道的是,究竟工作网络的什么特征使得这些大范围的、稳定的样式成为意识的内容——回顾意识的“难问题”(见第9章)。

认知

因为次符号的基本原则,既不是概念层也不是神经层上的内容,那么,在何种意义上,这些模型是认知原理的具体化而不是神经科学原理的具体化呢?349是什么将这些动力的认知系统与非认知系统区分开来的呢?根据pTC:

(19)

认知系统:说一个动力系统是认知的,它的必要条件是,它能够在各种复杂多变的环境条件中,找到数量众多的目标条件。目标的组成部分以及可容纳的环境条件的变化种类越多,系统的认知能力越强。(1988a: 15)

斯莫琳斯基说,“只有动力系统的复杂性”才能将认知系统与恒温器或河流区分开来。这就引起了许多重要疑问:只有一个必要条件的(19),究竟是想告诉我们什么呢?如果认知存在一个程度问题——那么恒温器有低水平的认知吗?又或者,如果认知不是程度问题,它要么出现,要么不出现,那么,认知的能力高低何以依随复杂程度而发生变化呢?同时,我们暂且同意这些系统是“认知”的,那么这种“认知”与前理论概念“心理”的关系是什么?

通过复杂多变的环境条件获得目标满足,这种过程与认知相联系。这种观点至少可以追溯到纽厄尔和西蒙(Newell and Simon,1979)关于物理符号系统的讨论(可参见本书结语)。与斯莫琳斯基的区别在于,纽厄尔和西蒙明确提到的只有“智能”,不是认知:“我们测量这个系统的智能,是以当它面对繁杂变化的、困难的、复杂的任务环境时,它是否有能力到达目标状态。”如我们在讨论图灵测试(第9章)时指出的,一般性言语对于我们描述机器的“智能”特征有更大的自由度,并且描述它们的行为也会更具体,说机器具有“智能”当然比说机器具有“思想”或“认知”更易于说明。

认知的突现

次符号层与神经层具有怎样的关系,才能够生成或者确定特殊意义的认知或一般的心理状态?对于这一点,斯莫琳斯基诱人地指出,“联结主义模型有可能为我们提供揭开已经持续了几千年的心-身难题最重要的一步”(1988a: 3),但是他没有进一步详细论述这一观点。联结主义研究学派的pDp(并行分布加工)观点是,认知(以及一般的心理状态)因神经构成要素的交互作用而突现,新的突现层包含很多独特的特征,需要一些新的概念和词汇来描述它们。理解这个突现的认知层需要理解它如何由突现实现:“理解不同层次和组织结构如何突现这些新的和有用的概念。只是试图理解认知的本质特征,是如何在工作网络中因连接单元的交互作用而突现的。我们确信突现的现象的存在,意味着不可能通过孤立的研究低层次元素而获得对这类现象的理解和描述……整体不是部分之和。因为整体的各个部分之间存在非线性的交互作用。但是,这并不是说低层次元素的属性与高层次的组织无关——恰恰相反,我们认为为了获得对高层次组织的理解,主要还是需要对低层次单元间交互作用的研究”(Rumelhart and McClelland,1986a: 128)。显然,宣称认知突现于低层次的交互作用,并没有告知我们这一“突现”关系究竟是什么。在何种意义上,虽然这些新的、高层次的、突现的现象不可仅从低层次的事实获得理解或描述,然而他们还是认为首先需要理解低层次的现象?此外,对于身心关系“突现”如何与其他意见,如同一论或随附论等进行比较呢?这些问题都亟待进一步研究。

语义内容

次符号系统的状态是如何获取它们的内容——它们的意义和真值条件的呢?根据pTC:

(22)

次符号语义:认知系统容纳了在各种环境条件下的各种内部状态。在一定程度上,认知系统在各种环境条件下寻找满足它的目标条件,就特定的目标条件而言,系统的内部状态就是相应环境状态的真实表征(veridical representations)。(1988a:15)

事实上,次符号系统能够生成对于环境的真实表征,是通过从环境中抽取信息,然后通过学习程序将信息内在地编码为权值的结果。

SCDS和内容

概念层认知结构在哪里获得它们的语义解释?语义解释又如何在联结主义系统中组织?在一些系统中,如Jets & Sharks网络和NETtalk(见第10章),我们已经看到,语义特征通常由工作网络的设计者指派给输入层和输出层,然后经过训练,再由隐单元层(如果具有)形成一些语义上可解释的样式。与我们之前对“蛙眼告知蛙脑什么”的讨论类似,可以将简单联结主义语义探测器形式化地表述如下:

(SCDS)

单元及单元组,能够表征激活它们(或者足够激活它们)的事物。

倘若我们设想,进化机制起到一种“程序员指派”的作用,那么就可以认为,感觉和运动节点的表征位势(representational potential)(语义)受基因决定,它们之间的内在连接强度可以看作是反映了基因序列对于重复出现的环境构造的反应。根据这种观点,这一系统从环境中获取某种数据的规律并对其进行编码,然后对这些规律进行分类,再运用这些分类或多或少成功地作用于外部环境。对于新增的经验,系统会修正连接强度以适应新的环境,并且修正后的连接能够更加准确地作用于先前已熟悉的环境。克拉克(Clark,1993:190)认为,联结主义机器需要具有“基础操作模式,涉及:数据驱动学习、分布式表征的形成、迭加存储技术以及依据语境进行表征和检索”。斯莫琳斯基的pTC具有所有这些特征。

12.6 结构分类(Ⅱ)

在前面,我们以存储和控制为维度(回顾第6章关于这些维度的解释)划分了计算的结构。我们已经看到,计算模式也可以基于表征进行参照。如果一个表征,(1)不止一个元素(触发器、节点等)对它进行编码,以及(2)对这个表征进行编码的元素,也能够对其他表征进行编码,那么这个表征是(完全)分布式的。如果一个表征,它只能满足上面的条件(1),也就是说,不止一个元素对它进行编码,但是不满足条件(2),那么这个表征是准分步式的。如果一个表征,只有一个元素对其进行编码,那么它是局部定位的(local)。如果机器的转换原则由获得语义解释的状态而确定,那么表征是语义有效的,否则是非语义有效的。正如斯莫琳斯基所说:“或许对两种程式进行必要的比较,能够得出附属于形式模型的语义解释。在符号的研究取向中,符号(最小的)被用来标识语义上可解释的实体(概念);在定义系统的规则内,那些相同的符号是符号操作程序控制的对象。352语义上可解释的实体同样是按照定义系统的形式规则所控制的实体。在次符号程式中却不是这样。语义上可解释的实体是系统中大量单元的激活样式,而由形式规则操作的实体是在工作网络中单元的个体激活。这些规则运用的是激活传递规则的形式,其特征与符号-操作规则有本质不同”(1989:54)。正如我们已经指出的,在一个(分布式)联结主义系统中,概念层的解释由激活了的单元矢量或样式层指派,而转换原则由节点和连接层(激活-传递原则,连接权值)的状态确定。但在传统数字计算机中,概念解释层与转换到下一种状态的转换层是相同的——都是程序层。以ShRDLU为例,放入盒中一个金字塔,是因为执行了这样的命令:pUT(IN(BOX,pYRAMID))。从其中,我们看到了语义解释的对象(思考BOX,pYRAMID,pUT),使机器执行了这个行为,之后进入另一种程序状态。增加表征维度使我们拓宽了对结构的分类,使之能够包含联结主义结构。

但似乎也能够看出从图灵机到联结主义机器都存在着控制、存储和表征的框架。当我们从左向右看这个图时,机器的总体属性就从局部定位元素的交互作用(更多的相互合作,较少的单独控制)中呈现出来,其他的重要属性,如容错性(fault tolerance)和功能衰减(graceful degradation)都可以看作承载在低层次特征上——尤其是分布式控制和分布式表征。如同丹尼特(Dennett)在与我们稍有不同的语境中所说的:“请注意,从冯·诺依曼机的结构到……产生式系统和(带有精细颗粒层的)联结主义机器的结构,在这一进程中发生了什么变化。这些变化或许可称之为平衡力的转移。在由具有较少不连续点的数据描绘的轨迹上运行的、固定的、事先设计好的程序,都被灵活的——非常易变的——系统所取代,这个系统的后续行为,更多是由系统目前正在发生的经历和先前已发生的经历之间的复杂相互作用而产生的结果”(1991:269)。我们将在下一节讨论这些特征。

附录 联结主义与图灵的非组织机器

在1969年出版的图灵的遗著(成稿约在1948年)中,他提出了非组织机器(unorganized machines)——“其结构具有很大的随机性”——直到现在,这种机器才开始广为人知(见Copeland and proudfoot,1996)。图灵提出了这种机器的三种类型,他分别称其为“A-类型”、“B-类型”、“p-类型”。我们在这里并不关注这三种类型机器的技术细节和它们之间的差别。我们感兴趣的是,它们的一般特征以及图灵所设想的它们对于未来智能研究的重要性。

A-类型非组织机器

这种类型机器的特征,在这个简单的机器中具有5个单元,每个单元都有两个单元连接输入,如左边表和右侧图所示。每个单元要么开,要么关。激活-传递的规则是:两个输入项的乘积减去1,即:新值=(输入1×输入2)-1。存在一个中央时钟(central clock),能够使所有的激活-传递同步。赋值给每个单元0或1的结果。例如,在第一个条件下,单元1=1,因为它的输入单元(#2,#3)的值为:#2=1,#3=0。运用激活-传递规则我们得到:1×0=0,1-0=1。354所以单元1可以获得值1。对于A-类型机器与脑的关系,图灵评论道:“A-类型的非组织机器,非常有潜力成为包含随机排列神经元的神经系统的最简单模型”(1948/69:8;Ince,1992:Ince,120)。在这里,我们可以看到,图灵已经明确地预见到了模拟真实神经结构的可能。

B-类型非组织机器

较简单的A-类型机器的每一个连接或者说标有箭矢的线段,都被一个环路取代。355所有A-类型机器的连接被B-类型连接取代之后,机器的结构就是图灵所说的B-类型机器。

对于B-类型机器与脑的关系,图灵评论道:“脑只是具有B-类型机器普遍特征的一种特例……换言之,若这种机器具有适当的初始条件,它们将会完成任何需要的工作,只要给它充足的时间以及提供足够数量的单元。尤其是,具有足够单元的B-类型非组织机器,它可以找到使其成为带有特定储存能力的普适机器的初始条件”(1948/69:9;Ince,1992:119)。这里,我们会有一些想法,脑可能就开始于随机的一组连接,那么通过对B-类型机器进行合适的训练,它就有可能进化为一种普适图灵机,因此我们可以将B-类型机器看作是认知结构的一种可能的认知结构。遗憾的是,图灵并没有勾画出他所预见的这样的发展应该如何展开。

p-类型机器

p-类型机器是图灵学习实验的基础。图灵明确地认为,人类的学习部分地是以快乐和惩罚(因此称为“p-类型系统”)[4]为基础的:“人类孩童学习,在很大程度上依赖于他自身带有的奖赏和惩罚系统。这说明,有可能只通过两个调节输入就能来执行这个组织,一个调节输入是‘快乐’……而另一个是‘痛苦’或是‘惩罚’。人们有可能会设计出大量的‘快乐-痛苦’系统”(1948/69:17;Ince,1992:121)。

“p-类型”系统的一般特征如下:“p-类型机器可以认为是没有磁带的LCM(逻辑计算机器,如图灵机),而且对它的说明在很大程度上也是不完整的。当它具有了相对完整的结构时,其行为并非是确定的,而是会对缺少的数据作随机选择,一旦发现有合适的填补数据,就会对填补数据进行说明、试验和运用。当痛苦的刺激出现时,所有试验的填补数据就会被取消;而当快乐的刺激出现时,它们就会保持恒定”(1948/69:10;Ince,1992:122)。所以,机器的构造允许机器当它痛苦时删除正试验着的部分结构,快乐时则对其保持(强化?)。图灵也预见到了近来人们所说的联结主义机器可能在数字机器上实现模拟:“一些电子机器在它们实际运行时,我希望它们能够做到这一点[测试多种学习程序的‘教育方法’]。很容易创造一种适合于任何特殊机器的模型,这种模型可以在UpCM[图灵本人使用的缩写,代指用于实践的通用计算机器(universal practical computing machine)——今天的数字计算机]中运行,而不是如现在一样只能运行在纸面上的机器。如果人们同时确定了可以适用于机器的‘教学策略’,那么也可以在机器中对这些教学策略进行编程。人们如果使整个系统能够对自身进行感受,那么,机器对自身的感受会逐渐成为‘学业督导员’,能够检测机器取得了怎样的进步。同样地,类似于A-类型和B-类型的非组织机器也可以通过它们对自身的感受确定我们对它们所取得的进步。所有这些涉及的工作已经远远超出了单纯纸面-机器的范围”(1848/69:11;Ince,1992:125)。我们再一次赞叹,图灵远远地超越了他所处的那个时代,我们必须承认他同时是图灵机的发明者,现代寄存机器发展的贡献者,以及联结主义机器及其能够进行学习的预见者。

注释

[1]萨伽德(Thagard,1986)以及斯莫琳斯基(Smolensky,1988a)的论题(1i)提出,联结主义可能为心-身难题提供一种新的视角。但因为联结主义机器是从物质上抽象出来的(它们可以在神经元和硅上实现),也就很难确定联结主义自身对于心-身难题究竟有何帮助。

[2]斯莫琳斯基经常称之为有意识的规则“解释”,虽然这在计算机科学范围内是标准的术语,但是对于非计算机科学领域的人来说,这种说法似乎给人的印象不是对规则进行“解释”,而是“解释”本身的规则,像是在说关于“解释”的法则。

[3]这里,“单调”意味着递增。传统的演绎推理是单调的,因为从给定的前提中推演出的一组结论总是增加的,不会缩减。但是在非单调推理中,结论能够缩减,能够给予附加论据。

[4]我们不能忘记1948年是行为主义的全盛时期,而他1950年的论文提出“图灵测试”,就具有显著的行为主义式的学习特征。

【思考题】

CCTM的理据

从人类的表现行为中能够得出哪些理据?

从人脑的结构中能够得出哪些理据?

联结主义与联想主义的历史关联

联想主义工作网络与联结主义工作网络有哪些相似之处及不同之处?

联想主义是联结主义的一种特例吗?

联结主义的解释:pTC

斯莫琳斯基对于心-脑的描述而区分出的三个层级是什么?

在联结主义模型中我们如何表征“盛有咖啡的杯子”?

联结主义表征所具有的两种构成类型是什么?

斯莫琳斯基区分的两种认知能力(“知识”)是什么?

pTC有哪些构成要素?

pTC认为次概念层与神经层的关系如何?

pTC认为次概念层与概念层的关系如何(对于有意识的规则应用和直觉加工)?

系统具备认知的必要条件是什么?

活动样式具备怎样的必要条件才能成为一种意识状态?

联结主义网络通过哪两种方法可以获得其语义特征——它的表征能力?

可将联结主义工作网络的语义探测器看作什么?

结构分类(II)

结构分类有哪几个主要维度?

语义有效(SE)与非语义有效(SI)之间的区别是什么?

对于SE和SI的区分,数字机器与联结主义机器有何不同?

在何种意义上,存在计算机从图灵机器到联结主义机器的谱系?

【推荐读物】

CCTM的理据

关于联结主义的经典论述,参见Rumelhart and McClelland (1986a)第1卷第Ⅰ部分。

联结主义与联想主义的历史关联

关于联结主义与早期心理学发展关系的研究讨论,参见Valentine (1989)和Walker (1990)。在Bechtel (1985),Rumelhart and McClelland (1986a),以及Ramsey (1992)中,可以找到有关联想主义与联结主义之间关系的零散讨论。

对联结主义的解释

Smolensky (1988a)给出了pTC最重要的论述,他的一些主要观点可见Smolensky (1989)。对Smolensky (1988a)中关于pTC的原始论述的进一步讨论以及斯莫琳斯基的回应,可见Rosenberg (1990a,b),Mills (1990),以及van Gelder (1992)。Clark (1993)对联结主义模型的优势和缺点给出了长篇评论。

意识、认知与内容

对于突现问题的考察,参见Beckermann et al.(1992)。有关进一步将认知功能看作是有机体适应环境的结果的讨论,参见Copeland (1993b)第3章,尤其是第3.6节。关于SCDS的更多讨论,参见Ramsey (1992)。

结构分类

van Gelder (1997)的第5节,作出了与本书讨论非常不同的、更具一般性的分类。

图灵的非组织机器

关于这部分内容,还可参见Copeland (1998),以及Copeland and proudfoot (1999)。