12.3 CCTM的理据

溯寻CCTM模型的理据,发现主要源于两个方面:它的网络加工活动与人类行为相似,它的网络加工特征与人脑相似。

人类行为

回顾我们之前讨论的Jets & Sharks网络和NETtalk,这些模型都具有一些类似人类行为的特征:

Jets & Sharks网络

这种模型可以:

1.获取特定个体(“原型”)的具体特征。

2.从各个特定个体(“原型”)的存储知识中,抽取这一组对象的主要倾向。

3.填充模糊的缺省值。

NETtalk

1.比之音位,能够更快速、准确地获取重音。

2.按照“幂定律”进行学习(如,学习率和学习误差在双对数标度上函数几乎是一条直线)。

3.间断学习(spaced practice)(新旧词汇交替出现)比连续学习有更高的效率(从艾宾浩斯开始,人们就知道这种提高人类学习绩效的技巧)。

4.能够逐渐提高对新词汇的相对可靠的发音,NETtalk学习的内容越多,它的行为表现得越好。

5.当权值随机受到损害时,它的整体表现也将逐渐地(“逐步地”)衰减。

6.损害后,再次学习先前的学习项目,比第一次学习得快。

7.基于层级聚类分析(发现所有字母的读音,在隐层单元的发音活动中的不同特点),发现NETtalk将元音矢量聚集在一起,区分于辅音。另外,在元音和辅音的分类中,读音类似的元音(以及部分读音相似的辅音)也聚集在一起。

大 脑

支持CCTM模型的另一个原因,是强调CCTM模型与人脑有很多相似之处。理由如下:

1a.心智/脑模型,不应该将两者完全等同,更准确的说法是心智模型和唯一的脑模型,或者说

1b.比较好的心智模型应当与脑模型非常接近或匹配。

2.心智的CCTM模型就是这样的模型,它能够较好地模拟脑的总体结构和功能。

3.所以,CCTM是首选的心智模型。

DCTM认为,我们能够完全独立于人脑(硬件),对人的心智(软件)进行研究和理解,因此CCTM的这种观点与DCTM非常不同。CCTM倾向于弄清心理现象与神经现象之间的密切关系,尽管联结主义模型并不是神经模型,但能够模拟人脑的总体结构和功能特点。CCTM反对目前的DCTM在硬件上不能很好地反映人脑的总体结构和功能,因而可能会认为CCTM并不是一种严格意义上的以认知为基础的脑模型。如果接受了这一假设,那么就要继续考虑下面的问题。

大脑:结构

CCTM模型与大脑有许多结构上的相似之处:

1.CCTM模型中的单元类似于大脑的神经元。

2.CCTM模型中的连接(和权值)类似于神经元的轴突、树突以及突触。

3.脑和某些CCTM模型都是以层级的方式进行组织的。

4.脑的学习可能是以调节突触的连接强度进行的,某些CCTM模型也这么做。

5.脑的各个部分表现出并行兴奋和抑制的特点,某些CCTM模型也是这样。

大脑:功能

CCTM模型与大脑在功能上有很多相似之处:

(1)巨量并行加工(massively parallel) 与CCTM模型一样,脑的加工过程可能都是以大量并行的方式进行的。至于为什么是这样进行加工的,一种解释是:脑的神经元约以1/1000秒的速度传递信号(进行一次触发),而计算机约为1/100000000秒——比脑快百万倍。因而,如果脑是以串行程序进行加工的,那么它在1/10秒内——执行视觉识别和语言理解等基础操作的时间,只能运行100个指令。但对于这些任务的操作不可能只需要100步就可以完成。鲁梅尔哈特(Rumelhart)和麦克莱兰德(McClelland)作了如下解释:“现代串行计算机是以毫微秒为单位对基础操作进行测量的,而对神经元操作速度的测量单位有时是毫秒——或者10倍毫秒。因此,脑的基础硬件比串行计算机要慢约106倍。然而,需要注意的事实是,我们只需要几百毫秒就能够完成非常复杂的加工。毫无疑问,感知加工、大量的记忆提取、大部分语言加工、直觉推理以及其他的加工,都能够在这个时间范围内完成,这意味着人脑对这些任务的加工必定要少于100步,或者说并不是串行加工,也就是费尔德曼(Feldman,1985)所说的程序指令的100步限制(100-step program constraint)。另外,还需要注意的是,单个神经元可能并不能计算非常复杂的函数。单个神经元计算的函数,应该不会比数字计算机中的单个指令要复杂”(1986a,vol.1:130-1)。这样的限制通常称之为“100步法则”。

(2)内容寻址性 与CCTM模型一样,脑使用信息(内容)的片段就能获得信息的全貌——以内容-(content-),非定址-(not location-)的方式进行寻址。

(3)分布式存储 与CCTM模型一样,脑的每一种记忆似乎都没有某种特定的存储地址,而是将信息分布于脑的众多区域之中,每个区域都可以参与储存信息的若干片段(回顾第3章对拉什利的评述)。对于某种单个记忆,有人估计大约有700000—7000000个神经元参与存储这个记忆的痕迹,也有人估计是有1000个神经元参与。我们已经了解到,在NETtalk中约有20%的隐层单元参与单个记忆的编码。

(4)渐次衰减(graceful degradation) 与CCTM模型受到损坏一样,如果脑受到了损伤,会递级产生行为缺陷——也许不会出现明显的错误,但是系统的整体功能却不能很好地运行。

(5)对于杂乱和缺省输入的不敏感性 与CCTM模型一样,脑似乎能够轻松地加工杂乱和缺省输入——回顾当玫瑰网络的输入是缺省的时候,它的行为表现。

在后面的第13章中,我们会发现CCTM的这些功能优点其实并非是没有争议的。