4.5 简单探测器语义

所谓“简单探测器语义(simple detector semantics,SDS)”是指,一个神经过程(或者更普遍的任何“神经网络”)关涉什么启动了这个神经过程——神经的激活显示了或者探测到了神经元将要调整到的特定状态:当指定的特征(目标、特性或者环境中事物的状态)出现时,单元或者单元集就会开启[15];当出现其他特征时则关闭。可概括为:

(SDS)

单元或者单元集(神经元或者神经元集)表征能够开启它们的事物。

这个概念可由多个名称表达,包括“指示器”、“协变”、表征的“因果构成”以及“信息”理论。在某种程度上,SDS的提出受到了神经元单根纤维和单个细胞研究的启发。最初使人们深入理解这个观点的是勒特文等人的工作,以及他们的经典论文——《蛙眼告知蛙脑什么》。

勒特文、马图拉纳、麦卡洛克和皮茨与《蛙眼告知蛙脑什么》

为了理解“蛙眼告知蛙脑什么”,有必要了解有关蛙的一些特征。

1.蛙依靠视觉捕食。

2.它的眼睛和人类的眼睛一样,看到猎物时眼球紧跟不动,而身体动。因此它的眼睛非常稳定,在其视觉范围内没有中央窝或者特别敏锐的区域。

3.蛙只有一个单一的从视网膜到脑丘的视觉系统,与人的双重系统不同。

4.它不明白,也并不在乎它周围世界的静止部分是什么样的。

5.如果昆虫不活动的话,蛙也会在周围满是食物的情形下饿死。

6.它会跳起来去抓类似蠕虫和昆虫大小的物体,只要这种物体看起来像蠕虫或者具有昆虫那样的活动,因此蛙很容易受欺骗。

7.它通过跳到较黑暗的地方来逃脱危险。(Lettvin et al.,1959:231)

探测器

蛙从眼睛到大脑的路径,包含四个并列的连接到脑接收区域的组织构造:

1.对比探测器 能够察觉到在最小视觉区域中,具有明显轮廓的事物是运动的还是静止的,或多或少通过对比来实现。

2.凸面探测器 察觉在稍微大一点的范围内,如果目标颜色比背景要多少黑一些且正在它上面运动,那么目标是否具有曲线轮廓;只要轮廓属于那块区域,并且较为明显,当目标停止时它将记住这个轮廓;如果这个目标间歇性地朝着某一背景移动,那么就会加强对这个目标的关注;如果有一个阴影遮住这一目标一段时间,那么对这个物体的记忆将逐渐消失。

3.运动探测器 察觉在其视域且较大的区域内是否有一个移动的轮廓。

4.模糊探测器 察觉在最大区域内,还存在着多少看起来模糊暗淡的目标,主要通过与目标的距离和它们的运动速度进行权衡。

“昆虫探测器”

凸面探测器(上面所述构造2)证明具有一些非常有用的特征:“当黑色物体进入视域并做间歇性运动时,这种组织构造(构造2)会发生明显反应。即使光线发生变化或者背景(比如说花或者草的图片)移动,这种反应都不会受到影响。还能找到一个比这个更好的检测昆虫的系统吗?”(1959:253-254)勒特文等人这样描述探测器语义:“在蛙的视神经中,这种特殊的组织构造用来测量什么呢?我们认为,它是用来测量具有某种特征的刺激数量的。这种刺激能够使这种组织构造达到最大限度的兴奋,可将组织构造的兴奋称之为特征”(1959:253)。在该文的结尾部分,作者用检测器的激活命名特殊的刺激特征;也就是说,检测器的激活表征出现了那种刺激特征。该文前面部分则说明,至少在蛙的生存环境中,通过检测这种刺激特征,蛙可以知道什么物体可被认为是昆虫。人们发现,在猫的视觉皮层中也同样存在一些神经元,当接受水平光柱时会被激活,而另外一些神经元只有在接受垂直或者特殊角度的光柱时才会被激活。我们也许可称之为定向“边缘检测器”[16]。后来,许多文章又报道发现了许多其他类型的检测器[17],然而同时也出现了一些相反的证据[18]。

简单探测器语义难题

“构造组织2”的激活意味着探测到了昆虫的信号,昆虫开启了“构造2”的开关。任何理论在其起始阶段都注定会遇到很多难题,这种理论也不例外。这里,我们将重点讨论初级探测器语义遇到的如下难题。

真正因果或者纵向难题

太阳发出的光子,会被大气中的颗粒反射,被草或者树木反射,被昆虫反射。按照SDS理论,在“构造2”激活的过程中只有被昆虫反射的光子才会被蛙的视网膜吸收,转换为电冲动,又变成其他电冲动引起“构造2”的激活。问题:这里还有很多其他的因果因素,为什么只说是昆虫使蛙的“构造2”被检测激活?为什么不会是视网膜,或者树木、阳光的原因呢?是什么决定了正确的纵向因果链条?

横向或者质性难题

如果我们想知道“构造”因为昆虫而激活的相关因素,那么如何验证哪种有关昆虫的特征是有效的呢?毕竟,就通过反射光线而言,完全可以有很多其他的昆虫特征,如:有翅的东西,害虫的潜在的恐慌,带有杀虫剂的潜在药性,来自9300万公里之外不规则运动的光点等等,但为什么只认为是由于寻找到了这种反射光线的特征(认为是找到了昆虫)而被激活,而不是因为其他的可供选择的特征呢?

错误表征或者析取难题

第三个是错误表征难题:错误表征为什么是可能的呢?(这个问题最初由福多提出,标以“析取问题”而闻名[19]。)根据SDS,蛙是这样的:当出现一只(移动的)昆虫时,它的“组织构造2”被激活,然而激活它的也可能是一块苍蝇大小的磁铁:“把一张大幅有花有草的彩色照片放在蛙的视觉范围内,在蛙看来完全是一片自然生活的场景。在蛙‘组织构造’的接收范围内——7寸距离,移动图片,蛙没有任何反应。取一块苍蝇大小的磁铁放在图片上,在蛙视域内移动,我们发现蛙表现出了明显的反应。但如果把磁铁固定在图片上,与图片整体移动,蛙却没有反应”(1959:242-3)。据此,我们需要注意这里面究竟发生了什么。最初我们从蛙的例子得到两点认识:首先,简易探测器语义理论(SDS),即构造2的激活表征能够开启它的事物;其次,“构造”是一种“昆虫检测器”。但是,我们接着发现“构造2”同样对不规则运动的磁铁(moving magnet,MM)反应,这就是存在的问题。“构造2”被称为“昆虫检测器”,但是它却也对MM反应,那么根据SDS,它也可称之为“MM检测器”。那么,它对昆虫或者对磁铁都有反应,或可称之为“昆虫-或-磁铁检测器”。然而,如果它(真的)是一个“昆虫-或-磁铁检测器”,那么它会正确地把MM认作是“昆虫-或者-磁铁”,不会把MM错误地表征成昆虫。这就避免了错误表征的可能了。然而,错误表征还是可能的,1-或-2是错误的。简言之,一个潜在的错误表征可以被这个理论(SDS)转变成一个析取式的正确表征,因为出现昆虫或者磁铁的时候,这个“构造”都会被激活。事实上,就此事而言并没有理由认为称“构造2”为“昆虫检测器”(但它会误测磁铁)不如称“磁铁检测器”更好(但它会误测昆虫)。

我们怎样反驳呢?(1)可以认为勒特文等人错误地把语义构造2说成了“昆虫检测器”——而不是不规则移动的小黑点探测器——这便是第一次引进“凸面检测器”的原因(但也并非准确)。如此的话,MM例子完全不是因为错误表征,这里并不存在疑难。(2)我们可以修改SDS,加上有关蛙生活的有关“自然环境(natural environment)”:

(SDS-NE)

单元或者单元集(神经元或者神经元集)表征在其生活的环境系统中能够开启它们的事物表征。

这种修改了的构造2就可以保证蛙能够在充满昆虫(而不是MM)的环境中准确地对食物进行定位,而得以生存。无论哪种改动,都不得不对原来的观点作出修改。

注释

[1]这个“重要假设”没有反映出现代神经科学中“信号速率与轴突直径成正比”的事实。

[2]M&p主要讨论动作电位的“全-或-无”特征,已被证明(归因于后来更加娴熟的技术)以小于毫秒的速率递级激活传递。“重要假设”中也没有涉及神经递质在激活传递中的作用。

[3]事实上,每个神经元都有一联结阈值,必须满足或大于这个阈值才能激活神经元。

[4]事实上,所有的输入都有相同的联结强度或权值。

[5]事实上,这是一种不应期,在这期间神经元不能够被激活。

[6]注意到单元对兴奋性和抑制性输入的加和,与随后的感知器和大多数联结主义网络中的神经元相同。

[7]这个系统建立在怀特海和罗素(Whitehead and Russell,1925),以及卡尔纳普(Carnap,1937)的研究基础上。

[8]例如,明斯基(1967:36)说:“麦卡洛克和皮茨的论文最早受到赞赏的并不是因为它的标记方法,而是因为它有关哲学和技术上的内容”。

[9]例如,麦卡洛克-皮茨的图示被冯·诺依曼在1945年的EDVAC报告中采用——随后使用的人也越来越多。[10]在这些图示中,两个实心点表示神经元的兴奋,对比“与”和“或”的图示。换句话说,这暗示了阈值是2。

[11]参考Cowan and Sharp(1988)。

[12]在这里,罗森布拉特提到了明斯基及其他一些人的工作。也许是在阅读了罗森布拉特对“逻辑人工制造物”的研究后,激发了明斯基随后的评论。

[13]我们在这里计算的是实际联结层,而不仅仅只是可调节层。

100[14]罗森布拉特神经元首先对它的权值输入进行加和,如果加和结果等于或大于阈值,则输出;如果结果不等于或小于阈值,则静息。

[15]或者它是得到更多的激活。神经元开启或者获得更多的激活,都用“开”表示;相反地,则用“关”表示。

[16]参考hubel and Wiesel(1979)。

[17]参考Gross et al.(1972)的短尾猿“手臂探测器”。

[18]参考Stone(1972)。

[19]参考Fodor(1984,1987)。Cummins(1989)的第5章命名为“错误表征难题”,我们引用了康明斯的这种表达。

【思考题】

麦卡洛克和皮茨(M&p)

M&p对神经系统的形式化提出了哪五个假设?

这五个假设相对于20世纪中期有关神经元的研究有多精确?

神经激活的哪种“特征”可以适用于命题逻辑?

形式系统的连接神经网络的两个基本原则是什么?

为迟滞、与、或绘制M&p单元。

当提供存储时,M&p网络的计算力是指什么?

M&p论文具有怎样的历史意义?

M&p论文关于心理推论的三个潜在问题是什么?

罗森布拉特:感知器

罗森布拉特反对“计算模型”的五个指责是什么?

关于神经系统建构感知器的五个假设是什么?

最初的感知器

最初的感知器具有怎样的组织结构:什么是单元层,什么是单元层间的各连接?

基本(简单)感知器

基本的(简单的)感知器具有怎样的组织结构:什么是单元层,什么是单元层间的各连接?

可变联结层有多少层?

在感知器中,反应单元之间相互抑制吗?

哪些层次之间仅仅是前馈的?

哪些层次之间是反馈的?

在什么意义上说,感知器的存储是“分布式”的?

在什么意义上说,感知器是“并行”加工?

一般来讲,怎样训练感知器?

罗森布拉特从他的实验中得出的三个结论是什么?

在罗森布拉特的讨论中,能找到与当代联结主义相同的哪五个议题?

线性分离与XOR:麦卡洛克-皮茨网络与感知器

什么是线性分离函数?

说明XOR并不是线性分离函数。

(简单)感知器能够计算XOR吗?

(简单)感知器能够学习XOR吗?

(简单)感知器仅仅能够学习线性分离函数吗?

感知器收敛定理指的是什么?

(简单)感知器能够计算以及学习计算一种感知器收敛定理并不保证它能够学习的函数吗?

简单探测器语义(蛙眼告知蛙脑什么)

什么是“简单探测器语义”?

在蛙实验中,发现了哪四种探测器?说说它们分别做什么?

在蛙实验中,对发现的四种探测器来说,接受域的结构是怎样的?

哪种探测器被称为“昆虫探测器”,为什么?

正如勒特文等人所表明的,如果蛙也尝试去吃移动的磁铁,为什么还称之为“干扰器”?

“错误表征(或者析取)难题”是指什么?

这个问题是怎样被提出的?

【推荐读物】

概论

Anderson and Rosenfeld(1988)是同时期关于神经逻辑问题最好的论文集,包括了大量的有关问题和有用的介绍文章。在Quinlan(1991)的第1章,可以找到关于麦卡洛克-皮茨网络、感知器和XOR的有价值的总体看法及讨论,这一章还附加了对联想与联结主义之间关系的讨论。另一个较好的简短讨论出现在Cowan and Sharp(1988)。有关这段时期,最新的简明讨论可以在McLeod et al.(1998)中找到。Anderson and Rosenfeld(1988)中包含一些关于神经模型的先驱们令人感兴趣的总览。

麦卡洛克和皮茨

Minsky(1967)的第3章,对麦卡洛克-皮茨网络进行了详细讨论,前面所列的大多数文献同时也包括了对M&p网络的讨论。

感知器

除了上面所列的研究以外,在文献中还有大量的简短的对感知器的讨论。例如,Wasserman(1989)第2章,以及Caudill and Butler(1993)第3章。不幸的是,他们因对感知器的一些特征持有异议而受到指责。回顾并考察Rosenblatt(1962)中的讨论是非常有用的。Block(1962)第1-8章对感知器作为神经刺激的计算设置作了清晰介绍。Nilsson(1965/90)对感知器的学习作了全面讨论。