2.3 对行为主义和刺激-反应心理学的挑战

20世纪50年代,行为主义在美国心理学(及相关的认知科学)领域中的统领地位宣告结束,开始逐渐向认知、信息加工范式转变。与此同时,出现了四种重要的趋势:首先,逻辑实证主义由于它的科学方法理论架构的非现实性和局限性而几乎被哲学界抛弃,其他很多学科也受到了影响。其次,行为主义的研究严重脱离了现实生活,大量论文只有该领域内的人才能看得懂,正如当时一位心理学家写道:“因为这种趋势,使得人们觉得心理学的研究对现实生活的意义不大,随之人们对心理学的兴趣也急剧降低”。第三,在此期间,行为主义的基本假设也受到了严重批评,批评的重点是指出,它没有说明行为的内在结构(无法用行为主义和刺激-反应心理学解释),并忽略了有机体对行为的影响。最后,在研究课题中出现了较多使用计算和信息术语的趋向。现在我们着重讨论第三点,最后一点将留在下一章讨论。

拉什利

1951年,拉什利(K.Lashley)发表文章批评行为主义的一些基本原则,产生了重要影响。他讨论的焦点是行为主义所不能解释的具有序列顺序的行为:“具有序列顺序的行为是一个重要问题;存在着一种具有时间等效性的产生行为的图式,它决定着具体行为的发生顺序,或作用于其自身或作用于与其相联结的其他行为”(1951:122)。

在行为主义者看来,按照刺激-反应理论,一种行为就是一串刺激-反应联结链,每一反应由上一刺激引发并引起下一个反应,如凭记忆用乐器演奏一串正确音符:

S1→R1/S2[第一个音符]→R2/S3[第二个音符]→…

拉什利批评了这种观点,他认为如组织语言、协调动作、整合时间与节律等行为都是S-R联结链不能解释的,“从节律活动或空间定向行为中,我认为可以推出在神经组织中必然存在着一种所有神经元相互联结、精细而复杂的系统,把大量不同类型的空间效应器得到的结果整合为统一整体”(1951:127)。作为替代概念,拉什利(如詹姆斯一样)转向了神经系统,认为神经系统对于输入的感觉刺激材料有着自己的组织原则,起着主动的作用,而不像旧S-R理论那么被动,“按照我的理论原则,输入刺激并不是一个静态的、不变的系统,而是总处于兴奋和被组织的激活状态。在一个健全的有机体中,行为是输入的特定刺激经内部兴奋条件的作用而产生的结果”(1951:112)。

乔姆斯基

对斯金纳最有力的批评并不是来自心理学家,也不是生理学家,而是一位年轻的语言学家乔姆斯基(Noam Chomsky)。他因为对斯金纳1951年出版的《语言行为》提出了质疑而受到广泛关注,此后行为主义也便不再被认为是心理学的研究框架。乔姆斯基还开创了一种新的认知取向,“乔姆斯基的这篇评论论文,也许是自华生行为主义宣言后最有影响的心理学文献”(Leahey,1992:418)。乔姆斯基对斯金纳(最切中要害)的批评主要是针对他的语言分析理论,当然他的批评并不限于此。乔姆斯基还质疑了斯金纳把人类活动与动物行为可用同一框架解释的充分性,尤其是比较生态学强调的那部分。在结尾部分,乔姆斯基从生成语法角度提出了一种新的框架。

对斯金纳普遍框架的批评

乔姆斯基首先列举了斯金纳提出的刺激、反应(“应答”、“操作”)和强化等概念,然后指出,尽管这些概念在实验室背景中能得到明确定义,但却并不能用来解释人在现实生活中的行为,“认为如此严密的科学理论完全可以广泛应用,这不过是一种幻觉。实际上,即使描述人在现实生活中的语言与描述实验室中行为的语言相同,其意义也是不一样的,至多仅有一些模糊的相似性”(1959:30)。然后,乔姆斯基用了三段内容支持他的批评,完全切中要害。

对斯金纳语言行为的批评

乔姆斯基首先列举了一些斯金纳用于描述语言行为的概念,如“自发的”、“祈使的”、“娴熟的”言语等,然后说道:“这些概念几乎涵盖了斯金纳体系的主要内容,我之所以逐一讨论这些概念是为了说明:如果我们认为它们只具有文学价值,那么斯金纳的描述则完全没有涉及语言行为的任何方面;如果认为它们是隐喻式的,那么比之传统的观点也没有任何改进”(1959:54)。

在审视了斯金纳刺激、反应和强化的概念之后,乔姆斯基说,斯金纳致力于在有限的、严格控制的实验条件下发现一些动物的行为。即便如此,也只能观察到那些在可观察的条件下引发的动物行为,而遗漏了动物内在的理解行为:“描述复杂有机体的行为,自然会想到……除了需要了解外部刺激之外,还要知道有机体内部结构的知识,以及有机体如何处理信息,怎样组织其行为等内容”(1959:27)。“仔细研究斯金纳的书……可以发现……强化理论者在实验中取得的成果,尽管非常令人信服,但是他因此将结论推广到复杂的人类行为,未免过于草率和肤浅……之所以不能把刺激-反应理论用来作为一种测量手段来解释语言行为,其主要原因是,我们对语言行为这种非常复杂的现象所知甚少”(1959:28)。

结 论

拉什利和乔姆斯基对行为主义批评的意义在于,尽管行为的各个方面都能够用环境、刺激和反应以及内部刺激-反应链进行控制和解释,但是,解释复杂生物体的复杂行为,却需要考虑到有机体、它的内部组织及其操作原则的作用。从这个角度来看,信息理论和数字计算机显然是完全符合要求的。

2.4 认知主义:信息加工心理学

行为主义的衰落引起了多种竞争范式的出现,但认知主义迅速成长起来,它主要源自信息理论和(将要成为独立学科的)计算机科学而非主流心理学,46“在很长一段时间的竞争中,一种最重要的认知取向从数学和电子工程领域出现了,尽管它们与心理学及其相关问题联系较少,甚至没有任何关系”(Leahey,1992:397)。数字计算理论是本书第二部分的主要内容,现在我们主要关注的是人们从20世纪50年代到60年代所做的一些初步且重要的工作。也正是在这一时期,人们开始使用并界定了信息加工的概念。

信 息

“信息”具有多种含义,最早通用的用法很难进行定义(因此只是狭义的技术概念),有点类似于:关于一件模糊事件的,或者什么东西是什么的准论点,这样的例子可以在《信息年鉴》中找到。根据这种通用用法,所得到的信息既不为真,也不为假,并且没有明确的测量方法。有时这个概念又称作“语义信息”,因为它是“关涉”于某事物的(语义)。与信息的这种通用用法相对的是技术上的使用,由申农在20世纪40年代早期提出,包含如下含义:信息就是减少可能性、无知状态或者不确定性。这种定义关注的主要是信息的测量,测量的标准单位是bit(二进制数)。1 bit的信息就是减少关于某一情形的不确定性或无知程度的一半,如抛掷一枚硬币,就是减少有两种变化状态的可能性(正面和反面)到仅有一种。2 bit信息是减少涉及四种可能情形到一种(第一个bit:从4到2,第二个bit:从2到1)。一则消息(信息)从发送者出发,经由通道传递到接收者,通道具有一定的容量和某种程度的噪音。

纯粹的信息理论主要关注信息的测量,以及在各种不同容量和噪音程度的通道中信息的传送。然而,对于早期的信息理论心理学来说,信息加工过程却是最主要的。更重要的是,早期信息心理学如Neisser(1967),倾向于关注感觉的输入(视觉和听觉),在第11章中只用了一章的篇幅讨论“高级心理过程”,如记忆和思维等。部分原因在于,信息的技术概念能够对感觉提供相当直接的应用:环境“发送”一条“消息”,消息在“噪音”背景下通过感觉“通道”,最终被有机体接收并理解。有关这种观点最早的流程图表达。47然而,当转向记忆和思维时,如何应用信息的技术概念就完全不能清楚说明了,所以信息的概念逐渐地在不知不觉中最终被“信息加工”所取代,成为一个双关语。

米勒:“神奇的数字:7±2”

乔治·米勒(George Miller)热衷于早期信息理论及其在心理学中的应用。他的早期著作《语言与交流》(1951)及众多论文,尤其是《神奇的数字7……》(1956),“激发了人们对注意和记忆容量限制的研究兴趣,并掀起研究信息-加工心理学的第一波浪潮”(Leahey,1992:406)。如米勒自己所言:“信息的概念已经证明在研究人的识别和语言能力中具有重要价值;预示了研究学习和记忆的广泛前景”(1951:42)。米勒在他那篇最有影响的论文中,开篇就写道:“我的问题是一直因一个整数而困惑。这个数字已经缠绕了我整整七年,就是它使我得出的实验数据都像是我故意弄出来的,使我的文章遭受了众多公共期刊的退稿。”在论文的正文部分,他详述了十二个实验,并得出如下两点结论:“首先,绝对判断的长度和短时记忆的长度在我们接收、加工和记忆信息量上有严格的限制”(1967:41);“第二,在人类心理学中,再编码的过程是非常重要的,应当受到更多的关注”(1967:42)。下面我们介绍一些关于这两点结论的细节。

线性刺激的绝对判断

米勒检验了关于四种绝对判断的学习。例如,当主体被要求辨认出分派给他们的数字的读音时,得出这样的研究结果:“当给予两个或三个数字时,被试从不会弄混淆。当有四个不同的数字时,错误开始出现,但也比较少。但是,当有五个或者更多的不同数字时,混淆错误就频繁地发生了”(1956:18)。在关于听觉、味觉和空间位置上也有相似的判断结果报告。米勒得出:“或因为学习,或因为先天具有的缘故,在我们的神经系统中似乎存在一些固有的限制。这些限制制约了一般变化幅度的通道容量。在现有证据的基础上,似乎可以明确地说,对于线性判断,它的容量有限且很小,并不因一种简单感知到另一种简单感知而发生变化”(1956:25)。他指出,这个容量就是7加减2。

再编码

既然我们的记忆长度限制在这样一个小数目的信息“组块”里,那么能够在每一“组块”中填充更多的信息就非常重要了,这个过程称作“再编码”。米勒列举了扩展对二进制数进行记忆的组块研究,他本人能够以5∶1的编码方式,没有错误地记忆40个二进制数,“再编码是一件我们能够掌握的,对增加记忆的信息量颇为有效的方法”(1956:40)。

在这一领域,米勒的论文具有重要影响,正好与乔姆斯基对结构语言的批评(同时也是对行为主义的批评)出现在同一时期。它不仅概括了各种实验得出的结果,而且使人们认识到了有机体内存在一种内在的信息-加工结构——这也正是乔姆斯基在语言学领域所提议的。

米勒、加兰特尔和普利布拉姆的《行为的规划和结构》

前面提到,乔姆斯基(1959)批评斯金纳以及绝大多数行为主义者忽视了“有机体处理输入信息和组织其行为的内在知识结构”。行为主义和刺激-反应理论认为,内在的S-R链条“调解”输入刺激与输出反应,但我们同时也看到,49拉什利(1951)和其他一些人提出最值得关注的是行为的内在结构而非S-R链条。尤其是,当有机体有一个目标,并需要知识、计划、策略和手段来实现这个目标,这就部分地需要具备一种层次组织结构,而不是线性的链条。米勒、加兰特尔和普利布拉姆在《行为的规划和结构》(Miller,Galanter,and pribram,1960)中就表达了这种观点,对复杂行为提出了重要分析。

疑难

米勒、加兰特尔和普利布拉姆(后文简称MGp)认为,一个人在通常的一天里,总是围绕着两个中心概念活动:期望或者想象将要发生什么,以及计划怎样应对。他们说,这些概念在行为主义框架内进行分析几乎是不可能的,事实上,“近年来,很多人已经开始怀疑反射理论太过简单,它的要素也太过简单”(1960:22-3)。与“反射理论”相对的是“认知状态”,“他们(认知主义者)认为一个事件对行为产生的影响,取决于这一事件如何在有机体内表征自身以及与这一事件相关联的所有其他事件的总体。他们确信,刺激与反应之间的任何相互关系,必然受到关于有机体所处环境的,且环境被表征组织化了的概念和关系系统所调解。人类——或者其他动物——具有一种内在的表征,它是关于环境整体的模型、图式、模拟、认知地图或镜像(image)”(1960:7)。然而,尽管在知识与行为之间的空缺小于刺激与反应之间的空缺,但空缺依然存在,必须得以填补,“很多心理学家,包括作者本人,都对这种在认知与行为之间的理论真空而困扰。这本书主要就是讨论……如何填补这个真空……描述有机体内在的整体表征如何控制行为”(1960:11-12)。

解决途径

MGp提出的解决方案主要包含五个部分:区分关于克分子和分子的分析层次、镜像、规划、执行和TOTE单元。

行为的层次结构

解决这个疑难首先需要了解“行为的组织层次”。解释和理解人类大部分的行为,能够并且必须同时在不同的层次组织上进行分析:50X由A+B构成,A由a+b构成,B由c+d+e构成。

反映在语言中的一个例子:X可能是一个句子,A、B是短语,a—e是单词,还可以继续认识到单词由词素构成,而词素是由音素构成。非语言行为同样也可以这么看待,X也许是指发动汽车,A是指踩油门,B是拧转钥匙,a是把腿放到油门踏板上,b踩下,c是把钥匙从口袋里掏出,d是把钥匙放进启动器中,e是拧动。至少是从托尔曼(Tolman)的工作以后,心理学家包括MGp,称较大的、较高层级的行为单元为“克分子”单元,而称较小的、较低层级的行为单元为“分子”单元。行为一经被认为是具有潜在复杂性和多层次性的组织,我们面对的问题就将是如何成功地描述和解释这两个层次。

镜像(不很恰当的术语)

有机体对于其周围世界及自身的全部知识(1960:17-18)。

规划

操作序列对有机体内任何组织层次产生作用的加工过程(1960:16)。

执行

当规划正在执行控制操作序列时,有机体也就正在执行这个规划(1960:17)。

TOTE单元

“TOTE”是“测试(Test)”、“操作(Operation)”、“测试(Test)”、“输出(Exit)”的首字母缩写,MGp认为可以用这个分析单元代替S-R理论的反射弧。他们最初是在神经层次提到它的:“神经机制中发生的反射行为,并不能用简单的反射弧或者刺激-反射联结链条解释说明。牵涉更多复杂监控、测试的反射行为的解释要比反射弧解释能够更充分地满足各种条件”(1960:25)。“因此,反射行为的普遍样式是根据有机体内固有的某些标准测试输入能量,如果有机体的反应与测试的结果不一致,那么继续对其作出反应,51直至差异消除才结束反射”(1960:26)。

在TOTE单元中的箭头(见下文),既可以表征神经冲动,也可以表征更高层次的加工过程,“反射仅仅被看作是实现TOTE样式众多可能中的一种,接下来的工作需要对TOTE单元进行概括,使它能够适用于绝大多数——我们希望的——对于行为的描述”(1960:27)。MGp详细讨论了两种加工过程,即传送信息和传送控制——告诉系统接下来做什么。在标准数字计算机中,这两种过程均由程序完成,控制通过从一个指令到另一个指令的转换,而告诉机器接下来做什么,执行什么操作,以及在哪里存储结果。在MGp看来,“TOTE单元……能够对普遍行为进行解释”(1960:29)。在解释复杂的具有层次等级的行为时,他们提出一个TOTE单元能够嵌套在另一个TOTE单元中。规划使复杂TOTE的层级结构得以概念化;行为可用包含在TOTE单元内执行操作的术语进行解释;“镜像”(有关世界的知识)提供条件,当需要时就会被测试。对这样一个复杂TOTE单元进行解释的例子是把钉子敲进墙内。

从TOTE层次结构到计算机的转变,是一种迅速且必然发生的趋势:“规划对之于有机体等同于程序对之于计算机”(1960:16)。恰好TOTE还满足如下两种功能:表征周围环境的面貌和控制系统接下来做什么。MGp的镜像以及TOTE单元的测试,都包含着对环境的表征。GMp的规划以及TOTE单元的操作,控制系统下一步要做什么。类似地,计算机的数据结构表征环境,程序是特定的控制转换——机器接下来做什么。而且,TOTE单元嵌套于TOTE单元也类似于程序嵌套于程序。

到了20世纪60年代中期,“信息加工”研究取向已经普遍被人接受,Neisser(1967)是有关它的第一本教科书——这本书被普遍认为在这一领域里产生了重要影响。不久,林德赛(Lindsay)和诺曼(Norman)出版了《人类信息加工:心理学导论》,更加坚定了这一研究取向,并主导了心理学未来10到15年的发展。

注释

[1]该书的销售情况并不乐观,4年内只售出80本。

【思考题】

“经典条件反射”的要素是什么?

桑代克“效果律”蕴含的主要观点是什么?

桑代克“练习律”蕴含的主要观点是什么?

在华生的论述中,行为主义的四个主要议题是什么?

“斯金纳箱”具有怎样的结构?

什么是“操作行为”?

在行为主义后期,出现了哪四种趋势?

拉什利反对行为主义的主要观点是什么?

拉什利如何理解神经系统?

乔姆斯基对斯金纳的主要批评是什么?

拉什利和乔姆斯基对斯金纳的批评有哪些共同点?

“认知”传统是从哪两个领域(心理学之外)出现的?

信息的通用概念与技术概念分别是什么?

如何测量信息(技术概念)?

米勒发现的关于短时记忆的限制是什么?

米勒、加兰特尔和普利布拉姆提出的“镜像”、“规划”和“TOTE单元”分别是什么?

TOTE单元与计算机有哪些共同点?

【推荐读物】

概论

Gardner(1985)第5章强调了认知在心理学中的作用以及对认知科学发展的贡献。Leahey(1992)是近期较有影响的心理学史概论专著——该书的第三和第四部分尤其与我们关注的论题相关。hilgard(1987)与本书有一些相同的材料,重点关注美国心理学,还包含更多的传记信息。hernstein and Boring(1966)除了大量地从心理学史(以及哲学和心理学)中搜集名著外,在一些相关论题上并没有取得多少实质性进展。pavlov(1927)是巴甫洛夫的经典著作。

行为主义

Skinner(1976)是一本权威性的关于行为主义的导论性著作。Fancher(1979)第8章也对行为主义进行了讨论。Boring(1957)的“行为主义”一节虽然有些过时,对于我们理解行为主义仍有帮助,且可读性较强。Marx and hillix(1963)是一本经典著作,第7章“行为主义”和第10章“S-R理论的种类”,从理论视角对行为主义的一些观点进行了概述,不过略显陈旧。对行为主义最新的讨论,尤其是有关斯金纳的贡献,见Flanagan(1991)第4章。hunt(1993)第9章对行为主义提供了具有可读性的概览。Smith(1986)对行为主义与逻辑实证主义的关系进行了研究。Dennett(1995)对自然选择在认知和行为主义的特殊应用进行了讨论。

其他流派活动

Flanagan(1991)讨论了这段时间内其他各种心理学流派的观点,其中第7章讨论了弗洛伊德的精神分析,第10章讨论了格式塔运动。

认知主义

除了本书中引用的那些著作外,在前面推荐的读物中也对认知主义有所涉及,如Gardner(1985)第5章中后面的部分,Flanagan(1991)第6章以及hunt(1993)第6章。