8.2 从心智的表征理论到心智的计算理论

DCTM不是凭空出现的,我们最好把它理解为更为一般的理论的一个特例,即所谓心智的表征理论(RTM)。

心智的表征理论

我们首先把心智的表征理论基本形式作如下阐述:

(RTM)

1.认知状态是具有内容的(心理)表征的关系。

2.认知过程是对这些表征进行的(心理)操作。

根据这种阐述,“相信”是一种表征的关系,“计划”也是一种,“意愿”又是另一种表征关系,因为不同的表征构成了不同相信的、计划的和意愿的事物。有两种具有影响力的哲学传统在RTM这里交汇在一起——一种来自于休谟,另一种来自弗雷格和罗素。每个传统都具有它的优点和不足。

休 谟

休谟认为,心理表征就是当我们在处于诸如相信、意愿和计划等心理状态时所“持有”的“观念”。在休谟看来,心理过程就是观念联结的序列,人们就是通过援引这些相关观念来解释行为的。然而,这并没有说明联结观念的“语义”是什么——它们是“指向什么”的,以及它们是“如何指向”它们所“指向”的?换句话说,休谟对观念和心理过程的解释并没有告诉我们,例如,一个信念何以为真,以及信念中的观念何以确定对某对象的指称和指向。休谟似乎认为观念就像图像一样,指向与它们相似或者最相似的东西。但是,相似性作为一种表征理论仍存在各种各样的难题。首先,把观念用图像来类比,可能存在概括不足或者过于概括的问题;第二,没有真正解释心理指称的问题;第三,不能判断事物的真假。对这些问题作一些详细的考察是有意义的。对于第一个问题,我们知道人们的很多观念并不与某物的图像相似(例如,像“正义”这样抽象的概念),它们更像是概念。就算当它们是图像的时候(当想象埃菲尔铁塔时,会具有埃菲尔铁塔的一个形象),有时也会因为太过于具体而不准确。对于埃菲尔铁塔的图像,一个人可能把它表示为一些大概的形状、方位、相对大小以及观看的角度(从旁边看,不是从上往下看)等,但是这些特征没有一个是我们能够想起埃菲尔铁塔时必不可少的。在另一方面,有些图像是相当难以确定的(也有人说“模棱两可”)。维特根斯坦(Wittgenstein)的一个著名例子是拨火棍图像,设想拨火棍一端放置在另一端的前面并形成了一个斜面,那么,这根拨火棍是要站立,还是要倒下?这两种可能性在这幅图像中都是存在的。对于第二个问题,一般来说,相似性并不是表征的充分条件。你的左手与它自身相似(与你的右手也相似),但是其中并没有表征关系。一个政治卡通人物可能与尼克松的模仿者而不是他本人更加相似,但是我们不会说,这个卡通人物因此表征的是这个模仿者,而不是尼克松本人。最后,对于第三个问题,图像本身不能判断真假——真假问题主要针对的是“句子”和“命题”,而不是“名词”。例如,我们不能说,“埃菲尔铁塔”是真还是假,但我们可以说,“埃菲尔铁塔是由古斯塔·埃菲尔建造的”是真还是假。

弗雷格和罗素

弗雷格-罗素的理论试图解决对休谟的这些批评,至少包括了上述的第二和第三个问题。罗素(Russell,1918)把“命题态度”引入了心智理论,即任何心理状态都涉及一种对命题(p)的态度。典型的例子包括:相信p,意愿p,计划p。弗雷格(Frege,1892,1918)认为,相信p包括两个部分,首先,有一个被相信的命题p,它提供了心理的内容——指向什么。这个命题可以是真也可以是假,所以相信的内容可以是真也可以是假,因而相信本身就可以是真也可以是假。其次,在人和命题之间存在一种弗雷格称之为“领悟”的关系。对一个命题不同的“把握(grasping)”方式会产生不同的态度,例如,命题p=火星上有生命存在,一个人可以相信p(火星上有生命存在)、希望p、惧怕p、意愿p等。弗雷格从来也没有说过“把握”一个命题到底是什么意思,虽然他也曾经将“把握”一个命题比拟为感受一种情境,但最后他宣称它是一个“谜”——如果考虑到弗雷格认为命题是一种抽象存在,那么谜的说法就使问题更加突出了。设想一个具有时空维度的实体,例如人,如何能够“把握”一种抽象存在呢?即便我们能够解释对这个命题的把握,但又如何能够解释是对这个命题的把握,而不是对另外一个命题的把握导致了我们的行为呢?如果我渴了并且相信冰箱里有啤酒,那么,这个信念对我产生行为具有因果关系,而且用这个信念能解释我的行为。对一种抽象存在的把握,如何能够起到这样的作用呢?这里主要考虑的不是抽象命题本身,而是抽象命题与心理的关系,而它能够起到心理解释的作用。

命题态度

在本章后面和下一章,我们将会看到“命题态度”对于DCTM的重要性。现在,我们只作简要讨论。命题态度(相信、意愿、计划等)同时具有一些共同特征,也有一些区别。这种思路对我们的讨论多有助益。

共同特征

(1)如前所述,弗雷格和罗素认为,认知状态之所以称为“命题态度”,部分原因是它们可以被分解为两个部分:命题内容以及对这个命题内容的“态度倾向”(也就是塞尔称之为“心理模式”的部分(Searle,1979,1983))。同样地,命题态度的特征一般来说具有以下形式:“xAp”,这里“x”代表人,“A”代表一种态度(相信、意愿、计划),而“p”代表命题内容。我们通常用表示态度的动词加上表达命题内容的句子来表示一种命题态度:

态度动词+命题句子

相信(believe)火星上有生命((that) there is life on Mars)

有时候我们需要对语言做适当变化以与某些态度动词相匹配,但我们仍然能够从上面这些例子看出对每个命题的态度来。

态度动词+ 命题句子

渴望(desire)火星上应当有生命((that) there be life on Mars)

希望(want) 火星上会有生命(there to be life on Mars)

计划(intend)我要去火星(that I go to Mars)

差异特征

(2)不同的态度倾向之间有一个很重要的不同,即所谓的“匹配的责任”(Austin)或“适切的方向”(Anscombe,Searle)。虽然当命题态度被满足时,它们都与现实世界相适切,但适切方向却因态度倾向不同而不同。例如,信念表达的是人的大脑中已有的对世界图景的认识,如果它与现实世界相匹配,那么就为真;反之,信念就为假。我们会说信念(以及与信念类似的其他态度倾向)具有一种从心理-到-世界的适切方向。与之相对,意愿和计划是我们给未来世界勾勒的蓝图——如果现实世界的发展确实与其相符,未来世界的图景与我们所意愿和计划的样子一致,它们就被满足。我们说意愿和计划具有一种从世界-到-心理的适切方向。一种态度倾向总有并且只有一种适切方向,也就是说,不可能出现某些信念具有一种适切方向,而另一些信念却具有不同的适切方向。这是因为命题态度就决定了态度倾向会总有一种适切方向。还因为命题内容p表达了世界是或将是的样子,也就是命题已经决定了适切条件(两种方向中的任何一种)。

(3)不同态度倾向之间另外一个潜在的差异与态度倾向的体验特征有关,或者说是否具有那种独特的体验特征。例如,如果你害怕房间里有一个闯入者,你可能会有一种特别的感觉,这种感觉绝对不会与渴望有一个闯入者的感觉相混淆。但如果你相信火星上有生命(或者同样的事情,即相信房间里有一个闯入者),是否也伴随一种特别的“相信的感觉”,如同在害怕与渴望时会伴随产生某种特别的感觉一样?更进一步说,这些“感觉”是态度倾向的必要条件,或者只是一种伴随物?这些都是目前认知科学争论的话题,我们将在后面回到这些话题的某些方面。

评论

休谟的理论(观念和相似性的联结)在提供心理解释方面具有优势,但它在描述表征的内容方面却没有可行性——(1)图像过于具体,以及只能局限于某一类心理表征,183因而不足以用来作为所有心理指称的模型;(2)图像也不能说明命题态度的真假、满足或不满足等问题。弗雷格和罗素的理论解决了一般意义上命题内容的真假等问题,但却没有提供心理解释。我们需要一个既能提供心理解释又能解决表征指向内容及真假问题的理论。

心智的数字计算理论基础

在我们详细阐述和论证完整的心智的数字计算理论(DCTM)之前,我们首先简要介绍关于这种计算进路的一些历史背景和影响因素,然后提出DCTM的基础形式。

历史背景

1947年,图灵(Alan Turing)作了一个题为“智能机器”的讲演,他提议要“研究机器能否具有智能行为”。接着他设想了各种“制造‘智能机器’”的方法(原文带引号)。特别值得一提的是,他还研究了训练机器的方法,正如他笑言:“期望一台从工厂直接出来的机器和一名大学毕业生进行平等竞争是不公平的。”

“图灵测试”

图灵在其1950年的著名论文《计算机器与智能》中介绍了一种“模仿游戏”,也就是人们熟知的判断机器是否具有智能行为的“图灵测试”的简化形式。下面是图灵本人(Turing,1950)对这个问题的出发点、测试设计,以及对测试的断言:

出发点 考虑这样一个问题:“机器能够思维吗?”……这个问题可以用另外一个问题来代替,用作替代的问题与它紧密相关,并且是用没有歧义的词语来表达的。

模仿游戏 这个问题的新形式可以用所谓的“模仿游戏”来描述。有三个人玩这个游戏:一个男人(A),一个女人(B)和一个提问者(C),提问者性别不限。提问者在另外的房间,和其他两人分开。游戏的目的是让提问者来分辨哪一个是男人,哪一个是女人。提问者以标签X和Y来代表他们,在游戏的最后,提问者说出“X是A,Y是B”或者“X是B,Y是A”……理想的方案是让一个电传打字员与两个房间进行联系……现在我们问:“如果一台机器代替A来玩这个游戏,结果会发生什么事情?”在这种情况下,提问者在作判断时发生的错误率,是否也像没有用机器替代前一样呢?这些问题就代替了我们最初的“机器能够思维吗?”这样的问题。

新的问题对人的身体特征和思维进行了分离,使得C只能通过对话识别是人还是机器。

赢得游戏 我相信在未来大约50年内将有可能会出现这样的编程机器,它的储存容量大约是109比特。这种机器在参加模仿游戏时,会表现得非常好,一般的提问者在提问5分钟后进行辨认识别的正确率不超过70%。我相信最初的问题“机器能够思维吗?”会变得毫无意义而不值得讨论。不过我相信,到本世纪末,这些术语的使用和教育的普及将会得到很大的改观,人们能够自由谈论机器思考的问题而不会招致非议。

虽然图灵讨论了使一台数字计算机能够思维的条件,但这本身并不意味着我们可以宣称人类的思维就是计算。也就是说,某些数字计算是“思维”(图灵经常在这里使用引号),人的认知是思维,但人的认知却可能不是数字计算。我们也很难找到图灵有过人的思维是某一种数字计算这样的断言。在他1947年的讲演中(前文已提及),图灵有过这样的鼓动性言论:“所有的这些表明,婴儿的脑皮层是一台未加组织的机器,它能够经由适当的干预训练而得到组织。组织活动可能导致机器的调试而变成普适机器或者类似的东西”(Turing,1947:120)。这个观点似乎意味着,脑皮层开始时处于一种由相互联结的神经元所组成的混沌状态(一种联结主义机器?),通过训练/教育,它变得有组织,接近于一台普适图灵机。由此可见,是由于脑皮层具有计算状态,所以使大脑具有了认知状态,这样我们就获得了心智计算理论的一个早期版本。

在人工智能以及部分认知科学领域,“图灵测试”被当作是对思维(智能、认知、心理等,这些不同术语都被无区别地使用)的测试。如果机器通过了测试(赢得游戏),就足以认定它能够“思维”,而且如果计算机能经由编程通过测试,那么思维的本质就是计算。如果思维只是心理算法的运行(还有其他的可能吗?),那么,丘奇-图灵论题告诉我们,这些心理算法都可以由图灵机来完成。185图灵定理告诉我们,所有的这些机器都可以由普适图灵机来模拟。因此,我们就可以推论,思维是计算的一个种类,类似于在普适图灵机上的计算,例如冯·诺伊曼机或者产生式系统。由此看来,人工智能、认知心理学还有神经科学的工作,就是要找出心智的真正算法(下一章会给出更多论证)。

普特南与图灵机器功能主义

1960年,普特南(hillary putnam)出版了《心灵与机器》一书,探讨了与心-身难题相关的心灵和图灵机的类比问题。但我们还不清楚他是否有意提出心智的计算理论。例如,他在书中评论说:“我并没有说这个观点(即是否能够识别心理事件和物理事件)是针对图灵机而提出的。”但如果心理事件是计算过程的话,有人可能会问:为什么不呢?后来普特南评述道:“我可能因为强调这种类比(心灵与图灵机),而被人指责鼓吹一种机械主义的世界观。但如果因此就认为我赞同机器会思维,此其一;或者人是机器,此其二,那么这样的理解都是错误的。”这听起来不像是心智的计算理论——心理状态等同于计算状态。在同一篇文章中,普特南明确指出图灵机可以有多种实现方式,即“普适图灵机是一种抽象机器,它在物理上几乎有无数种可实现方式”。但重要的是,他对于心理状态并未持相同观点。这一点在他1967年的论文《心理状态的本质》(原文的标题是《心理指谓》)里表述得很清楚,这篇文章很可能就是心智计算理论的滥觞。论文(putnam,1967)中还讨论了几个重要步骤:首先,把心理状态等同于功能状态:“简而言之,我认为疼痛并不是一种大脑的状态,即不是大脑(或者甚至也不是整个神经系统)的物理-化学状态,而是整个有机体的功能状态。”第二,他进一步阐明了心理状态可有多种可实现方式的观点:“哺乳动物的大脑、爬行动物的大脑、软体动物的大脑……乃至任何地球以外可以找到的所有动物都能感觉疼痛……”由此可知,(1)图灵机可有多种实现方式;(2)心理状态可有多种实现方式;(3)心理状态是指特定的功能状态。至此,普特南认为,对图灵机和心理状态两者共同具有多种可实现方式的最佳解释是:图灵机的不同状态指定了相关的功能状态,同时能够对应不同的心理状态。当然也许有人会(严厉地)批评说,普特南并没有谈及任何有关认知的东西,186只是谈到“疼痛”而已。但是,有理由认为,普特南只是把疼痛当作心理状态的一个典型例子,因而他的论据可以被推论到一般的心理状态上。例如,他在反对“心物同一论”时,说道:“心物同一论者认为不仅疼痛是一种脑状态,而且任何心理状态都是脑状态。”显然,如果图灵机器功能主义要反驳心物同一论,它也必须是关于所有心理状态的理论(强调它的普适性):“如果一个程序……成功了,那么紧跟着就会……带来对‘心理状态’这个概念的准确的定义。”我们知道,这篇论文的标题不是《疼痛状态的本质》(也不是《疼痛的指谓》),而是《心理状态的本质》——普适性是重要的。因此,与图灵相比,更有可能是普特南跨出了从“计算的智能”到“智能的计算理论”关键的一步。

布洛克和福多

布洛克和福多(Block and Fodor,1972)把普特南的图灵机(或概率自动机)思想扩展到了一般的计算系统,最后完成了对心智计算理论的建构(福多对CTM进行了扩展和提炼,讨论了下列理论和问题:思维语言(1975)、模块性(1983)、常识心理学与命题态度分析(1987)、狭义内容与意向归纳(1994)。

纽厄尔和西蒙

到目前为止,我们只是在哲学范围内回顾了CTM的历史,但从更广义的认知科学意义上来看,还有其他领域对其产生了影响,特别是人工智能(AI)。在这方面最有影响的成果之一是纽厄尔和西蒙(Newell and Simon,1976)的论文,他们在文中提出了:

物理符号系统假设:物理符号系统具有产生智能行为的充分必要条件。

可见,这个观点认为系统具有产生“智能行为”的能力,而没说它直接具有认知或者心灵,因而人们会说机械系统的行为是“智能的”,而不会说它们具有心智,就像没有人会说“智能炸弹”具有心智一样。但毫无疑问的是,这个假设试图表明,智能的先决条件是认知或者心智,似乎已成为本领域的一条理论预设。187但什么是“物理符号系统”?它是指储存在机器里的一组物理符号(例如,在硅片或者神经元上实现的符号)和操作:“物理符号系统包含一组称为符号的实体,这些实体是某种物理模式,是称之为表达式(或者符号结构)的另一实体的组成部分……除了这些结构之外,系统还包含一组操作程序,能够作用于表达式使其产生另外的表达式……物理符号系统就是在机器内能够产生出随时间而演化发展的符号结构集合”(Newell and Simon,1976)。既然这里所谈论的“机器”等同于普适图灵机(UTM),这个假设认为机器拥有了智能行为的能力等同于图灵机的实现。

心智的计算理论

在这些历史述评之后,我们转向目前人们阐述的一般心智计算理论(CTM)的普遍形式(采用福多对CTM的表述,Fodor,1987)。CTM对认知的普遍理解,尤其是对命题态度的心理状态的理解,现在都可以看作是RTM的特殊个案。CTM试图对所涉及到的关系、操作和表征的本质作出更为详细的规定。

1.在RTM中,关系是计算的。

2.在RTM中,操作是计算的。

3.在RTM中,表征是计算的。

我们首先讨论前面两点,第三点放在下一节讨论。

形式约束

关于计算的关系和操作,福多(Fodor,1981b)认为心智的计算理论必须遵守他所谓的“形式约束”:“我认为心智计算的过程是……符号的,因为它们是通过表征来定义的,同时它们又是形式化的,因为它们(概略地)借助于表征的句法操作表征……形式操作不需要通过诸如真值、指称和意指等表征语义特征加以说明……形式操作是指对特定范围内表征对象的形态进行的操作……按照心智的计算理论,两种不同观念,只有在当它们能够被识别出不同的形式表征关系时,才能够区分”(1981b:227)。当我们想到数字计算机的编程意味着什么时,形式约束就显得充分合理了。编写的程序(TM指令表、vNM程序、pS产生式)直接对数据结构的格式或形态进行操作,而不是数据结构所指代的对象。

术语解注:福多在论述形式约束的时候,经常不加区别地使用“形式”和“句法”。已经有人,例如戴维特(Devitt,1989,1991)就强烈地抱怨说,“形式”与事物的内在形态(格式)有关,而“句法”则与表征之间的外部关系有关。虽然我们也认同这种区别是重要的和恰当的,但似乎未引起学界的重视(弗雷格和罗素曾谈到“逻辑形式”,而卡尔纳普则用“逻辑句法”)。我们把“句法”当作是“形式”的一种格式变体。

态度

形式约束告诉我们,什么时候会有两种不同表征,而在什么时候会产生两种不同态度?例如,如何区别相信、意愿和计划?考虑一下空想先生的例子。我们知道在诸如“相信”和“意愿”的标签下具有不同的表征集合。决定一个表征属于相信而不是意愿的,是这个表征与其他表征之间的交互方式——即在理论和行为动机推理中它被利用和操作的方式。如果你想要喝点什么并且相信冰箱里有可乐,在其他条件都满足的情况下,就会计划走到冰箱前取可乐喝。这通常要涉及“相信盒”中构成相信的表征之间的一系列互动,以及“意愿盒”中构成意愿的表征之间的一系列互动,其他命题态度也是如此。这里的“盒”是为了将复杂的计算关系形象化而作的简化处理。这些计算的关系和操作尽管一般是通过编程的方式输入机器的,但有时却是硬线连接的(我们将在本书的结尾部分回到这两者的区别上)。目前我们仍使用这个中性的术语。

表征也有语义,或者说,表征具有“心理内容”,因为它们表达了命题,并因此而指向某事物。我们可以把一般CTM表述为:

(CTM)

1.认知状态是具有内容的计算心理表征的计算关系。

2.认知过程(认知状态的改变)是具有内容的计算心理表征的计算操作。

到目前为止,我们已经有了一种一般心智计算理论。但如何才能得出明确的心智的数字计算理论呢?这是目前某些争论的焦点(后文涉及)。现在我们只是讨论两个合理条件:

结构 心智的数字计算理论附加的一个约束是,计算结构(记忆和控制)必须是数字的。

表征 心智的数字计算理论所附加的另外一个约束是,表征必须是数字的,也就是称之为数字计算理论的原因。

根据这两个条件,可以用CTM的数字规定表述基本DCTM如下:

(B-DCTM)

1.认知状态是具有内容的计算心理表征的计算关系。

2.认知过程(认知状态的改变)是内容的计算心理表征的计算操作。

3.计算的结构和表征(上述第1点和第2点)都是数字的。

最后一点,还必须知道,每一种命题态度,例如“相信”,都是一种概念束(包含多种不同的相信),因此在相信集合中就会包含多种计算关系。