7.1 引 言
为了充分解释人类的认知能力,我们需要把认知看作是包含表征“操作”(生成、转换和删除)的过程。那么,认知功能模型必须能够对这些过程进行模拟。这就产生了两个问题:
(Q1)
计算模型“操作”(生成、转换和删除)哪些种类的表征?
(Q2)
这些表征如何表达它们的作用——是什么决定着它们所表达的内容?
第一个问题(Q1)被称为表征种类难题,第二个问题(Q2)被称为表征实现难题。要解答Q1需要揭示(i)表征的结构和(ii)计算机表征的主要程式及其特征。解答Q2则需要弄明白(i)在怎样的条件下,某物才可称之为一个表征,即如何表征其所表征,以及(ii)究竟什么决定它所表征的内容。
术语小议 提到表征(representations),通常会涉及“符号”、“语义”、“意义”、“指称”、“意向”、“内容”、“关涉”等概念,但是用任何一个词替代都有其优缺点。例如,如果“符号”广义上意谓它所表达的任何事物,那么就可以把表征等同于符号——为了风格多样,本书有时也会以这种方式变换使用。但是在通常情况下,“符号”一词具有非常有限的适用范围,如某人说:我不理解这个句子/岩石上面写着/刻着的一个奇怪符号。“语义”、“意义”、“指称”都可以意指它物,但是它们主要应用于语言系统中的问题。所以,我们采用“表征”一词部分地出于默认——它能够相当广泛地指代各种相关事物,但却较少引入不相关含义。最后,从构词法上看,因为“representation”具有“representations”的结构,所以从中或许可以获得一些真相:我们通常这样解释表征,用某事物X意指另一事物Y,即用X重现(re-representing)Y。
在说明这两个问题之前,我们先来分析几个基本问题。首先,尽管我们的兴趣主要集中在“心理”表征上,但是需要注意,事物的表征多种多样,它们的表征模式也相应地多种多样:感知、记忆、意象、自然和人工语言表达(如数字、计算和逻辑符号、笛卡儿坐标)、特殊概念系统表达(如音乐和舞蹈)、布线图、蓝图、地图、绘画、相片、全息图、雕像、仪表和计量器。除此以外,甚至还有临时特设的符号如用缺损的树,或者用一小堆石头做标记。其次,术语不一致会使问题变复杂。我们采用以下常规术语(但是我们需要不那么严格,特别是讨论他人的观点时,因为不是所有人都这样使用):
原子表征:它们不具有内部表征结构,其中任何一部分都不能表征其他事物。
复杂表征:它们由原子表征构成,组成部分具有表征功能。
组合表征:整体表征取决于其组成成分的表征及其结构关系。
例如,在英语(毕竟是一种表征系统)中,“Venus”这个词指称的是一个行星,但是这个词的任何一部分都不能指称或意谓其他事物(所以它是原子的)。我们也可以使用“the morning star”(或“the last star seen in the morning”)这样的短语来指称金星。它们的各个组成部分都具有独立意义,而整个短语的意义则取决于各个部分的意义以及它们之间的语法关系(所以它是复杂的和组合性的)。再来思考一下“kick the bucket(=die)” 这个习语。它的组成部分都具有独立意义,但是习语整体的意义并不取决于这些组成部分的意义及其相互之间的语法关系(所以它是复杂的但非组合性的)。要知道这类词组的意义,只需死记硬背就可以了。回到主题,假设某一计算机的寄存器中有以下信息:
1 | 0 | 0 | 1 | 0 | 1 | 1
如果将其看作是字母k的ASCII代码,那么它就是非组合性的,因为不在ASCII代码表中查询,就不能理解它的意思。如果将这个数串看作是一个二进制的数字(75),那么它就是组合性的了,其意思可以由二进制位值系统得到。
7.2 表征的多样性:标准的高阶格式
在计算和认知科学中,对于表征的本质,存在着许多不同观点。在认知的数字计算模型中,数据结构在表征中起着主要作用。正如一些程序语言是“高阶”的一样——它们容易使用,可以被翻译(编译、解释)成低阶的机器可以直接使用的代码——一些知识表征系统也是“高阶”的,因为它们简单易用,所以可以将它们翻译成机器可直接使用的基元,如数串、数列、树形图等。典型的高阶表征,包括逻辑(谓词演算)、语义网络和框架。
逻辑:谓词演算(pC)
谓词演算(pC),又称“量化理论”,在逻辑学中有着辉煌传统,相比其他概念,它的句法、语义和演绎力得到了更透彻的研究。以下的pC例子包括了七类表达:谓词、名词、连接词、变量、开句、量词和句子。它们每个都有与之相关的决定其语法性的句法规则以及决定指称和真值的语义结构。
谓词
通常将谓词的首字母大写:
F():()是女性
T(,):()比()高
姓名
通常将姓名首字母小写
a:Agnes
b:Betty
句法规则
谓词与特定姓名相结合就成为句子:
F(a):Agnes是女性
T(a,b):Agnes比Betty高
语义规则
一个具有以下形式的句子:“谓词+姓名”,当且仅当姓名所指具有谓词赋予的关系或特点时,为真。例如:
“F(a)”是真,当且仅当a具有特点F时,也就是说,当且仅当Agnes为女性。
“T(a,b)”是真,当且仅当a与b之间存在关系T,也就是说,当且仅当Agnes比Betty高。
句法规则
一个连接词与所需句子相结合就构成了复句
F(a) & T(a,b):Agnes是女性与Agnes比Betty高
F(a) v T(a,b):Agnes是女性或Agnes比Betty高
F(a) →T(a,b):如果Agnes是女性,那么Agnes比Betty高
-F(a):Agnes 不是女性
-T(a,b): Agnes没有Betty高
语义规则
一个具有以下形式的句子:“句子+&+句子”,当且仅当两个句子同时为真,为真(“v”,“→”与此类同)。
一个具有以下形式的句子:“-句子”,当且仅当句子S为假,为真。
术语解注:变量和量词 1879年,德国数学家、哲学家弗雷格(Gottlob Frege)出版了《概念演算》一书,首次使用变量和量词来分析句子的方法,对逻辑学产生了革命性的影响。令人惊奇的是,这开启了20世纪的一个学术探索——逻辑主义者试图证明数学是逻辑的一个分支,是逻辑的结果。1902年,罗素(Bertrand Russell)发现了弗雷格(完备)系统中存在一个矛盾,并在他与怀海特(Whitehead)的巨著《数学原理》(1910-13)中试图解决这个矛盾。1931年,年轻的奥地利逻辑学家哥德尔(Kurt Godel)
证明,任何试图将数学纳入逻辑的尝试,如罗素和怀海特的工作一样,必定失败。1936年,图灵使用哥德尔的结果和方法,证明了计算机科学中的一个基本定理:图灵机停机问题的不可解性——一个图灵机不能判断任意输入的另一个图灵机是否停机。弗雷格逻辑,尽管不是特殊的二维计数制,但也是标准的。这里,我们通过量词和变量两个手段来丰富我们的基本逻辑。
变量
x,y
句法规则:开句