14.7 穿越随机性
归根结底,繁育一个有用的东西几乎就和创造一个东西一样神奇。理查德·道金斯的论断印证了这点,他说:“当搜索空间足够大时,有效的搜索流程就与真正的创造并无二致了。”在包括一切可能之书的图书馆里,发现某一本特定的书就等同于写了这本书。
人类早在几个世纪前就意识到了这点——远远早于计算机的出现。正如德尼·狄德罗〔15〕在1755年写道:
书籍的数量将持续增加。可以预见,在未来的某个时刻,从书本中学习知识就如同直接研究整个宇宙一样困难;而寻觅藏身于自然的某个真理也并不比在恒河沙数般的书册里搜求它更麻烦些。
《循环的宇宙》〔16〕作者威廉·庞德斯通用一个类比来阐述为什么搜索知识所形成的巨大博尔赫斯库与搜索自然本身形成的博尔赫斯库一样困难。想像一座包含所有可能之视频的图书馆。像所有的博尔赫斯空间一样,这个图书馆的绝大多数馆藏品都充满了噪音和随机灰度。通常一盘磁带所能播放出来的只是两个小时的雪花斑点。要找到一盘可以一看的磁带,最大的问题在于,一盘随机磁带除了它本身,无法用占用更少空间或更短时间的符号来表示。博尔赫斯库中的大多数藏品都无法进行哪怕是一点点压缩(这种不可压缩性正是随机性的最新定义)。要想搜索磁带,你只有去观看带子的内容,因而花在对磁带进行整理上的信息、时间和精力将超过创作这盘磁带的所需,不论这盘带子的内容是什么。
进化是解决这道难题的笨办法,而我们所说的智能恰好就是一条穿堂过室的隧道。当我在博尔赫斯图书馆里搜索《失控》时,如果我足够机敏,说不定要不了几个小时我就已经辨明了绕过图书馆层层书架直捣黄龙的方向了。我可能已经注意到,一般来说,往上次翻过的书的左边去会更有“感觉”。我可能向左跑出去几英里,而这段路程以往需要很多代的缓慢进化才能通过。我也许已经了解了图书馆的架构,并可以预测出所求之书的藏身之处,这样我就可以胜过随机的猜测和乌龟爬一样的进化。通过将进化与对图书馆内在秩序的学习结合起来,我也许能找到我的《失控》。
一些研究人类心智的学生提出了一个强有力的论点:思维是大脑内想法的进化。根据这种主张,所有创造物都是进化出来的。当我写下这些文字时,我不得不承认这一点。我在写这本书之初,脑子里并没有一个成形的句子,完全是随意选了一个“我被”的短语;接着下意识地对后面可能用到的一脑袋单词做了个快速评估。我选了一个感觉良好的“封闭”。接着,继续从十万个可能的单词中挑选下一个。每一个被选中的都繁育出可供下一代用的单词,直到我进化出差不多一个完整的句子来。在造句时,越往后,我的选择就越受到之前所选词汇的限制。所以说,学习可以帮助我们更快地繁育。
但是下一句的第一个单词可能是任何一个单词。这本书的结尾,远在十五万次选择之外,看起来如此遥不可及,恍若银河系的尽头。书是遥不可及的。在世上已经写成或将要写成的所有书里,只有在这本里才能找到这句话之前那两个前后相接的句子。
既然我的书已经写了一半了,我就要继续进化文字。我在这一章里将要写下的下一个词是什么呢?说实在的,我一无所知。它们可能是什么?也许有几十亿种可能性——即便考虑到它们受到约束,必须符合上一句的逻辑性。你猜到下一个句子就是这句吗?我也没猜到。但我写到这句结尾时,发现就是它了。
我通过寻找来写作。我在自己的书桌上对它进行进化,从而在博尔赫斯图书馆里找到它。一个单词接着一个单词,我穿行在豪尔赫·路易斯·博尔赫斯的图书馆内。仰仗我们头脑所进行的某种学习和进化的奇妙组合,我找到了我的书。它就在中间那层书架上,几乎齐眉高,座标在52427区的第七个回廊。谁知道它究竟是不是我的书,抑或几乎算是我的书(也许这段或那段略有不同,或者漏掉了一些重要事实)?
这次漫漫搜索给我的最大满足——不管这本书是珠玉还是敝屣——只有我才能找到它。
注释
〔1〕 这里应该是指“巴别塔图书馆”(The Library of Babel),最早出自博尔赫斯1941年的短篇故事集。
〔2〕 大千:这里借用了佛教“大千世界”之“大千”。英文原文为universe,意为“宇宙”。
〔3〕 拓扑(Topology):数学数语,简单地说,可以将其理解为几何图形的抽象模式。
〔4〕 Hadal:中文意思为“极深处(海面6000米以下的深处)”。
〔5〕 连接机(Connection Machine)系列:包括CM-1,CM-2和CM-5。它把大量简单的存储/处理单元连接成一个多维结构,在宏观上构成大容量的智能存储器,再通过常规计算机执行控制、I/O和用户接口功能,能有效地用于智能信息处理。CM-1由四个象限组成,每个象限包含多达16384个一位处理器,全部处理器则分为4096组,组间形成12维超立方体结构,其集成峰值速度达到每秒六百亿次。CM-5的结点数更多,功能更强。该系列对于早期的并行计算机科学有重要意义。
〔6〕 “思维机器”公司(Thinking Machines):创办于1982年,1994年破产,由太阳公司(Sun Microsystems)收购。
〔7〕 可能形式库(library of possible forms):由所有可能的形式所组成的库。为简洁计,我们后面都使用“可能形式库”这个词。
〔8〕 遍历(traverse):计算机搜索算法中的术语,指按照某种算法,对一个树状结构的每个节点做且仅做一次访问。
〔9〕 BASIC:全名为“Beginner's All-purpose Symbolic Instruction Code”,直译为“适用于初学者的多功能符号指令码”,这正好与其首字母缩写成的英文词有相同的含义。BASIC是计算机发展史上应用最为广泛的高级语言,至今仍然是计算机初学者的入门语言。
〔10〕 《盲眼钟表匠》:The Blind Watchmaker
〔11〕 杰克逊·波洛克(Jackson Pollock, 1912.01.28~1956.08.11):二十世纪美国抽象绘画的奠基人之一。
〔12〕 反向工程(Reverse Engineering):通俗说,就是倒推的办法,即根据结果或输出来推断输入或设计。
〔13〕 读者可能会有些困惑:狮头、蛇尾、分叉舌,并没有超出父母双方所具有的特性啊!实际上,“内亲”和“外戚”的差别在于,“内亲”是一种线性插值,而“外戚”则不是。狮子和蛇的内亲,有狮头蛇尾,或者有蛇头狮尾,都不足为奇;但狮头里长出分叉舌来,则超出了“线性”变异的范畴,因而不属于“内亲”。相对于可能存在的“外戚”来讲,“内亲”只是极小的一个集合,但由于“内亲”所具有的线性关联性,因而具有很多很好的特性。
〔14〕 显性基因,隐性基因:举例来说,人的双眼皮基因是显性基因,单眼皮基因是隐性基因。这就意味着,一个单眼皮的人必然有一对单眼皮基因,而一个双眼皮的人,可能有一对双眼皮基因,也可能有一个双眼皮基因和一个单眼皮基因。
〔15〕 德尼·狄德罗(Denis Diderot, 1713.10.05~1784.07.31):法国启蒙思想家、唯物主义哲学家、无神论者和作家,百科全书派的代表,最大成就是主编《百科全书》。(摘自中文维基百科)
〔16〕 《循环的宇宙》:The Recursive Universe