第10章 每个人都是习惯的奴隶
爆发的频率:熵
我们到底有多好预测?我们终于能够为这个一直困扰我们的问题给出一个定量的答案了。虽然人与人存在很多不同,但我们的可预测程度都差不多,无情的统计规律使得异类根本不存在。我们的行踪都深受规律影响,而它的影响力比我们想象中要大得多。
新时代的奥威尔式“高科技妄想症惊悚小说”《游侠》(The Traveler)于2005年面世后,网络上就掀起了一场奇怪的论战。书中描绘了一个没有危机和意外的世界,一个无趣的平常世界。这个大同世界由一个名为“巨型机器”(Vast Machine)、遍布世界各地的电脑系统维持。这个系统由数以百万的监视器、感应器和探测机组成。只有一个曾经很强大的古老部落的后人以及他们的持剑保护者“哈里昆人”(Harlequins)能够意识到“巨型机器”的出现,并准备将它摧毁。
博客和论坛上关于这本书的讨论,很容易都集中到了对后9·11时代与书中那个被严密监视世界的比较上。另外,讨论还集中在对这本书文学价值的批评上。正如一位批评家所说,这本书“看起来可能只有七年级的阅读水平”。而对于这一评价,很少人会去质疑。不过,还有一些讨论是关于这本书的作者十二只鹰(John Twelve Hawks)。
这本书的大卖以及电影版权的敲定应该会让十二只鹰跃身为世界名人,使他成为像史蒂芬·金(Stephen King)以及丹·布朗(Dan Brown)一样的知名作家。但事实并非如此。这不是因为媒体故意回避他。人们没听说过十二只鹰的真正原因是,没人认识他。他不做图书签售,也不参加任何图书推广会。实际上,他从未出现在公众视线中,甚至跟他的编辑都只通过无法追踪的卫星电话联系。就像书中终其一生追踪“巨型机器”的哈里昆人一样,十二只鹰“生活在社交网络之外”。而正是这种神秘的隐居生活才让人们一直讨论他的真实身份。
《游侠》的主角是一个哈里昆人。她从来不用信用卡,也不去银行开户,甚至不会长期居住在同一个地方,她就这样一直生活在社交网络之外。她意识到“任何能够反映哈里昆人日常生活习惯以及生活圈”的现象都能被“巨型机器”捕捉到,并进而查到她的所在地,所以她总是“随机行事”。也就是说,她依靠随机数生成器来替自己做决定。“奇数是对,偶数是错。只用按下按钮,随机数生成器就会帮你做决定”,而这样一来她的活动也就变得完全不可预测了。
书中不仅描绘了一场善恶争斗,将读者带到了一个犹如西奥多·卡鲁扎呈现给爱因斯坦的五维世界当中,还融合了日本剑术武打和量子计算机科学等诸多元素。但它回避了一个问题:谁能将这个可预知人类行为的“巨型机器”建造出来?
我们完全相信粒子物理学家能将对质子的运动轨迹的预测误差缩小在微微米的范围内,也相信火箭专家能够成功发射一颗卫星,并保证在9个月后在火星上放置一个机器人。但跟质子和卫星不一样,人类会在不断改变的世界中寻求新的体验,所以想要预测人的长期行为是不可能的。事实上,基于我忙碌的行程安排,到目前为止我发现任何试图预测我在一周之后的行踪的尝试都是徒劳。这也让我更确信“巨型机器”将会永远待在属于它的地方——科幻小说中。然而,最近我开始对此有所怀疑。
让数据变得更有意义
我们心中有一个根深蒂固的观念:年轻意味轻狂和未知。受到西方20世纪六七十年代主张教政分离者那种反主流文化的影响,加上如今的网络青年开创的那种速食潮流,“年少轻狂”成了无数广告宣传、电影剧本和前40名榜单金曲的惯用标语。基于此,我们开始将大学,这个青年文化的摇篮浪漫化,将学生视为最天真率直,至少是最容易被预测的人。然而,经常跟学生交流的麻省理工学院的教授桑迪·彭特兰(Sandy Pentland)却发现这个观点十分荒谬。
在20世纪90年代早期,彭特兰教授在麻省理工学院的媒体实验室开始了对便携式电脑的研究。他指出,随着电脑的不断变小,不久之后,我们会将它一刻不离地带在身边。桑迪的预测惊人地准确,因为现在电脑已经变成了我们的行头以及时装配件之类的东西。实际上,通常情况下我们已经不称它们为“电脑”,而是简单地称之为“智能电话”。
2004年秋天,桑迪实验室里的博士生内森·伊格尔(Nathan Eagle)免费给100名学生每人发了一部当时最高级、最值得拥有的诺基亚智能手机。不过,这可不是白给,条件是手机拥有者的一举一动都会被记录下来:他们在何时何地给谁打电话,他们的聊天时长,他们的位置以及周围都有些什么人等。在为期一年的实验结束后,内森·伊格尔和桑迪·彭特兰一共搜集了45万小时的数据。这些数据是对75位媒体实验室的教员和学生,以及25位斯隆管理学院的新生的通信、行踪以及各种行为的记录。
为了使数据变得有意义,内森将每个学生的行踪分为三部分:家、工作地以及“其他”。最后一项指的是他们既不在家也不在工作地,而是在沿着查尔斯河慢跑或在朋友家聚会的时候。然后,内森开发了一个运算系统来探测重复的行为动作,并很快发现工作日学生们大多在晚上10点到早上7点之间待在家里,在早上10点到晚上8点之间待在学校。他们的行动只有在周末才有细微的变动,那时候他们往往愿意一直在家待到早上10点。
每个熟悉学生生活的人都不会对这一结果感到惊奇。但系统对他们行踪的预测确实准得惊人。内森发现,如果他知道一个商学院的学生上午待在哪儿,他就能以90%的准确率预测出他下午的行踪。对媒体实验室的学生来说,这个系统发挥得更好,准确率一度达到96%。
生活如此抵触随机运动,渴望朝更安全、更规则的方向发展这一点引起了我们的兴趣。如果真是这样,那么学生们的生活就是按部就班的,而不是像掷骰子那样日复一日地进行着。事实上,内森的运算系统一周之内只有两次没有预测出他们的行踪。在这短暂的“叛逆”时光里,他们终于表现出了人们内心中的狂放和自由。但这些不可预测的时间并不是随机的——是星期五和星期六晚上,典型的聚会时间。在每周剩下的时间里,一天24小时中的22小时,他们既不是如遁形般难以定位的奥萨马·本·拉丹,也不是无处不在的布兰妮·斯皮尔斯,而是一成不变地过着机械生活的普通人。所以,那些坚持用随机数生成器做决定的哈里昆人可能真是想到哪儿做到哪儿吧。但如果他们在麻省理工学院读书,那么他们的行踪就不再是秘密——对内森来说不是,对“巨型机器”来说更不是。但我们还是可以避免《游侠》一书中描绘的那种奥威尔式世界的出现。
对我来说,当我在2007年夏天买了一支巨型手表之后,无助感就油然而生了。那是一块扎眼的反流行表,同时也是个能每分每秒定位我的位置的GPS装置。我戴上它几个月后,一个计算机专业的客座学生瞿泽辉(Zehui Qu)利用内森·伊格尔和桑迪·彭特兰的运算系统计算了GPS上记录的数据。果然,瞿在熟悉了几天之后已经能以80%的准确率预测到我的行踪了。
虽然这个运算系统的表现令人吃惊,但内森用它对麻省理工学院学生所做预测的96%的准确度,同对我的80%的准确度之间的差距还是有待分析。我和麻省理工学院的学生都不能代表大部分人。玛尔塔对手机记录的研究已经解释了这个问题:一旦涉及人类的运动模型,每个人都是有差异的。一些人,如麻省理工学院的学生和我,都是在家和工作地之间往返的类型。但还有一些人是经常旅行,几乎不着家的异类。
这是不是就意味着有些人比麻省理工学院的学生和我更难预测?是那些一连好几周全国各地到处跑的卡车司机?抑或是那些开着小面包车载着孩子在钢琴课和剑术课之间跑来跑去的“足球妈妈”?还是我们的那位“行踪可疑”又惹祸上身的超级旅行者哈桑·伊拉希?这些人跟你我有什么差别?我们周围真的有靠掷骰子做决定以至于我们永远无法预知他们行踪的哈里昆人吗?
你的重复性决定你的熵
如果丹尼尔每个工作日都是上午8点开始工作,中午在同一个餐厅吃午饭,然后在下午6点左右下班,并在家里一直待到第二天早上,那么他未来的行踪对我们而言就没什么秘密可言了。用物理学或信息科学的术语来说,丹尼尔的熵就是零。换句话说,他的行踪是完全能被预测的。相反,利用随机数生成器做决定的哈里昆人的熵就趋于无限大,如此一来他们的行踪就是完全不可知的。
爆发洞察
熵是用来描述一个体系的混乱程度的(或者是有序度)。奥地利物理学家路德维格·波尔兹曼(Ludwig Boltzmann)将熵S和系统可用状态数Ω通过公式S=logΩ联系了起来。换句话说,如果系统现在的状态很明朗,那么状态数就是1,也就是说Ω=1,那么熵就是0。然而,如果一个系统的状态数是N,那么它有一个无限大的熵,也就是Smax=logN。
如果丹尼尔的日常生活异常规律,那么任何时候他的行踪都是明朗的。所以,对他来说就是S=0。然而,对哈里昆人来说,他们某个时间可能会在N个不同的地方,那么熵就是logN。波尔兹曼同时代的人认为熵的发现很重要,因此就将它刻在了波尔兹曼的墓碑上。他们是对的,它的确很重要。
如果我想知道你有多好预测,我必须先知道你的熵,而这正是宋朝明(Chaoming Song)试图做的研究,而且不是针对一个人,而是针对无数个人做的研究。宋朝明,一个聪明的博士后研究助理,他是2008年春天加入我的实验室的。他在利用我们的手机数据库分析百万个用户的数据时很快发现,其实算出每个用户的熵没有说得那么容易。
宋发现最大的困难在于,大多数时候他并不知道这些用户的具体位置。实际上,只有在我们使用手机时,手机信号塔才能记录我们的位置。但是,我们的手机模型是具有爆发性的,这就意味着当我们连续使用手机时,在短时间内会有关于我们所在范围的很多记录;但信号塔还会有很长一段时间没有任何方位记录,因为我们那个时候没有使用手机。这种杂乱无章的记录使得用户没有想象中好预测。
事实上,由于丹尼尔总是在几个地方(家、办公室以及餐厅)规律地运动着,所以他的行踪才比较好预测。但要是我们只有在他打电话的时候才知道他的行踪,那我们就需要花上很久才会知道他的生活如此规律。如果他偶尔偏离规律的生活轨道,比如散步到附近的公园去吃午饭,或者早早下班去跟朋友一起下馆子吃大餐,那么根据我们掌握的散乱的数据,他的行踪看上去的确是随机的。从某种程度上讲,我感到自在多了,因为那表明我们的生活被无数个爆发点笼罩着,想要追踪每个人的行踪变得很难,而想要做出预测就更难了。不过,我马上意识到爆发并不能使我们躲过所有的雷达网。
宋朝明从我们日常活动的一个重要特性上得到了意外的灵感——重复[1]。如果我们去国外旅行,那我们的朋友肯定会很高兴定期收到我们在做什么以及我们在哪儿的状态更新。然而,如果是在工作日中,每小时给研究员打个电话核对他们的进度是一个非常惹人厌的举动。事实上,我们的工作在某段时间会毫无进展,这样我只能重复同一个答案:我还在工作、工作中、还是在工作、仍然在工作。我知道,亲爱的——你总是在工作。
爆发洞察
宋朝明恰好能从这种重复性中获益,因为它能帮他完成一开始时那个毫无头绪的工作:揭开电话模型爆发的不确定面纱。也就是说,依靠我们做事时习惯上的重复性,朝明巧妙地设计了一个能精确预测每个用户的熵的程序。基于此,我们最终能够为那个一直困扰我们的问题给出一个定量的答案了:我们到底有多好预测?
每个人都有一个最大可预测性
1927年,年轻的德国物理学家维尔纳·海森堡(Werner Heisenberg)发现了一个不等式,也就是有名的“不确定性原理”(uncertainty principle)。这个原理指出,在不确定的情况下你对一个物体的方位知道得越多,就越不能确定它会去哪儿。也就是说,如果我们费尽心思确定一个粒子的精确位置,那么我们就不可能得出它的速度;但如果我们测出了它的速度,那我们肯定不确定它的位置。
海森堡的预测之所以违反直觉,是因为它对我们的研究质量没有什么帮助——它指出即使是最好的实验也不能同时确定一个粒子的位置和速度。但正是这一点才显示出它的重要性,从电子到人类,这个定律适用于所有事物。实际上,对于一辆正在行驶的自行车或是疾驰的汽车来说,可预测的不确定性太小以至于大家都没注意到。但事实就是如此。(我自己曾在一辆自行车和一辆疾驰的汽车之间弄伤了手腕,但海森堡不需要为此负责。)
根据海森堡的“不确定性原理”,我在想人类的可预测性是不是也存在根本的限制。为什么我不能预测你们未来的行为呢?是不是我使用的工具有一定限制?还是我掌握的数据质量不够好?再或许是我已经到达了极限却不自知?如果这个极限真的存在,那么就算我们优化了工具,完善了数据质量,未来对我们来说仍然是个谜。另外,如果真的存在某种极限,那么发现它的确切本质就变得很重要,因为它可能揭示了我们的绝对可预测性,通过它我们就能预知未来。
尼克·布鲁姆(Nick Blumm)是我实验室里的一名研究生,他证明了这个极限确实存在,而且我们都会受它影响。在我看来,这一点颇具讽刺意味,因为发现这一点的人生活中充满了意想不到的转变。在以优异的成绩获得物理学学士学位后,尼克在学术界已经争得了一席之地。但他并没有按部就班地生活,而是决定做些改变。他曾去东京当英文老师,跟随默剧大师马塞尔·马索(Marcel Marceau)学习哑剧并取得了很好的成绩,去曼哈顿辅导富人的孩子,然后又去了布鲁克林儿童博物馆(Children’s Museum in Brooklyn)做了自然科学馆的馆长。过了近十年随心所欲的生活后,他看了我写的《链接》那本书后,才找到自己想要追求的东西。之后,他就回到学校攻读网络学博士学位。照这样看,尼克最有权力问这个问题:有谁能解释他那条反传统的生活轨迹?他自己?有可能,但不确定。确切地说,他证明了不管我们的预测系统多么精密,我们对熵是S的手机用户的预测还是会偶尔出现差错。
如果丹尼尔的熵是0,理论上讲我们能够100%准确地预测出他的所在。然而,大多数人的熵都不是0。这就意味着他们的行动会有一定的随机性——他们会偶尔做出我们始料不及的转变。所以,每个人都有一个最大可预测性,以至于不管我们怎样努力都不能绝对肯定他的具体位置。
当宋朝明忙于测算每个手机用户的熵时,我们已经发现人类的活动遵循幂律规律了。也就是说,大部分人都不怎么出远门,只有少部分异类会定期进行长途旅行。因此,每个人的预测程度存在很大不同这一点并不是讲不通的。如果一个人的生活局限在一个小圈子里,那么我们很容易就能找到他。但对于像哈桑那样定期去几千公里外的地方旅行的人,我们知道要想找到他们就很难了。
爆发洞察
不过,我们这次的直觉错了——预测性并不遵循我们熟悉的幂律规律。也就是说,不管我们多么努力地搜寻,数据库中都找不到异常值。相反,我们发现所有用户的平均可预测程度都在93%左右。这就意味着人们只有7%的时间是行踪不定的。这些不确定事件往往发生在两个人们最常去的地方之间——比方说在高峰期乘车上下班的时候,或者午饭计划有变动的时候。在剩下的时间里,大部分用户的行踪都相对容易预测。
对一些熵值低的用户来说,他们的可预测程度甚至接近100%。这并没有什么奇怪——它只能说明我们中有些人的生活非常规律罢了。真正令人意想不到的是,我们的案例中根本没有预测程度低于80%的人。不管他们的生活圈子有多大,搭乘什么样的交通工具,每个人都是习惯的奴隶,这使得他们的行踪变得极易预测。
我们的手机用户中没有哈里昆人,这不禁令我们困惑起来:那些随心所欲、反复无常的人都去哪儿了?他们到底藏在哪里?
在进一步讨论之前,我想说明的是“我们做了什么”和“我们的可预测程度有多高”之间存在本质的差别。当涉及“我们做了什么”这个问题——比方说我们的旅行距离,发邮件以及打电话的数量时,我们遵循幂律规律。也就是说,总有一些人比其他人更活跃,他们会发更多邮件,会去很远的地方旅行。这也说明异类很平常——总有一些哈桑那样的人,他们会定期去几百甚至上千公里外的地方旅行。
但一旦涉及人类行为的可预测度的问题,幂律规律令人吃惊地被高斯分布取代了。这意味着,不管你把自己禁锢在方圆2公里的社区内,还是每天驱车去数十公里外的地方,又或者是乘快车甚至是坐飞机上下班,你都和别人一样好预测。一旦高斯分布出现,异常值就不存在了,正如爆发在泊松的随机世界中不存在,或者不可能在街上看到一个3000米的巨人一样。虽然人与人之间有很多不同,但我们的可预测程度都差不多,无情的统计规律使得异类根本不存在。
但尽管统计规律百般阻挠、万般遏制,还是有人能够不受限制。这个人就是我们的朋友哈桑·伊拉希。
谁是异类
底特律被扣事件发生5年后,也就是他的追踪无常项目实施一年后,哈桑再次飞回美国。这次他乘坐的是伊比利亚航空公司的6251次航班,目的地是纽约的肯尼迪机场。最近,他过得非常自在,因为在满世界转悠的时候他几乎没再受到移民局的骚扰。但这次下飞机的时候,那种似曾相识的感觉又回来了——他又被带到一个特殊的房间隔离了起来,对方要求他在那里等候。
“我就在那儿一直等,一直等,一直等,”他回忆道,“有人进来问了一些问题后就走了,然后过了五分钟又有人进来问了一些其他问题后又走了。他们都是传话的人。我一直没能跟负责人说上话。”
最后,他听见一个探员对房间里的另一个人喊道:“嘿,坐伊比利亚航班来的那个家伙还在吗?”哈桑异常懊恼,他当然还在啊。然后他被带到了一间问讯室,这才弄清了事情的缘由。
并不是有人想告诉他发生了什么事。这种保密程序——问问题,不泄密,现在对哈桑来说已经再熟悉不过了。但是按照哈桑的话说,国土安全部是“一个非常粗心的机构”,所以即便他不想听也不想看也没辙。
比方说,他们在问讯室里落下了一张纸,刚好就放在他眼前。上面有一个被拒绝入境乘客的名单,而它明显对哈桑很不利。一定是有人粗心大意地将这张纸留在了这儿,恰好让哈桑发现那上面记了三个恐怖分子嫌疑人的名字。
那三个都是穆斯林的名字,一个来自巴基斯坦,一个来自沙特阿拉伯,剩下那个来自美国。而那个美国人正好是他自己——哈桑·伊拉希。
所以,哈桑最终弄清了自己被扣留的原因。其中那个巴基斯坦人已经因“间谍罪”被拘留了。另外那个来自沙特阿拉伯的人被怀疑是“军火走私者”。而哈桑——好吧,看到他名字后面写的被扣留的原因,他感到很困惑。
上面并未提到他那个“私藏弹药”的储藏库。
也没提他那个颇具讽刺意味的监视行动——追踪无常项目。
那张纸上写着:“9·11后形迹可疑”。
“那么,到底是什么让他们觉得我‘形迹可疑’?”想到文件上写的内容,哈桑忍不住夸张地说道:“说句题外话,关塔那摩监狱的一名叫克里夫·斯坦福·史密斯(Clive StaffordSmith)的律师说,他们发现了一份某人对自己为什么会被关进关塔那摩的原因的报告。那个人在报告中说原因是‘他下出租车的时候举止可疑’。”
哈桑说着说着就提高了音量。“一个人下车的方式有多少种?怎么区分哪些举止‘可疑’,哪些‘不可疑’呢?话又说回来,什么是‘可疑’的举止,什么又是‘不可疑’的举止呢?”
哈桑想不明白。但我不能稀里糊涂就扔下这件事,因为它产生了一种很重要的可能性:“可疑”是不是等于“不可预测”?
哈桑不在我们的手机用户数据库中,就算在我们也不知道,因为数据都是匿名的。不过由于他已经仔细追踪自己的行踪好几年了,所以我们不需要知道他的电话记录。他发给我们一个文件,里面包含2007年2月到2007年12月间他自己的一举一动。在这10个月里,他去了1040个不同的地方,足迹遍布美国和欧洲。看起来他好像去了很多地方,但实际上并不是。据我那支巨型GPS手表显示,在2007年的两个月时间里,我也去了515个不同的地方。[2]
爆发洞察
从某些方面看,虽然哈桑和我在运动上存在类似的地方,但我们俩其实非常不同。事实上,虽然我的生活不像麻省理工学院的学生们那么规律,但根据我80%的可预测程度,要想知道我的方位并不难。然而,当瞿泽辉利用预测系统分析哈桑的数据时,他遭遇了一次惨不忍睹的失败——他试了4000多次,但只有3次能正确预见哈桑的位置。即便使用往世界地图上扔飞镖的方法来决定他的位置都比这准确度高。实际上,哈桑就是一个哈里昆人,是完全不可预测的。
我坦率地将这一发现告诉了哈桑,跟他说据我们的研究,他的行为完全是随意的,他的可预测程度是0。
“不可能是0吧,对不对?”他笑了笑,然后紧接着说,“我是说,有些地方我会经常去啊。”
的确,新泽西州的某个地方哈桑一共去了131次。随后我们发现当时他的家就在那边。但就算是这样,要预测他还是没那么容易。可以比较一下,在我乖乖戴着那款GPS手表整整两个月的时间里,我被追踪到在家的时间有880次。我和哈桑的区别简单来说就是:我每晚都会在家睡觉,但哈桑在开往欧洲的火车上睡觉或睡在机场的时间跟他睡在自家床上的时间几乎差不多。他的确时不时回家,但并没有什么可识别的模型。
在哈桑看来,他的不可预测性并没什么特别让人感到惊讶的地方。虽然他没有明确地这么说,但我感到他认为我们的分析有点让人难以理解。[3]他能轻易对自己的每一步行动做出解释,所以他确信自己的行为是完全正常的。
“这是我的工作,”他说,“四处奔波就是我的工作。”
爆发洞察
我并不这么认为。并不是说我怀疑他的话,真正的问题是如果我们的可预测程度跟旅行距离一样符合幂律规律,那么其中就会有很多异类,但如果不符合幂律规律,那异类就不存在。他们不可能出现,所以我们同样都是可预测的。但不论我们怎么分析那些数据,一旦涉及他的可预测程度和生活方式,哈桑显然就是个异类。由于异类在这种情况下并不存在,所以正如国土安全部怀疑的那样,他就是很不正常。
到处都是电子踪迹
回到年轻时代,很好,而且会显得很时尚。年轻人这个群体会更自由奔放吗?哈桑和我之间的不同,能不能归结为我们有五岁的年龄差距?然而,我们马上意识到不是这样的。
我们搜集了一些14岁到16岁的年轻人的资料,这样一来我们便能轻易比较不同年龄段的人的可预测程度了。结果是明确的:不管是年轻人、中年人,还是老年人,所有人的可预测程度都差不多。其中只有一个现象值得注意:与女人相比,男人的可预测程度要低一些。
我们经常会夸大自己和别人的不同,总以为自己的生活与周围的人相比要更规律或更不规律。然而,事实上,不管你是艺术家、摇滚乐手、会计,还是大公司的CEO,一旦将你的日常生活量化,你的可预测程度和你的邻居相差无几。由于我们的可预测性,我们又回到了熟悉的泊松和高斯世界,在那里每个人都相似,所有事都很“正常”。你可能每天会到几百公里外的地方活动,而我的生活圈可能只有3公里,但你我一样都是习惯的奴隶。那种永不停止的自由奔放只不过是个幻象。相反,我们的行踪都深受规律影响,而它的影响力比我们想象中要大得多。
我们会随身携带手机,会用信用卡,会经常被监视器拍下来,总之我们所到之处都留下了电子指纹。哈里昆人知道这种电子追踪的危险性,所以干脆用随机数生成器去避免习惯性的行为。但在虚拟世界之外,我还从没遇到过一个用随机数生成器做决定的人:我们一会儿在哪儿见呢——去星巴克喝咖啡,还是一起飞到东京去?让我们掷骰子决定吧!随着追踪设备的增多,再加上我们生活方式中根深蒂固的规律性,人们对隐私的关注也日益增强。我不禁也心生顾虑。嗯,我们真的要通过掷骰子做决定了吗?
要想预知未来,必先了解过去
尽管数据显示我的可预测程度很高,但熵值低并不会禁锢我的未来——只有当你知道我的过往历史的时候,你才能做出预测。另外,如果我的熵值很高,我的过去并不能说明未来会怎么样;如果我的熵值很低,我的行为会很容易被预见,但这只是在你了解我过往行踪的情况下才能实现。这反映了一个很浅显俗套的道理:要想预知未来,必先了解过去。
然而,揭开过去的面纱并不如想象中那么容易。比方说,乔治·多热·塞克勒以及他一生的经历——怎么能确定之前我们忆起的那些关键事件真的发生过,而且是完全按照我们的描述发生的呢?当熵值很低的时候,我们就会对某件事特别的确定。
我来解释一下吧。乔治·塞克勒在贝尔格莱德的决斗是当时的著名事件,所以它的真实性几乎不存在什么争议。但他和他的部下在贝尔格莱德和内格雷克之间发生了什么事则存在很大的争议。虽然我们可以肯定主教在圣坛发起了十字军东征战役,但他是不是当即就决定让乔治·塞克勒来统领千军了呢?如今,大部分历史学家都认为乔治·塞克勒只不过是在布达被任命的众多将领中的一个,绝不可能是总司令。事实上,如果主教真的在布达正式任命了某人,在那样一个重要的时刻肯定会有书面记录留给后人。但没有任何那个时代的记录留存——我们只是在多年后的历史记载中得知了主教的选择。
由于明显缺乏证据,后代的历史学家认为是在十字军转变成起义军后,乔治·多热·塞克勒才第一次露面充当领袖。如果这是事实,他可能从来就没想带兵去攻打奥斯曼土耳其。他领导的那支十字军可能自始至终只瞄准一个靶子:贵族。
那为什么后来的史官会坚持认为是主教亲自任命乔治·塞克勒为领袖呢?嗯,也许是因为事情过去了那么多年,当时的很多细节都已被人遗忘,所以有些人觉得将塞克勒的权利看做直接来自教皇的神圣权利比较省事吧。
乔治·塞克勒和萨基主教在国王赏赐的黄金上发生的争执也是中世纪史官广为附和的故事。但那也许只是人们为这位不受欢迎的主教的被杀所找的一个善意的托词呢?所以,虽然难以理解,但一些被历史学家和读者视为理所当然的重大事件可能根本就没发生过。基于人类过去的不可知性,未来的不确定性也就不足为奇了。
爆发洞察
我们不需要一路追溯到16世纪去弄清一件事的真实情况。要记住,虽然熵值低意味着可预测性高,但要想预知你未来在什么位置,我们必须知道你过去的行踪。虽然电话记录颇具洞察力,但要想达到预知未来的目的只依靠它们是远远不够的。要想预测你未来的所在,我必须知道过去几个月里你每个小时都在哪里。除非你使用手机的频率极高(很少有人会这样),不然你大多数时候的方位仍然是个谜。
所以,不管我们是在研究今天的事情还是16世纪的事情,我们最终面对的问题都一样:如果过去对我们来说是未知的,未来也就难以预测。但是,如果我们的过去突然变得清晰起来会怎么样?那么不管是人类的未来还是社会的未来都将不再是个谜团。所以,为了能够看到未来,我们必须及时回到过去。
这正是我们接下来要做的事情,再次回到16世纪深入调查乔治·塞克勒为围攻泰密斯瓦所付出的努力。
特兰西瓦尼亚牵制战
地点:特兰西瓦尼亚的科罗日瓦
时间:1514年7月初,夏至
科罗日瓦在1514年时还不是特兰西瓦尼亚的首府,但由于这个地方土地肥沃、商贾云集、市场繁荣、铸造冶炼业发达,所以它变成这个国家最富有的城市也指日可待。科罗日瓦曾经是罗马的殖民地,在公元895年被匈牙利收复,然后在1241年遭到了鞑靼人的屠城。匈牙利前国王斯蒂芬五世(Stephen Ⅴ)命令撒克逊人接手了这座弃城,但它的日益繁荣马上吸引了很多匈牙利人重新回到这里定居。至15世纪中期,全城4000居民中半数都是匈牙利人,所以为了维护和平,该城的总督在1458年制定了一城两制的政策:城市的有效领导者,也就是士师,每年将由匈牙利人和撒克逊人轮流担任。
繁荣的经济加上作为皇室自治区而享有的税项优惠使得它有大量财力可以投入到防御工事上去。所以科罗日瓦城外环绕着2.25公里的高墙,上面设有18个塔楼,每个塔楼都有重兵把守。城墙四周的拱形吊桥连接着大门,每扇门都有铁闸保护,这也是所有防御工事的最薄弱之处。
这座城的宁静和繁荣最终在1514年被打破。夏至刚过,昼渐长天渐暖。科罗日瓦城城门紧锁,吊桥也被升起,守城官兵佩戴石弩和火绳枪在城楼上放哨。与此同时,不安的士师正在市政厅和议会大臣一起商议大事。一支人数众多的十字军现在就驻扎在城外要求进城。这座城市的未来和城内居民的死活都取决于大臣们的反应。
如果大臣们对这座城的防御能力有信心,那么他们无论如何都会紧锁大门。然而,他们知道城内的士兵再怎么训练有素,也不是城外洛林茨教友率领的十字军的对手。名声在外的洛林茨拥有过人的胆识和决策力,这在他攻克匈牙利众多守卫森严的防御重镇时已经有目共睹。另外,城内的穷人都支持十字军——或者说是革命者,这取决于你从哪个角度看他们。所以,如果围攻开始,城内守兵很可能会遭遇城内的叛乱者。
然而,打开城门放弃抵抗也绝不是好办法。那不仅意味着城内富有的大臣和市民要放弃地位和财富,将它们拱手让给农民,还意味着他们会被国王和总督视为十字军的共犯。
马提亚王在1467年平息了一场特兰西瓦尼亚的叛乱后回到他的家乡科罗日瓦时的一幕幕,城内所有人至今仍历历在目。马提亚王大笔一挥废除了这座出了叛贼的城市的皇室自治权,当众斩杀了三个贵族,并将所有叛军一一治罪。最后,这些反叛者都被烧红的铁钳撕成了碎片。
几年后,科罗日瓦才重新获得了贸易权利。所以当再次面临悍兵围城时,科罗日瓦的富有大臣们既害怕丢了小命,又害怕失去君主的信任。然而,他们没什么选择了,因为他们的保护者、特兰西瓦尼亚的总督现在下落不明。他们不得不靠自己的力量抵抗洛林茨的大军。那位总督到底在哪儿?他计划如何应对这场突如其来的革命呢?
1505年,国民议会下令如果乌拉兹洛王死后没有继承人,只有匈牙利人有资格登上王位。这很奇怪,因为当时的国王和女王都是从势力强大的皇室成员中挑选的,民族并不能作为参选的有利条件——现在人们心目中的民族观念在当时并不存在。
当时的国王乌拉兹洛是波兰国王和一位匈牙利公主的后人。由于冲突和纷争,乌拉兹洛王并没有一并统治波西米亚和匈牙利。[4]相反,他头戴的双层皇冠被认为是力量的象征,代表着增进捷克和匈牙利联盟的利益。
国民议会之所以期望匈牙利人当选国王,是因为他们想看到当时只有18岁的约翰·萨普雅登上王位。一年后,乌拉兹洛王的儿子的出生不仅引发了塞克勒人和国王那群如狼似虎的亲信的血战,更让萨普雅失去了称王的机会。然而,这位比国王还富有并手握兵权的年轻伯爵并没有老老实实地退居幕后。在贵族的施压下,乌拉兹洛王被迫任命萨普雅为特兰西瓦尼亚的总督。这个显赫的职位成了萨普雅继续觊觎王位宝座的有利据点。
1514年,当贵族武装一个接一个臣服在乔治·多热·塞克勒的脚下后,人们越来越清楚地认识到只有一个人能跟十字军抗衡:特兰西瓦尼亚的总督约翰·萨普雅。所以他迟迟未现身着实令人感到奇怪。有人怀疑他一边带领自己的十字军在奥斯曼土耳其边境打仗,一边坐山观虎斗——事实上,虽然匈牙利沦陷了,但特兰西瓦尼亚还是一片祥和景象。那儿没有招募新兵,没有十字军营地,更没有血腥的战争。[5]
另外,匈牙利的悲惨境遇对萨普雅来说并不是什么坏消息。他从一开始就反对十字军东征,现在他更是心满意足地观望,因为随着时间一天天过去,越来越多的政治劲敌会在混乱中屈服。他的宿敌巴赛瑞遭到了攻击,被困在泰密斯瓦城内,而且还负债累累。乔纳德和泰密斯瓦附近被十字军占领的大部分土地都是乔治·布兰登伯格(György Branderburg)的领地。这位曾收到过吟游诗人陶利努斯呈献的史诗的边疆伯爵一直大力支持哈布斯伯格(Habsburg)继任王位,所以他不可能赢得萨普雅的同情。
然而在军营中,这位总督的缺席令很多人感到难以理解,而且流言已经如瘟疫般传遍整个军营。普遍的观点是他们的领袖乔治·塞克勒已经和总督定下了不开战的协议。事实上,由于萨普雅长期以来都支持削减贵族,所以很多人都认为总督也站在他们那边。
但当十字军挺进特兰西瓦尼亚边境的时候,现状就被打破了。洛林茨教友和他的军队首先到了特兰西瓦尼亚的门户和主要防御重镇奥拉迪亚。在1474年遭到土耳其人的围攻后,这座堡垒已经被重建并用高墙大瓦加固,而且作为主教的城堡,这里一直由威猛的皇军把守。难怪当这座以坚不可摧著称的不倒之城被洛林茨攻下后,消息竟很快传到了远在千里之外的意大利和布拉格。
为了维护无畏领袖的威名,洛林茨处死了守城官兵并扣押了城内的贵族。但他并没有在奥拉迪亚闲着。他留下一个小分队,又从当地招募了几千战士,然后带领他们一同进入特兰西瓦尼亚,向宝城科罗日瓦[6]挺进。
听到洛林茨向科罗日瓦进发的消息时,萨普雅已经穿越了南喀尔巴阡山脉,正在回特兰西瓦尼亚的路上。所以6月7日,他立即在德瓦堡(Déva)写了一封信要求整个特兰西瓦尼亚的贵族联合抗敌。第二天,他意识到形势紧急,所以就改了命令,要求所有贵族全副武装最迟在7月25日赶到奥拉迪亚,而且每个骑士也要全副装备并带领旗下1/10的农民应战——这是一个不寻常的命令,表明总督意识到了形势的严峻。
萨普雅先最后期限一周就到达了奥拉迪亚并在那里表明了自己的立场:任何称自己为十字军或想成为十字军的都要被抓起来,“砍头,剥皮,或被烧死、被杀死,遭受酷刑折磨至死”。
科罗日瓦的士师意识到萨普雅不会来救援,而且单靠自己肯定挡不住城外的十字军,所以他想出了一个万全之计——答应洛林茨的要求打开城门,但只有军官和随从可以进城,剩下的士兵只能驻扎在城堡附近。洛林茨也认为这是折中之法,免得还要长期围城。
城内大臣乖乖合作,作为交换,十字军不会进城抢掠,而被他们关押的一众贵族也将一并带进城交由士师监禁。这是士师在为未来押宝,他希望国王和总督能看在他保护了这么多显贵的份上,对他的投降举动网开一面。
但他不知道,科罗日瓦的沦陷正中乔治·塞克勒之意,而且也打乱了萨普雅的计划。
作为特兰西瓦尼亚的统治者,萨普雅意识到他有责任去解放这座宝城。然而,他也敏锐地意识到这么做虽然能够让他夺回特兰西瓦尼亚的统治权,但他却可能输掉整个战争。既然他异常渴望登上匈牙利的王位宝座,那他就不会眼睁睁地看着匈牙利遭受苦难而毫不作为。而且,笑到最后才笑得最好,最后的胜利才能保证未来的国王宝座归自己。而要想取得最后的胜利,他必须先放弃特兰西瓦尼亚,把它让给洛林茨教友,然后带军去泰密斯瓦攻打乔治·多热·塞克勒的十字军。
当总督到达奥拉迪亚之时,他已经想出了一个计划。他命令克伦斯塔(Kronstadt)[7]的撒克逊人不要跟其他贵族一起来奥拉迪亚,而是把他们交给塞克勒人的领袖安德拉什·拉沙尔指挥。这个拉沙尔正是7年前莱纳德·巴拉巴西写信交付乔治·多热命运的人。按照传统团结在一起的塞克勒人和撒克逊人,再加上周围村子过来帮忙的罗马尼亚人,就这样一起被派往科罗日瓦解救困在里面的匈牙利人和撒克逊人。
萨普雅自己并未领导这支自由之师,而是将之交由副总督莱纳德·巴拉巴西指挥。这位年轻的总督眼里有更大的猎物,他带领特兰西瓦尼亚的贵族骑兵一路前往泰密斯瓦,决定跟乔治·多热·塞克勒正面对阵。
这个战术当然存在风险,因为萨普雅分散了自己的武装力量。这是一次冒险赌博,他有可能像巴赛瑞、贝贝克、萨基以及其他很多低估了十字军战斗力和决策力的人一样遭受失败。但这位27岁的总督甘愿冒这个险。
[1] 说明重复问题的最好方法就是,利用克劳德·香农(Claude Shannon)在1948年发表的那篇里程碑式的论文——奠定了信息理论基础的文献中提出的一个例证。根据熵的概念,他指出英语有50%的重复性,也就是说“hlf of th ltrs o ths txt ca be dletd and w cold stll dcipr is mnig”这段话中有一半字母可以删掉,而且我们仍能理解它的意思。不具重复性的语言指的是组成一个单词的每个字母都有意义,所以漏掉或打错其中一个字母,那个单词的意思就会完全改变,比方说walking (走)和waking(醒),或goddess(女神)和godless(无神论的)。实际中,THE在英语中有明确的意思,但THE、EHT、TEH或者ETH却没有,所以不管我们怎么拼错这个单词,它都能被理解。这就是想出一个好字谜的难点所在——如果我们在表格上横向写几个单词,那么通常纵向的字母组合就无法成为单词。——作者
[2] 瞿泽辉将地图以两平方公里为单位分割开来,每两平方公里都被视为一个单独的区域。——作者注
[3] “从4月中旬到现在,我一直在休罗格斯大学(Rutgers)的公假。”他告诉我:“所以我的工作日不那么规律。就算去学校工作,我基本上也是坐飞机去上课,上完课后就离开。所以,这是正常的。”他想了一会儿又说道:“因为那一年我其实一直在到处跑。”——作者注
[4] 当时的王国在如今大致包括匈牙利、捷克共和国、斯洛伐克以及部分塞尔维亚和斯洛文尼亚的领土。这些地方加起来共称为特兰西瓦尼亚,也就是今天的罗马尼亚。——作者注
[5] 事实上,哪怕是为了取悦皇室,萨普雅也会同意在特兰西瓦尼亚公布教皇诏书。但鼓动农民参军的任务落在了阿尔巴尤利亚主教身上。比起战争或政治,这位主教更热衷于艺术和科学,所以最终他的身边并没有多少士兵,而是成天被一群著名的人文学者包围着。比方说,有受俸牧师伊斯特凡·斯蒂尔拉塞尔,也就是4年后记录1514年战争的陶利努斯;还有执事长约翰·巴拉巴西,也就是莱纳德的侄子以及未来的乔纳德主教。由于急于维持总督对他的信任,这位主教早早就动身去了奥尔福德,但却颇合时宜地在走之前忘了将教皇的诏书交给牧师们。等他回到家时,正好赶上红衣主教正式废除了十字军,所以他干脆坐享因疏忽大意带来的政治利益,使特兰西瓦尼亚免遭匈牙利的不幸命运。——作者注
[6] 宝城科罗日瓦(Kincses Kolozsvár)不久之后就变成了这座城市的完美昵称。——作者注
[7] 克伦斯塔城现在被罗马尼亚人称为布拉索夫(Braşov),被匈牙利人称为布拉什(Brassó)。——作者注