第3链 六度分隔
研究表明,社交网络上任何一对节点之间平均相隔6个链接;任意两个网页之间平均相隔19次点击。和我们相隔六度或者十九度的不仅是我们要找的人或文档,而是所有的人或文档。没有链接,我们将无法访问网络这个巨大的数据库;没有链接,网络将变成互联世界的信息废墟。
六度分隔
六度分隔是指平均来说,社会网络中任意两个素不相识的人之间,最多只需经过六步即可建立相互联系。也就是说,最多通过六个人你就能够认识任何一个陌生人。
《链》与六度分隔的最早表述
1912年,当安娜·埃尔德什(Anna Eedös)发现她怀上了第三个孩子保罗时,在布达佩斯的街头,人们正热议着匈牙利最好的国际作家新出版的诗歌散文集。在文学评论家看到之前,第一版已经销售一空。当国内报纸上开始出现严肃评论时,第二版也很难买到了。而那时,安娜·埃尔德什已经在医院生下保罗,又回到家里。到家后,她发现两个女儿得了猩红热,这种病当时正在布达佩斯肆虐。
虽然布达佩斯当时遭受着很多磨难,但人们对新文学现象的热情却没有降温。这本书的流行源于一个小细节:所有的诗歌和短篇小说都是虚构的。在《你如此写作》(Igy irtok ti)一书中,一位没有什么名气的诗人兼作家,25岁的弗里杰什·卡林西(Frigyes Karinthy)发明了被他称为“文学漫画”的题材。他的这卷书收录了很多诗歌和短篇小说,每篇诗歌和小说看上去都好像出自世界文坛的名人之手。如果你熟悉这些作家,你很容易便能从文章的写作风格中认出他们。书中的每一篇都是诙谐的改编或模仿,就像一个哈哈镜,在改变了原作所有内容的同时,又能使人识别出被模仿的作者。无论是过世的文学巨匠,还是自己的密友,卡林西都能以刻薄而有杀伤力的幽默将其模仿得惟妙惟肖。他的评判经常是致命的,有些作家,我们只有在卡林西的书中才能看到,因为在卡林西的极力抨击下,他们的作品不可挽回地“湮没”在文学的历史长河中了。
《你如此写作》一书是匈牙利历史上最受欢迎的书之一,它使卡林西一夜成名。卡林西再也不需要在公交车站等候公交车了,无论在什么地方,只要向开过来的公交车挥一挥手,司机便会笑容满面地停在他面前。大多数时间,他都待在布达佩斯市中心的中央咖啡馆里,坐在宽大玻璃窗后面写作。路过的行人经常会有一些怪异的举动。经过窗口时,他们会突然停下来,转过身,透过窗口窥视正在创作的作家,好像他是水族箱里的外来物种一样。
1929年,《你如此写作》一书发表约二十年后,就在17岁的埃尔德什在距离中央咖啡馆几个街道的鞋店里讲述毕达哥拉斯定理时,卡林西发表了他的第46本书《万物有别》(Minden masképpen van),这本书收录了52篇短篇小说。那时候,卡林西已经是公认的匈牙利文学天才。大家都期待着卡林西能写出一部传世之作,一部能使他成为文学不朽传奇的著作。文学评论家公开表达了他们的忧虑,他们担心卡林西因忙于写那些挣钱快的短篇小说而浪费了他独一无二的天资。卡林西在咖啡馆和他嘈杂的家两边奔走,日子过得极其混乱无序。最终,他没能写出人们期待已久的巨著。短篇小说集《万物有别》是他失败的开始,很快便在书海中销声匿迹了。这本书自发表伊始就没有再版。我拜访过布达佩斯大多数书店和古董店,都没能找到这本书。但是,这本书中一篇题为《链》(Láncszemek)的小说,值得我们关注。
卡林西在《链》中写道:“为了证明如今人们之间的联系比以前更紧密了,有人提出做一个实验。他打赌,从地球上15亿人中随意挑出一个,最多通过5个相识关系,他便能和这个人取得联系。”实际情况的确如此,卡林西小说中虚构的这位人物很快就把自己和一位诺贝尔奖获得者联系了起来。他注意到,这位诺贝尔奖得主肯定认识颁发诺贝尔奖的瑞典国王古斯塔夫(Gustav),而这位国王是个资深的网球爱好者,偶尔会和一位网球冠军一起打网球,而这位网球冠军碰巧是卡林西小说中人物的好友。小说中的这位人物认为,找到和名人的联系太容易了,他要求尝试一个更困难的任务,他试图把福特工厂的一位工人和自己联系起来。
这名工人认识他们车店的经理,而经理认识福特,福特和赫斯特出版集团(Hearst Publications)的总经理很要好,这位总经理去年成为了阿尔帕德·帕斯特(Árpád Pásztor)的好友,而帕斯特不仅和我认识,更是我最要好的朋友。因此,我可以很容易地让帕斯特通过那位总经理发电报给福特,请福特和他车店的经理谈一谈,让车店的那名工人赶快帮我造一部车,因为我碰巧需要一部车。
尽管卡林西的这些短篇小说被忽视了,但他在1929年洞察到一个重要的现象:人们最短经过5个链接便能联系起来,这是我们今天所说的“六度分隔”概念的最早公开表述。
任何一对节点之间平均相隔6个链接
大约30年后,六度分隔现象才于1967年被哈佛大学教授斯坦利·米尔格拉姆(Stanley Milgram)重新发现,他把“六度分隔”转变为了一个关于人类连通性的著名的开创性研究。令人惊奇的是,米尔格拉姆关于该问题的第一篇论文,读起来就像卡林西的小说《链》的英文社会学译本。米尔格拉姆可能是实验心理学最具创造力的实践者,他因一系列饱受争议的实验而著名,这些实验探究了服从权威和个人良心间的冲突。[1]然而,他的才能是多方面的,他很快便开始对社会网络的结构产生兴趣。20世纪60年代后期,社会网络结构是哈佛和麻省理工的社会学家们经常探讨的话题。
米尔格拉姆的目标是测量美国任意两个人之间的“距离”。驱动这个实验的问题是:对于两个随机选择的个体而言,需要多少个相识关系才能把他们联系起来呢?实验开始时,米尔格拉姆先选择了两个人作为目标,一位是马萨诸塞州沙伦市一名神学研究生的妻子,另一位是波士顿的股票经纪人。他选择堪萨斯州的威奇托和内布拉斯加州的奥马哈作为研究的出发点,选择这两个城市的原因是,“对于剑桥城的人而言,他们只是模糊地知道这些城市位于中西部大平原的某个地方”。到底需要多少个链接才能把两个相距遥远的人联系起来,人们在这个问题上缺乏共识。米尔格拉姆在1969年指出:“最近,我问一位聪明的人需要多少个中间人。他认为,从内布拉斯加到沙伦,可能需要100个中间人,或者更多。”
在米尔格拉姆的实验中,需要发邮件给随机选择的威奇托和奥马哈居民,让他们参与关于美国社会联系的研究。信中有这项研究的简短介绍,除研究目的外,介绍中还包含其中一位目标人的照片、姓名、地址以及他的其他信息,同时附有下面四步操作说明:
如何参与该研究
在表单的底部署上你的名字,以便收到信的下一个人知道信从哪里寄来。
寄明信片。将明信片填好后寄回哈佛大学。不需要贴邮票。明信片非常重要,当邮包逐步寄到目标人时,明信片让我们可以跟踪邮包的进度。
如果你本人认识目标人,请直接把这个邮包寄给他。只有当你以前见过目标人,并且互相认识时才能这样做。
如果你本人不认识目标人,不要试图直接联系他。你可以把邮包(明信片和所有东西)寄给你认识的一个人,而你认为这个人比你更可能认识目标人。你可以把邮包寄给你的一位朋友、亲戚或者熟人,但必须是你非常熟悉的人。
米尔格拉姆非常担心这些信是否能够到达目标人物手中?如果真像人们猜测的那样,需要大约100个中间链接才能到达目标人物,那么实验很可能会失败,因为在如此长的链条中,总会有人不配合实验。因此,几天后,第一封信的到来成为一个巨大的惊喜,而这封信只经过了两个直接链接。后来证明,这是实验中记录的最短路径。然而,发出的160封信最终只收回了42封,有些信经过了十几个中间人。这些完成了的链条使米尔格拉姆能够判定信到达目标人物所需要的中间人数量。他发现,平均需要的中间人数量是5.5,这的确是一个非常小的数字,而且和卡林西估计的数字惊人的一致。5.5四舍五入后是6,这就是著名的“六度分隔”。
社会心理学家托马斯·布拉斯(Thomas Blass)在过去15年内致力于深入研究斯坦利·米尔格拉姆的生平和作品。他告诉我,米尔格拉姆自己从来没有使用过“六度分隔”这个说法,是约翰·格尔(John Guare)在他著名的剧本中首次使用了“六度分隔”的说法。该剧本在百老汇演出一季获得巨大成功后,被改编为同名电影。在电影中,斯托卡德·钱宁(Stockard Channing)扮演的欧莎(Ousa)在思考人们的互联性,他告诉女儿:
这个星球上每两个人之间只隔着6个人。我们和这个星球上的其他人之间都只有六度分隔。美国总统,威尼斯贡多拉船夫……不只是这些大人物,而是所有人,包括雨林中的土著,火地岛上的居民,爱斯基摩人。只需要6个人,我就能和地球上的任何一个人联系起来,这真是一个伟大的想法……每个人都是通向另外一个世界的窗口。
米尔格拉姆的研究局限于美国,他只把威奇托和奥马哈“那边”的人和波士顿“这边”的人连接起来。然而,对于格尔笔下的欧莎而言,六度分隔适用于全世界。于是,一个神话诞生了。由于看电影的人远多于读社会学论文的人,所以格尔提出的六度分隔的说法在大众中风靡起来。
链接洞察
六度分隔非常吸引人,因为它意味着,虽然人类社会非常巨大,但我们可以很容易地沿着社会链接在整个社会中航行:在一个有着60亿个节点的网络中,任意两个节点之间平均相隔6个链接。或许有人会觉得不可思议,任意两个人之间居然都存在一条路径。然而,正如我们在上一链看到的,保持连通只需要很少的链接,每个人只需要稍多于一个社会链接就足够了。由于我们每个人拥有的链接数都远远多于1个,因此,每个人都是社会的这个巨大网络的一部分。
米尔格拉姆让我们意识到这样一个事实:不仅我们相互连接着,在我们生活的世界里,任意两个人只要通过少数几次握手就能连接上。也就是说,我们生活在一个小世界里。世界之所以小,是因为社会是一张连接稠密的网。我们所拥有的朋友数比让我们保持连通所需的临界值1要大得多。然而,六度分隔是人类所独有的东西吗?是因为我们希望创建社会链接而带来的吗?还是其他类型的网络也是这样呢?这些问题的答案几年前才浮出水面。我们现在知道了,社会网络不是仅有的小世界。
任意两个网页之间平均相隔19次点击
“假设世界各地电脑里存储的信息都能够连接起来……那么,欧洲核子研究组织和全球每台电脑上最好的信息便能被人类共享。那将会出现一个全球唯一的信息空间。”
这是蒂姆·伯纳斯·李(Tim Berners-Lee)在1980年的梦想,那时候的他是一名程序员,在位于瑞士日内瓦的欧洲核子研究组织工作。为了将梦想变成现实,他编写程序让电脑相互连接起来,从而实现信息共享。李发明了超链接,这可是当时还无人知晓的小精灵。但不到十年,这个小精灵就变成了万维网(World Wide Web)——人类有史以来创造的最大的网络之一。万维网是一个虚拟网络,节点是网页,而网页包罗万象,新闻、电影、随笔、地图、图片、菜谱、传记和书籍。只要是能够写出来、画出来或拍摄出来的东西,就有机会成为万维网中以某种形式呈现出来的节点。
链接洞察
万维网的力量来自链接,即统一资源定位符(URL),它使我们能够通过点击鼠标从一个网页跳到另外一个网页。链接使我们能够进行网上冲浪、网页定位,以及把信息连接起来。这些链接把一个个文档组织成巨大的文档网络,我们通过点击鼠标便可以在文档间遨游。链接就是将现代信息社会编织在一起的针脚。如果没有链接,万维网这个精灵将不复存在了。没有链接,我们将无法访问万维网这个巨大的数据库,万维网也将变成互联世界的信息废墟。
今天的万维网到底有多大呢?万维网中到底有多少文档和链接呢?一直以来,没有人知道确切的答案,因为没有一个组织在跟踪记录万维网中所有的节点和链接。1998年,在日本电气公司设在普林斯顿的研究所工作的史蒂夫·劳伦斯(Steve Lawrence)和李·贾尔斯(Lee Giles)接受了这个巨大的挑战。他们的计算结果表明,1999年的万维网拥有接近10亿个文档——对于诞生不到10年的虚拟社会而言,这已经相当多了。鉴于万维网这个虚拟社会的增长速度比人类社会快得多,到这本书出版的时候,万维网中的文档数很可能比地球上的人数还要多。
但我们关注的真正问题不是网络的整体规模,而是任意两个文档间的距离。譬如,需要多少次点击,才能从奥马哈一名高中生的个人主页跳到波士顿股票经纪人的网页呢?万维网中有10亿个节点,那它还是“小世界”吗?对于在万维网上冲浪的每个人而言,回答这个问题都是很有必要的。如果需要数千次点击才能从一个网页跳到另一个,那么,在没有搜索引擎的情况下,找到任意一个网页几乎都是不可能的。如果我们发现万维网不是小世界,那就意味着,人类社会背后的网络和这个在线社会背后的网络在本质上是不同的。如果情况确实如此,要想完全理解网络,就需要弄清楚,这种差异为什么会出现以及是如何出现的。因此,1998年年底,我和我的博士生雷卡·阿尔伯特(Réka Albert)、博士后郑浩雄(Hawoong Jeong)一起开始着手研究万维网的规模,他们二人当时都在圣母大学物理系我的研究组里工作。
我们的第一个目标就是获取一张万维网地图。本质上来看,这张地图就是所有网页和连接它们的链接,而这张地图所包含的信息肯定是前所未有的。如果我们为人类社会也描绘一张类似的地图,这张地图将包含每个人的专业、个人兴趣,以及他认识的每个人。有了这样一张地图,米尔格拉姆的实验就显得笨拙和过时了,因为借助这张地图,我们在几秒钟内便能找出世界上任意两个人之间的最短路径。这张地图肯定会成为每个人的必备工具,无论是政治家、推销员,还是传染病学家。当然,构建这样一个社会搜索引擎是不可能,因为地球上有60亿人,想要逐个问清楚每个人的朋友和熟人信息,至少需要花费一生的时间。然而,与人类社会不同,万维网有其神奇的一面:我们可以瞬时访问每个链接,需要做的只是点击几下鼠标。
和现实社会不同,万维网是数字化的。因此,我们能够编制一个软件,用它来下载万维网上的任意文档,找出每个文档中的所有链接,然后访问和下载这些链接所指向的文档,依此类推,直到下载完所有的文档为止。如果让这样一个程序跑起来,理论上讲,它能够获得万维网的完整地图。在计算机领域,这样的程序被称为“采集机器人”或“网络爬虫”,无需人工监督,它便能通过在网络上爬行获取网络上的内容。大型搜索引擎,如AltaVista或谷歌,都有上千台电脑运行着大量的采集机器人,持续不断地寻找网络上的新文档。当然,我们的研究小组没有搜索引擎公司的实力,无法获取整个网络上的文档。于是,我们退而求其次。郑浩雄使用采集机器人收集了一个中等规模网络上的文档。该机器人访问圣母大学域名nd.edu下的所有300000个文档,绘制出相应的网络地图。这些文档涉猎广泛,既有哲学课程讲义,也有爱尔兰音乐爱好者的网站。不过,我们并不关心这些网页的内容,我们只关心网页间的链接,这些链接能告诉我们如何从一个网页跳到另外一个网页。有了这样一张网络地图,我们便能够测量出圣母大学任意两个网页间的距离了。
我们发现,网络文档间的距离存在很大的差异,这和米尔格拉姆的发现类似:一些信件只需两步便能到达目标人物,而有些信件则需要多达11步。例如,我的研究生的网页上有链接指向我的网页,因此,他们的网页和我的网页仅相隔1次点击。然而,从我的网页到一些哲学专业学生的网页通常需要20次点击。但是,令人惊奇的是,将所有的路径一起考虑,这些路径的平均长度和万维网的广袤相比显得极不相称。我们的测量表明,两个网页之间平均相隔11次点击。套用格尔的说法,我们可以说,圣母大学的网页是“十一度分隔”的。
不过,我们大学域名下的网页只是万维网的很小一部分。在1999年,整个万维网至少是我们大学网络的3000倍。这是否意味着,万维网中两个随机选择的节点之间的距离是我们测量出的11次点击的3000倍呢?换句话说,在万维网中,从一个网页到达另一个网页需要33000次点击?为了回答这个问题,我们需要一张整个万维网的地图。可问题是,没有人有这样的地图。即使是最大的搜索引擎公司,使用数千台电脑持续不断地扫描万维网,也仅能覆盖整个万维网不到15%的网页。没有这样一张完整的互联网地图,我们还能够判定出网页间的分隔程度吗?答案是肯定的。我们要用到的方法广泛应用于统计力学——物理学的一个分支,通常用于研究那些具有不可预测成分或结果的随机系统。
我们使用的方法有一个简单的前提:虽然万维网太大不能全部放到我们的电脑中,但我们可以将万维网分成很多小部分,而每个部分都可以放入我们的电脑中。例如,选择万维网的一小部分,只包含1000个节点,计算任意两个节点间的间隔。再选择一个稍微大一点的部分,包含10000个节点,再计算任意两个节点间的间隔。我们逐步增大选择的网络,计算节点间的间隔,直到我们的电脑能够处理的极限。然后,我们分析节点间隔随网络大小增加的变化趋势。
链接洞察
结果表明,节点间隔的增加比节点数量的增加慢得多,遵循着简单反复的表达式。[2]这时我们只需要知道网络中文档的数目便能预测出网络的节点间隔。日本电气公司提供了网络文档总数,他们估计,到1998年年底,网络上公开索引的节点总数为8亿。因此,利用我们得到的表达式,可以算出网络的直径为18.59,近似为19。按照格尔的说法,就是十九度分隔。虽然在网络冲浪时可能会有不同的感觉,但实际上,万维网仍然是一个小世界。任意两个文档之间仅相隔19次点击。
对数让大网络缩小了
综合来看,米尔格拉姆的六度分隔和万维网的十九度分隔表明,网络中节点间距离很短的背后,存在着某种比人类希望在全球都能形成社会链接更为根本的东西。这种猜测被随后的发现证实了。科学家发现,在他们有可能研究的所有网络中,节点间隔都很小。
食物链网络中,物种间的平均间隔只有两个链接;
细胞中,分子间的平均间隔是3个化学反应;
科学家合作网络中,不同领域的科学家之间的间隔是4到6个合作链接;
线虫(C.elegans)的大脑中,神经元之间的间隔是14个突触。
实际上,万维网的十九度分隔已经是最大的了,到目前为止,其他研究过的网络中,节点间隔介于2和14之间。
十九度看上去要比六度大很多。然而,事实并非如此。更重要的是,拥有数亿或数十亿节点的大型网络似乎塌缩了,和小规模网络相比,节点间隔比节点数目要小得更多。我们的社会拥有60亿个节点,节点间隔为6。万维网有接近10亿个节点,节点间隔为19。由数十万路由器构成的互联网,节点间隔为10。从这个角度来看,6和19之间的差别微乎其微。
人们自然会问,这是为什么呢?为什么这些拥有数十亿节点的网络节点间隔如此之小呢?答案是,这些网络都具有高度互联的特性。在前面的章节里我们看到,在随机网络中,每个节点只需要一个链接,便能形成一个巨大的节点簇。问题是,如果像真实网络经常发生的那样,每个节点拥有的链接数远多于一个,将会是什么样呢?当每个节点的平均链接数达到临界点1时,节点间隔可能非常大。但是,随着我们添加更多的链接,节点间的间隔骤然下降。我们考虑一个每个节点平均拥有k个链接的网络。这意味着,从一个典型的节点来看,经过1步可以到达k个节点。和该节点间隔为2的节点数为k2个,距离为d的节点数为kd个。因此,如果k足够大,即使d的值非常小,从一个典型的节点出发,经过不超过d步就能够到达的节点数目也将变得非常大。仅仅需要很少几步,就能到达几乎所有节点,这就是大多数网络的平均间隔如此之小的原因。
上述论断可以很容易地转化为数学公式,该公式使用关于节点数目的函数来预测随机网络的节点间隔。[3]网络间隔之所以小,和公式中出现的对数项有关。事实上,即使是非常大的数,其对数也非常小。以10为底,10亿的对数仅为9。例如,如果我们有两个网络,节点平均链接数均为10,而其中一个网络的规模是另一个的100倍,那么,较大网络的节点间隔仅比较小网络的节点间隔大2。对数让大型网络变小了,在我们身边形成很多小世界。
卡林西与米尔格拉姆的六度分隔
卡林西是他那代人中最健忘的人之一,他以经常忘记事先安排好的会议而出名。卡林西的密友兼文学对手德佐·克斯特兰西(Dezsö Kosztolányi)曾这样评价他:“我得跑步回家了,因为卡林西说他要到我家来做客。或许他已经忘了自己说过这话,那他反倒一定会来。”有趣的是,六度分隔似乎遵循着卡林西的风格:被忘记,被重新表达,最后被大众媒体和科学界重现发现。我不知道到底是谁最早提出了六度分隔的概念。据我所知,最早的文字记载来自卡林西。而他又是从哪里得知这个概念的呢?是他自己想出来的吗?鉴于他拥有独一无二的智慧,并热衷于新奇和古怪的想法,如果说是六度分隔是他自己想出来的,一点也不奇怪。但也有可能,就像他在小说里说的那样,他是在咖啡馆里从别人那听说的。我们或许永远也不知道确切的答案,然而,探究该事情的后续影响却是一件有趣的事。
卡林西的短篇小说发表于1929年,当时同样生活在布达佩斯的埃尔德什17岁。卡林西发表新书,哪怕是败笔,在当时也是一件重要的文学事件。因此,埃尔德什很可能读过或听说过卡林西的短篇小说《链》。在这篇小说中,卡林西猜测,地球上的所有人可以通过5个熟人关系连接起来。同样,我们可以进一步猜测,阿尔弗雷德·莱利也可能读过或听说过这篇小说。虽然小说《链》发表时他只有9岁,但他对文学情有独钟。事实上,他和很多作家都是好朋友,包括卡林西的儿子,知名作家弗伦克(Ferenc)。
1959年,埃尔德什开始和阿尔弗雷德·莱利合作,一起写出了他们关于随机网络的八篇著名的系列论文。这些论文中包含了网络直径和网络节点数量之间的函数表达式。他们二人中如果有人稍微注意一下,就能很容易地发现,卡林西的直觉是正确的。大量的社会链接,让巨大无比的网络变成了真正的小世界。然而,他们在论文中从未使用过他们发现的表达式去解释卡林西的直觉,我们或许永远也无法得知,他们在讨论证明和定理的间隙,是否曾经去解释过卡林西的直觉,并以此为乐。但是,故事并未就此结束。1967年,米尔格拉姆发表了他的实验结果,揭示了人和人之间平均只有5.5个链接。此时距卡林西5个链接的猜测已经过了40年,离埃尔德什和莱利提出随机网络理论也过了将近10年了。米尔格拉姆似乎根本不知道图论中关于网络的大量研究工作,而且很可能没有听说过埃尔德什和莱利。人们普遍认为,他受到麻省理工学院的艾思尔·德索莱·普尔(Ithel de Sole Pool)和IBM的曼弗雷德·科臣(Manfred Kochen)的影响。这二人就小世界问题撰写的稿件几十年来一直在同事间流传,却一直没有发表,因为他们觉得自己还没有搞清楚这个问题的关键。碰巧的是,米尔格拉姆的父亲是匈牙利人,母亲是罗马尼亚人,他们移民美国后居住在布朗克斯。他父亲,或是经常来他家做客的叔伯们,是否曾经听说过哪怕经过演绎的卡林西五度分隔之说呢?他对该问题的真正兴趣是否根源于他童年时期偶尔听说过的故事?对于此,我们可能永远也无从知晓了,但是这一定暗示着六度分隔之说的某种有趣的演化路径。
六度,社会间隔的上限
六度分隔和十九度分隔的说法有很强的误导性,因为这会让人们产生误解,认为在小世界里找到所需要的东西是很容易的。然而,事实并非如此。和我们相隔六个或者十九个链接的不仅是我们要找的人或文档,而是所有的人或文档。换句话说,数字6(或10,或19)既可能是一个非常小的数,也可能是一个非常大的数,这取决于你打算做什么。
由于每个网页平均包含约7个链接,这意味着从第一个页面出发,经过一次点击我们只能到达7个网页,而点击两个链接后,我们可以到达的网页有49个,三次点击后可以到达的网页有343个,依此类推。当我们到达相隔19个链接的节点时,理论上我们已经浏览过的网页多达1016个,比万维网上的网页总数还要多1000万倍。这个矛盾很容易解释:我们在浏览时碰到的链接,其中有一部是指向我们已经浏览过的网页的,因此,它们不再是“新”链接。即使浏览一个文档只需1秒钟,到达19个链接外的所有网页,我们需要花费3亿年。然而,虽然有如此多的选择,即便不使用搜索引擎,我们有时候仍然能非常快速地找到所需的文档。
这里的奥妙当然就是不去遍历所有的链接。我们使用一些线索信息来选择合适的链接。譬如,在寻找有关毕加索的信息时,如果网页上有三个可供选择的链接,我们会倾向于选择关于现代艺术的链接,而不是选择有关某个著名摔跤手或者青蛙王子的爱情故事的链接。通过解读链接的含义,我们无需检查19度之内的所有网页,通过少数几次点击便能找到所需的网页。这个方法看似是最高效的,然而,使用该方法几乎总是无法找到最短的路径。为了寻找与毕加索相关的信息,我们解读链接时会略过摔跤手的个人主页。然而,摔跤手很可能为了平衡其硬汉形象,在其个人主页上放一个链接指向有关毕加索的网页。实际上,大多数人在寻找毕加索的信息时都会忽略指向摔跤手网页的链接,因此会选择更长的路径。相比之下,电脑没有个人品位和偏好,摔跤手、现代艺术和青蛙王子的爱情故事对其而言没有分别,它会逐一检查所有链接。不考虑网页的内容,而是检查所有可能的路径,因此,电脑最终总能找出最短的路径。
在万维网上寻找毕加索的例子凸显了六度分隔的一个根本问题:米尔格拉姆的方法高估了美国任意两人之间的最短距离。六度实际上是一个上限。任意两个人之间,存在大量长短不一的路径。米尔格拉姆的实验对象根本不知道到达目标对象的最短路径。就如同迷失在巨大的迷宫中,我们只能看到眼前的走廊和门。即便我们有指南针,并且知道出口在北方,找到出口也是非常低效并且耗时的。但如果我们手头有迷宫的地图,情况就大不一样了,可能只需要5分钟就能走出去。类似地,如果米尔格拉姆实验的参与者们手上有美国所有人的社会关系地图,那么信件便能经过奥马哈和波士顿之间的最短路径到达目的地。但由于没有这样的地图,所以他们只好将信件送到他们认为最有可能将信件送达目的地的人。
例如,如果你想找人将你介绍给美国总统,你可能会尝试联系那些认识总统的人。你最有可能找的人是参议员或众议员。由于大多数人并不认识参议员,我们可能会尝试找一些认识参议员并愿意介绍我们认识参议员的人,最终将我们介绍给总统。这中间至少要经过三次介绍。此时,你可能想不到,在前几天的一次晚宴上,坐在你身边的那个人就是总统的同学。实际上,你和总统之间仅相隔两度。
与此类似,米尔格拉姆的实验中记录的路径很可能都不是最短路径。因此,真正的社会间隔程度显然被高估了。实际间隔程度肯定小于6,或许比卡林西估计的5还要小。鉴于不存在人类社会的搜索引擎,我们可能永远也无法完全弄清楚社会间隔的真实程度。
“小世界”,网络的普遍性质
六度分隔是现代社会的产物——是人类乐于进行社会交际的结果。同时,六度分隔还得益于人类发明创造的能力,譬如,跨越数千里的远距离通信技术。我们逐渐习惯的地球村,对人类而言是新事物。大多数美国人的祖先和他们祖国的亲人失去了联系。无论是生活在放牧牛群的大草原上,还是生活在拥有金矿的落基山,美国人的祖先们都不可能和远隔大洋和大陆的亲人们保持联系。既没有明信片,也没有电话,当时的社会网络是脆弱的。人们移居他乡后,一些社会链接就会中断,很难再重新连上。这样的状况在20世纪发生了改变。邮政系统、电话以及航空系统消除了通信壁垒,缩短了人们之间的物理距离。如今,移居美国的人可以继续和祖国的亲朋好友保持联系。我们能够而且也确实在保持联系。虽然我的亲戚和朋友远在韩国和东欧,但我依然能和他们保持联系。在20世纪,世界不可逆转地塌缩成小世界。而且,我们现在还在经历着另一次通信变革,互联网到达了世界的每一个角落。虽然万维网上的任意两个文档相隔19次点击,社会网络中的我们却仅相隔1步。自上次见面后,我们可能已经换了5次工作和3座城市,但是,无论在哪里,只要我们愿意,总能通过互联网取得联系。一百年前容易消失的社会链接现在可以保持很长时间,因此,世界大大缩小了。每个人可以保持的社会链接数大幅度增加了,从而降低了人与人之间的间隔程度。米尔格拉姆估计是6,卡林西认为是5,现在可能已经减小到了3。
链接洞察
“小世界”是所有网络的普遍性质。间隔小既不是人类社会的神话,也不是万维网独有的特征。实际上,大多数网络都具有这样的性质。这源于网络的结构:仅仅需要经过很少的链接便能到达大量的网页或人。这样的小世界和我们熟悉的欧几里得空间[4]有很大的不同。在欧几里得空间里,距离以里程来度量。但现在,人和人之间的社会交际和他们之间的物理距离越来越不相干。我们和完全陌生的人拥有共同的熟人,这一现象一再表明,我们和地球另一边的某个人之间的社会关系,可能比和隔壁邻居的社会关系还要近。
在这样一个非欧几里得空间里漫游时,我们会不断感到,为了理解身边的复杂世界,我们必须掌握这一世界里的新几何学。
[1] 米尔格拉姆是美国著名社会心理学家,关于他的更多实验介绍可参阅《电醒人心》,该书简体中文版由湛庐文化策划,中国人民大学出版社出版。——编者注
[2] 我们发现,节点间间隔和网络中节点个数的对数成正比。也就是说,如果我们用d表示节点间的平均间隔,对于有N个网页的万维网而言,节点间隔遵循方程d=0.35+2logN,这里logN表示N以10为底的对数。
[3] 如果网络中有N个节点,kd的值肯定不会超过N。因此,让kd=N,我们得到了一个能够很好适用于随机网络的简单公式。该公式告诉我们,随机网络中平均间隔遵循公式d=log N/log k。
[4] 欧几里得空间,简称欧式空间,在数学中是对欧几里得所研究的二维和三维空间的一般化。这个一般化把他对于距离,以及相关概念长度和角,转换成任意数维的坐标系。——编者注