注释
第1链 网络让世界变得不同
媒体就MafiaBoy的故事进行了广泛讨论。具体内容参见http://www.Mafiaboy.com/.“是的,我听见了!”的说法源于C.Taylor,“Behind the Hack Attack,”Time Magazine(February 21,2000)。
很多书籍和专著对保罗的一生及其在基督教传播过程中发挥的作用进行了探讨。例如,C.J.Den Heyer,Paul:A Man of Two Worlds(Harrisburg,Penn.:Trinity Press International,1998)and Robert Jewlett,A Chronology of Paul's Life (Philadelphia:Fortress Press,1979)。
复杂性科学是一个方兴未艾的科学领域,其目标在于理解具有数百万个不同组成部分的系统是如何运行的,理解有序是如何通过自组织法则从混沌和随机中涌现出来的。复杂性科学的研究涉及几十个学科,范围从数学和物理学到生态和商业。研究这一学科的图书包括Murray Gell-Mann's The Quark and the Jaguar:Adventures in the Simple and the Complex(New York:W.H.Freeman,1995);Hidden Order:How Adaptation Builds Complexity (Cambridge,Mass.:Perseus,1996);Ricard V.Solé and Brian Goodwin's Signs of Life:How Complexity Pervades Biology(New York:Basic Books,2001);Yaneer Bar-Yam,Dynamics of Complex Systems (Cambridge,Mass.:Perseus,1997)。
第2链 随机宇宙
介绍欧拉生平事迹的著作很多,最近的著作包括:Willam Durham,Euler:The Master of Us All(Washington,D.C.:Mathematical Association of America,1999)。
欧拉在圣彼得堡的生活非常动荡。在那里,他失去了陪伴他30年的妻子。三年后,他与妻子同父异母的妹妹结了婚。一场大火烧毁了他的房子以及他所有的书籍和笔记。多亏一个勇敢的瑞士同胞冲进大火,将这位杰出的科学家背了出来。
欧拉的著作非常清新明晰。他对其研究主题的热情,在数世纪之后仍能引起人们的共鸣。现在的学术著作对于外行而言越来越艰涩难懂,而欧拉论文的语言则简练易懂,令人称羡。受普鲁士国王弗雷德里克的邀请,欧拉在柏林生活了大约25年。在此期间,他应邀为国王的侄女安哈特·笛所(Anhalt Dessau)公主讲授自然科学。欧拉为完成该工作,写就了400页的巨著“Letters of Euler on Different Subjects in Natural Philosophy,Addressed to a German Princess”。该书涉及科学的几乎所有领域,从月球引力到精神本质都有探讨。这本书很快成为了国际畅销书,这是工作在科学领域前沿的学者编写科普作品的最佳范例。参见Leonhard Euler,Letters of Euler on Different Subjects in Natural Philosophy Addressed to a German Princess(New York:Arno Press,1975)。
欧拉的著作集名为Opera Omnia(Basel,Switzerland:Birkhiiuser Verlag AG,1913)。尽管这部作品在1911年就开始编纂,并已经出版72卷,但该作品仍未最终完成。
关于早期的图论,以及它出现的历史背景的重要文章都收录在Graph Theory:1736-1936,by Norman L.Biggs,E.Keith Lloyd and Robin J.Wilson(Oxford,England:Clanderon Press,1976)。这本书还收录了欧拉对于哥尼斯堡七桥问题的讨论。
我们来仔细地看看欧拉的证明。以节点D为例,D表示的陆地连接着三座桥,即e,f和g。一个人如果想要通过这3座桥各一次,至少需要经过节点D两次。例如,他可以经过桥f到达D,通过桥e离开,然后再通过g回来。问题是他无法再离开了,因为已经没有未曾走过的桥了。因此,D要么是旅途的起点,要么是旅途的终点。但是,这不是节点D所独有的性质:很容易就能验证,拥有奇数条链接的所有节点都具有该性质。也就是说,想要访问所有节点的人,必须从这样的节点出发并且以这样的节点结束。节点A、B、C和D都具有这种性质,因为它们拥有的链接数都是3。这意味着,A、B、C和D都必须是旅程的起点或终点。
例如,可以追溯到1852年的四色问题,该问题在1976年之前一直未被证明。该问题表面上看非常简单:证明任何地图都可以使用四种颜色来着色,且保证没有两个邻国具有同样的颜色。任何人只要尝试一下对地图着色,就会很容易相信,四种颜色的确足够了。然而,这个问题的证明困扰了数学家一个多世纪,它是第一个借助计算机被证明的定理。
埃尔德什的生平有很多故事。本章引言部分的故事来自安德拉斯·瓦伊森(András Vátzsonyi),他就是鞋店里那位14岁的男孩,后来成为匈牙利当时第二年轻的数学博士(仅次于埃尔德什),是埃尔德什一生的朋友。参见Fan Clung and Ron Graham,“Erdös on Graphs:His Legacy and Unsolved Problems(Wellesley,Mass.:A.K.Peters,1998)。如果想更多地了解埃尔德什,可参考他的传记Paul Hoffman,The Man Who Loved Only Numbers (New York:Hyperion,1998)and Bruce Schechter My Brain Is Open (New York:Touchstone,1998).还可以参见 András Hajnal and Vera T.Sós, Paul Erdös Is Seventy,Journal of Graph Theory 7(1983):391-393。
埃尔德什和莱利的8篇论文建立了随机图论。这8篇论文收录在 Michal Karonski and Adrzej Rucinski,“The Origins of the Theory of Random Graphs”,in The Mathematics of Paul Erdös,ed.R.L.Graham and J.Nesetril(Berlin:Springer,1997)。这些论文包括:“On Random Graphs I”,Math.Debrecen vol.6,290-297(1959);“On the Evolution of Random Graphs,”Publ.Math.Inst.Hung.Acad.Sci 5(1960):17-61;“On the Evolution of Random Graphs,”Bull.Inst.Internat.Statist 38(1961):343-347;“On the Strength of Connectedness of a Random Graph,”Acta Math.Acad.Sci.Hungar 12(1961):261-267;“Asymmetric Graphs,”Acta Math.Acad.Sci.Hungary 14(I963):295-315;“On Random Matrices,”Publ.Math.Inst.Hung.Acad.Sci 8(1964):455-461;“On the Existence of a Factor of Degree One of a Connected Random Graph,”Acta Math.Acad.Sci.Hungary 17(1966):359-368;“On Random Matrices II,”Studia Sci.Math.Hung 13(1968):459-464。
注意,埃尔德什和莱利,以及大多数数学家可能都不知道,在埃尔德什-莱利的经典模型提出的10年前,随机网络的概念已由雷·索洛莫洛夫(Ray Solomonoff)和阿纳托·普拉波特(Anatol Rapoport)提出。见“Connectivity of Random Nets,”Bulletin of Mathematical Biophysics,13(1951):107-227。该论文还推导出了经典的结论:当平均度达到1的时候,网络中会出现一个巨大的节点簇。有趣的是,该成果也往往被归功于埃尔德什和莱利。很难解释为什么该论文一直未被人们当作埃尔德什和莱利研究工作的先驱。或许,埃尔德什的证明非常之美,能够吸引数学家的注意,而索洛莫洛夫和普拉波特的启发式推导缺乏这种数学之美。
国际出版物中对于莱利生平的介绍并不多。想要了解他在数学领域的成就,可以参见在他去世后在匈牙利发表的一系列文章:Matematikai Lapok 3-4(1970):Turáin Pál,“Rényi Alfred Munkássága,”199-210;Révész pál,“Rényi Alfréd Valószinüségszámitási munkássága,”211-231;Csiszár Imre,“Rényi Alfréd informáióelméleti munkássága,”233-241;Katona Gyula and Tusnfidy Gabor,“Rényi Alfréd pedagógiai munkássága,243-244;B.Mészáros Vilma,“Guibus Vivere est Cogitate,”245-248。人们为了纪念他,将匈牙利布达佩斯科学院数学研究所命名为阿尔弗雷德·莱利数学研究所。
阿诺德·罗斯虽然未能说服埃尔德什加入圣母大学的教职队伍,但他本人依然是成绩卓著的科学教育家。他创立了罗斯计划,这是为有天分的高中生和教师集中开设的暑期数学培训课程。罗斯于1947年在圣母大学启动了这一计划,后来于1964年移到了俄亥俄州立大学,该计划每年夏天进行一次。参见文献Allyn Jackson,“Interview with Arnold Ross,”Notices of the American Mathematics Society 48,no.7(August 2001):691-697。
随机图的度分布已经由贝拉·伯罗巴斯推导出来,参见“Degree Sequences of Random Graphs,”Discrete Mathematics volume 33,pg.1(1981)。
回顾起来,很难说埃尔德什和莱利的研究工作在多大程度上是受研究互连世界的渴望鼓舞,又在多大程度上是受该问题所表现出的数学之美吸引。在1959年发表的开创性论文中,他们的确提到了该研究的潜在应用:“通过思考更复杂结构的随机生长……人们能够获得更复杂的真实生长过程的合理模型(例如,复杂通信系统的生长,该系统包括多种不同类型的连接,甚至包括有机物的组织结构)。”但是,除了对未来的超常洞察力之外,可以很公正地说,他们在该领域的工作源于他们对该问题的数学深度有着很深的好奇,而不是受该问题的应用驱动的。
随着我们继续深入研究互连世界,埃尔德什和莱利的随机网络理论会经常作为我们的参照点。沿着这样的线路,我们不可避免地会时不时地将其与真实世界进行对比。然而,该模型的缺点丝毫不会降低我们对于埃尔德什和莱利里程碑式工作的景仰。我们时不时的批评主要是针对我们自己,作为他们的追随者,我们几十年来竟然不加辨识地将他们描绘的随机世界观应用到真实世界中。
第3链 六度分隔
在匈牙利有大量的书籍是关于卡林西的作品和生平的。参见The in memoriam volume Karinthy Frigyes,A humor a teljes igazság,ed.Mátyás Domokos,(Budapest:Nap Kiadó,1998),这是卡林西的朋友和同事(他们大多是作家)所写的关于卡林西的故事集。关于卡林西的书籍还可以参见 Dolinszky Miklós,Szószerint(A Karinthy Passió),(Budapest:Magvetö,2001),and Levendel Júlia,Így élt Karinthy Frigyes(Budapest:Móra Könyvkiadó,1979)。
Frigyes Karinthy,“Láincszemek,”in Minden másképpen van(Budapest:Atheneum Irodai es Nyomdai R.-T.Kiadása,1929),85-90.我要感谢Tibor Braun,他不仅让我注意到了这篇小说,还在1999年将文章寄给了我。当时,我们刚刚完成了万维网十九度分隔的研究,匈牙利媒体对我们的研究进行了报道。据我所知,这篇小说并没有英文译本。卡林西的短篇小说集的英文译本参见文献Frigyes Karinthy,Grave and Gay(Budapest:Korvina Kiadó,1973)。
六度分隔的另一个早期表述,参见Jane Jacobs's The Death and Life of American Cities(New York:Random House,1961)。这部书是迄今为止关于城市规划最重要的著作之一,掀起了老式居住社区的复兴。在这本书中,她回忆道:“当我和姐姐从一个小城市第一次来到纽约时,我们俩常常玩一种叫做‘传话’的游戏。游戏的玩法是,随便选两个非常不一样的人——比如一个是所罗门群岛上的土著猎人头领,另外一个是伊利诺伊州洛克群岛上的皮匠,假设其中一个人要传话给另一个人,然后,我们各自心里默默想出一连串可行的人,至少也得是可能的人,通过他们将话传出去。谁想出的路径上人数最少,谁就获得了胜利。”
米尔格拉姆的六度分隔研究发表在好几个地方,例如:Stanley Milgram,“The Small World Problem,”Physiology Today 2(1967):60-67.他关于肥胖的研究工作,也是他本人最喜欢的。参见Stanley Milgram,From Obedience to Authority(New York:Harper and Row,1969)。
想更多地了解米尔格拉姆的生平事迹,请参见Thomas Blass,“The Social Psychology of Stanley Milgram,”in Advances in Experimental Social Psychology,ed.M.P.Zanna(San Diego:Academic Press,1992),25:277-328,and Thomas Blass,ed.,Obedience to Authority:Current Perspectives on the Milgram Paradigm(Mahwah,N.J.:Lawrence Erlbaum,2000)。更多信息和文章链接参见http://www.stanley milgram.com。
值得注意的是,米尔格拉姆得出“六度分隔”结论时所使用的方法,最近受到了朱迪斯·克兰菲尔德(Judith S.Kleinfeld)的质疑。她检查了米尔格拉姆的论文和笔记,并检查了耶鲁档案馆保留的那些邮件到达目的地的路径。特别是,最近的研究表明,我们所处的世界被阶级和种族深深隔开,使我们很难跨越这些社会壁垒。参见Judith S.Kleinfeld,“The Small World Problem,”Society 39(January-February,2002):61-66 and“Six Degrees of Separation:An Urban Myth,”Psychology Today(forthcoming in 2002)。
在技术方面,我们已经知道,米尔格拉姆关于我们社会连通性的研究工作受到了安娜托尔·兰普鲍特(Anator Rapaport)研究工作的启发。后者是俄罗斯出生的数学家和音乐会钢琴家,他发表过一些关于社会网络的开创性论文。他独立提出了随机图的概念,对社会学有着巨大的影响。他最出名的论文包括:R.Solomonoff and A.Rapaport,“Connectivity of Random Nets,”Bulletin of Mathematical Biophysics 13(1951):107-117;and A.Rapaport,“Contribution to the Theory of Random and Biased Nets,”Bulletin of Mathematical Biophysics 19(1957):257-277。
参见John Guare,Six Degrees of Separation(New York:Random House,1990)。
想要了解万维网的创建者讲述的万维网早期的故事,参见Tim Bemers-Lee with Mark Fischetti,Weaving the Web:The Original Design and Ultimate Destin5 of the World Wide Web by Its Inventor(San Francisco:Harper,1999)。
关于万维网大小的文章,参见Steve Lawrence and C.Lee Giles,“Searching the World Wide Web,”Science 280(1998):98-100;and“Accessibility of Information on the Web,”Nature 400(1999):107-109。还可以参见第12链中的详细内容。
万维网十九度分隔的研究参见R.Albert,H.Jeong,and A.-L.Barabátsi,“Diameter of the World Wide Web,”Nature 401(1999):130-131。我们用来测量万维网直径的方法,在科学文献中被称为“有限尺寸标度”。
想了解食物链的分隔度数,参见Richard J.Williams,Neo D.Martinez,Eric L.Berlow,Jennifer A.Dunne and Albert-László Barabási,Two Degrees of Separation in Complex Food Webs,http://www,santafe.edu/sfi/publicatons/Abstracts/ 01-07-036 abs.html;José M.Montoya and Ricard V.Solé,Small World Patterns in Food Webs,http:// www,santafe.edu/sfi/publications/Abstracts/00-10-059abs.html。
想了解细胞内部的分隔度数,参见第13链的内容以及Hawoong Jeong,Báilint Tombor,Réka Albert,Zoltán N.Oltvai和Albert-László Barabási,“The Large-Scale Organization of Metabolic Networks,”Nature 407(2000):651;Hawoong Jeong,Sean Mason,Albert-László Barabási,and Zoltán N.Oltvai,“Centrality and Lethality of Protein Networks,”Nature 411(2001):41-42;Andreas Wagner and David Fell,The Small World Inside Large Metabolic Networks,Proceedings of the Royal Society of London,Series B-Biological Sciences,vol.268(Sept.7,2001):1803-1810.想要了解科学家网络及科学家网络内部的小世界,参见 A.-L.Barabási,H.Jeong,E.Ravasz,Z.Ntda,T.Vicsek and A.Schubert,Evolution of the Social Network of Scientific Collaborations,http://xxx.lanl.gov/abs/condmat/0104162(forthcoming in 2002);M.E.J.Newman,Who is the Best Connected Scientist?A Study of Scientific Coauthorship Networks,http://www.santafe.edu/sfi/publications/Abstracts/00-12-064abs.html;M.E.J.Newman,The Structure of Scientific Collaboration Networks,Proceedings of the National Academy of Sciences of the United States of America,vol.98,(Jan.16,2001):404-409.想了解神经细胞网络的小世界,参见D.J.Watts and S.H.Strogatz,“Collective Dynamics of ‘small-World’ Networks,”Nature 393(1998):440-442。
可以在两个熟悉的网络上检验我们所做的简单预言,这两个网络是社会网络和万维网。对于社会网络,我们需要知道一个人平均会认识多少人。这看上去很容易计算,然而社会学家却不这么认为,他们估计的值从200到5000不等。由数学家变成社会学家的哥伦比亚大学的邓肯·瓦茨最近告诉我,找到正确的答案之所以复杂,是因为定义“熟人”很困难:我可能知道几千个人的名字,但是当我去他们所在的城市时会打电话给他们吗?我会找他们帮忙吗?我信赖他们吗?为了解决这个问题,我们假设一个普通人大约有1 000个熟人,这里的熟人是指彼此可以直呼其名,这介于最保守估计和最乐观估计之间。地球上有60亿人,我们的公式告诉我们,人类社会的分隔度接近3。对于拥有10亿个文档且平均度为7的万维网,应用同样的公式得出的分隔度为10。这两个预测都偏低了,但是距离正确答案(分别为6和19)并不远。这个数学公式只依赖于节点数的量级,和其他东西都无关,所以我们通常会得到比较小的分隔度。
和“正确”答案的偏离正好体现了本书的基本假设:真实网络不是随机的。如果万维网是随机的,由于其连通度和规模都是清楚的,其分隔度会非常接近随机网络公式所预言的10。自然界中的许多其他真实网络的规模和连通度都非常明确,因此在万维网上的结论对于这些网络也成立。公式所预言的分隔度与真实的分隔度很少能对得上,这意味着我们互联的世界背后隐藏着某种秩序。关于小世界网络的详细介绍,特别是基于随机网络预言的分隔度和真实的分隔度之间的差异,参见R.Albert and A.-L.Barabási,“Statistical Mechanics of Complex Networks,”Reviews of Modern Physics 74(January 2002):47-97。
要了解科赫(Kochen)关于小世界历史的笔记,参见Manfred Kochen,preface to The Small World,ed.Manfred Kochen(Norwood,N.J.:Ablex,1989)。
要了解小世界适航性的讨论,参见J.M.Kleinberg,“Navigation in a Small World-It Is Easier to Find Short Chains Between Points in Some Networks Than Others,”Nature 406(August 2000):845。
注意,也有人认为米尔格拉姆的工作低估了人们之间的分隔程度,因为他没有考虑那些不完整的链条。实际上,如果一封邮件最终未能送到目标人物手中,该邮件会被忽略。在内布拉斯加的实验里,160封邮件中只有42封到达了目标,样本中很明显缺少占多数的较长链条。而较长的链条更有可能无法到达目标,因此,米尔格拉姆所研究的样本偏向于较短的路径。
第4链 小世界
有关社会聚集的最初发现,发表在Mark S.Granovetter,“The Strength of Weak Ties,”American Journal of Sociology 78,(1973)1360-1380。在这篇论文被提名为“引用经典”时,格兰诺维特对这篇论文的传奇故事进行了回忆,发表在Current Contents(Sociology and Behavioral Sciences Edition,vol.18,no.49 [Dec.1986]:24)。还可参见“The Strength of Weak Ties:A Network Theory Revisited,”Sociological Theory 1(1983):201-233;Mark S.Granovetter,Getting a Job(Cambridge,Mass.:Harvard University Press,1994)。
有节奏的鼓掌作为同步的一种表现形式,在物理文献中受到了广泛研究。最早的详细研究参见Z.Néda,E.Ravasz,Y.Brechet,T.Vicsek,and A.-L.Barabási,“Self-Organizing Processes:The Sound of Many Hands Clapping,”Nature 403(2000):849-850。更多详细的介绍参见Z.Néda,E.Ravasz,T.Vicsek,Y.Brechet,and A.-L.Barabási,“Physics of the Rhythmic Applause,”Physical Review E 61,no.6(2000):6987-6992。关于该研究工作的通俗介绍参见Henry Fountain,“Making Order Out of Chaos When a Crowd Goes Wild,”New York Times,March 7,2000和Josie Glausiusz,“Joining Hands,”Discover 21(July 2000)。
John Buck and Elisabeth Buck,“Synchronous Fireflies,”Scientific American,May 1976,74-85。关于同步的最近书籍,参见Arkady Pikovsky,Michael Rosenblum,and J.Kurths,Synchronization:A Universal Concept in Nonlinear Sciences(Cambridge,England:Cambridge University Press,2001)。也可参见Ian Stewart and Steven H.Strogatz,“Coupled Oscillators and Biological Synchronization,”Scientific American,Dec.1993,68。
有关瓦茨和斯托加茨的发现,其背后的故事参见Duncan J.Watts,Small Worlds(Princeton,N.J.:Princeton University Press,1999)。
是网络问题使邓肯·瓦茨的注意力偏离了同步问题,很多研究人员开始重新探讨网络和同步之间的关系。参见J.Jast and N.P.Jog,“Spectral Properties and Synchronisation in Coupled Map Lattices,”Physical Review,E 65(2002):016201;X.F.Wang and G.R.Chen,“Synchronisation in a Scale-Free Dynamical Network:Robustness and Fragility,”IEEE Transaction on Circuits and Systems I 49(2002):54-62;M.Barahona and L.M.Pecora,“Synchronisation in Small-World Systems,”http://xxx.lanl.goviabsinlin.CD/0112023;J.Ito and K.Kaneko,“Spontaneous Structure Formation in a Network of Chaotic Units with Variable Connection Strengths,”Physical Review Letters,88(2002):02801。
“聚团系数”一词是由瓦茨和斯托加茨最早使用的,参见D.J.Watts and S.H.Strogatz,“Collective Dynamics of ‘Small-World’ Networks,”Nature 393(1998):440-442。同样的量在社会学文献中被称为“传递三元组的比例”,参见The now classic S.Wasserman and K.Faust,Social Network Analysis:Methods and Applications(Cambridge,England:Cambridge University Press,1994),598-602。
有关埃尔德什数的广泛讨论,参见由Jerrold W.Grossman维护的埃尔德什网站:http://www.oakland.edu/-grossman.erdoshp.html。一些著名科学家的埃尔德什数,参见Rodrigo De Castron and Jerrold W.Grossman,“Famous trails to Paul Erdös,”Mathematical InteUigencer,21(Summer 1999):51-63。
注意,在非常活跃的物理子领域——粒子物理中,数百名物理学家分散在多块大陆,彼此之间通常互不交流,却共同为某些基本粒子的发现做出贡献。因此,对他们而言,合作撰写论文并不能作为他们彼此认识或者有社会交往的证明。不过,在大多数研究领域中,如此大规模的合作只是例外。
我们关于数学家和神经学家合作网络的研究工作的概述参见A.-L.Barabási,H.Jeong,R.Ravasz,Z.Néda,T.Vicsek,and A.Schubert,On the Topology of Scientific Collaboration Networks,http://xxx.lanl.gov/abs/condmat/0104162(forthcoming in Physica A,2002)。类似的结果由马克·纽曼在物理学家、计算机科学家以及其他领域学者的合作网络中独立得到。参见M.E.J.Newman,“The Structure of Scientific Collaboration Networks,”Proceedings of the National Academy of Sciences 98(2001):404409;“Scientific Collaboration Networks:I.Network Construction and Fundamental Results,”Physical Review,E 64(2001):016131;“Scientific Collaboration Networks:II.Shortest Paths,Weighted Networks,and Centrality,”Physical Review,E 64(2001):016132。
关于聚团系数,随机网络模型能告诉我们些什么呢?聚团系数表示我的两个朋友之间有联系的概率,因此,对于埃尔德什-莱利模型而言,这只不过是两个节点之间有链接的概率。实际上,对于具有N个节点的随机图而言,将网络中出现的所有链接数L,除以可能出现的链接数N(N-1)/2,便可以得到其聚团系数,即2L/N(N-1)。而这正好是埃尔德什-莱利模型的控制参数,经常表示为p,即任意两个节点之间彼此相连的概率。换句话说,聚团系数C=<k>/N,这里的<k>是网络中每个节点平均拥有的链接数。
熟悉了科学家之间如何合作之后,我们便可以开始理解高聚团性的起源了,纽曼的研究和我们的研究都发现了高聚团性。实际上,很多科学论文都是由三个或者更多的作者合作完成的。每一个这样的论文都会形成一个完全图,因为每个作者都和该论文的其他作者相互连接,这类似于我们的朋友圈。因此,科学家合作网络包含很多微型完全图,每个完全图都具有很高的聚团系数,从而提高了整个网络的平均聚团系数。不过,也有社会因素。虽然我的两个研究生没有合作写过论文,但他们之间也只有两步的间隔,因为他们都和我合作发表过论文。如果他们继续在同一个领域工作,他们在将来很可能会合作写论文,也就提高了我的聚团系数。
关于线虫(Caenorhabditis elegans)的更多信息,参见http://elegans.swmed.edu/或http://www.nematodes.org/。
虽然线虫的神经网络图已经完全绘制出来了,但目前还不可能绘制出人类大脑的神经网络图。这不是因为人类大脑有数十亿个神经元需要绘制,且其中一些神经元有数千个链接连向其他神经元,而是因为人类大脑的神经元之间的链接是不断变化的,随着我们不断学习以及年龄的增长,人类大脑的神经元之间会形成新链接。不过,线虫为研究静态大脑提供了可靠的研究对象,其神经元之间的联系是由遗传决定的。
有关线虫网络拓扑的研究,参见D.J.Watts and S.H.Strogatz,“Collective Dynamics of ‘Small-World’ Networks,”Nature 393(1998):440-442,该文献中还包括电网和好莱坞演员网络的研究。还可以参见S.Horita,K.Oshio,Y.Osama,Y.Funabashi,K.Oka,K.Kawamara,“Geometrical Structure of the Neuronal Network of Caenorhabditis Elegans,”Physica A,298(2001):553-561。
关于万维网的聚团性,参见L.A.Adamic,“The Small World Web,”Proceedings of the European Conference on Digital Libraries 1999 Conference(Berlin:Springer Verlag,1999):443。关于互联网拓扑的聚团性,参见Soon-Hyung Yook,Hawoong Jeong,Albert-László Barabási,Modeling the Internet's Large-Scale Topology,http://xxx.lanl.gov/abs/condmat/0107417;and Romualdo Pastor-Satorras,Alexei Vazquez,Alessandro Vespignani,Dynamical and Correlation Properties of the Internet,Physical Review Letters,2001:Article no.258701。有关经济聚团性的讨论,参见Bruce Kogut and Gordon Walker,“The Small World of Germany and the Durability of National Networks,”American Sociological Review 66(2001):317-335。关于生态网络的聚团性,参见Richard J.Williams,Neo D.Martinez,Eric L.Berlow,Jennifer A.Dunne,and Albert-László Barabási,Two Degrees of Separation in Complex Food Webs,http://www,santafe.edu/sfi/publications/Abstracts/01-07-036abs.html。
复杂网络聚团性的其他例子,参见R.Albert and A-L.Barabási,“Statistical Mechanics of Complex Networks,”Reviews of Modem Physics 74,No.1(January 2002),47-97。
瓦茨和斯托加茨提出的最初模型发表在Nature 393(1998):440-442。该模型没有额外添加链接,而是对一些已有的链接进行重连,使之连向距离远的节点,其效果相同。这里描述的版本是由纽曼和瓦茨提出的,参见“Renormalization Group Analysis of the Small-World Network Model,”Physics Letters,A,263(1999):341;“Scaling and Percolation in the Small-World Network Model,”Physical Review,E,60(1999):7332。由于该模型的算法简单,和瓦茨-斯托加茨的模型相比,想要计算这类模型性质的人更喜欢使用该模型。
第5链 枢纽节点和连接者
Malcolm Gladwell,The Tipping Point(New York:Little,Brown,2000)。
格拉德威尔使用的电话黄页是社会学家发明的,用来估计人们的社会联系数。最近有一个综述介绍了度量个人社会联系大小的方法。参见Linton C.Freeman and Claire R.Thompson,“Estimating Acquaintanceship Volume,”in The Small World,ed.Manfred Kochen(Norwood,N.J.:Ablex,1989),147-158。
在技术层面上,我们可以很容易找出某个网页有多少个导出链接,只要访问该网页,数一下上面的URL个数即可。然而,数出导入链接的个数就相对困难了。一个文档的导入链接是指从其他网页指向该文档的链接。例如,我的研究生有各自的个人主页,这些网页都有链接指向我的主页。如果你访问他们的主页,只需要一次点击,就能到达我的主页。然而,你在访问我的主页时,却无法知道有哪些网页指向该网页。为了弄清楚我的网页有多少导入链接,你不得不逐个访问万维网上所有的10亿个网页,看看上面是否有链接指向我的主页。一个网页的导入链接反映了该网页的知名度:网页的导入链接越多,就会有越多的人访问它。更重要的是,网页的导入链接越多,人们在万维网上冲浪时越容易碰到它。如果没有人指向你的主页,那你的网页实际上等于不存在。
一些搜索引擎,像Google或AltaVista,允许任何人查看指向某个网页的所有网页。要使用这个功能,只需要在搜索框中输入“Link:”,后面紧跟你要查看的URL。例如,如果要查看指向www.nd.edu/~networks的链接,你可以输入link:http://www.nd.edu/~networks。
关于圣母大学网站的研究,参见Réka Albert,Hawoong Jeong,and Albert-László Barabási,“Diameter of the World Wide Web,”Nature 401(1999):130-131。原始数据中包括网页之间相互连接的信息,你可以重新构造出这个万维网抽样背后的网络,然后判断其中有多少个枢纽节点。如果想获取该原始数据,参见http://www,nd.edu/-networks/database/index.html。
关于两亿个网页的研究的概述,参见A.Broder,R.Kumar,E Maghoul,P.Raghavan,S.Rajagopalan,R.Stata,A.Tomkins,J.Wiener,“Graph Structure in the Web,”paper presented at the Ninth International World Wide Web Conference,http://www9.org/w9cdrom/160/160.html。
使用由这两亿个网页得出的度分布,我们能够判断本书正文中提到的连接度最高的节点的连接度,这是由A.Tomkins提供的。
导出链接的个数kout完全取决于网页的创立者,因为只有他才能在该网页上添加链接。对于一个典型的网页而言,上面会有多少个链接呢?万维网的强大之处在于它是超文本,网页设计者可以将信息结构化为页面和子页面,这些页面都指向主页面。因此,网页设计的书都会告诫我们,不要把网页设计得太拥挤。首页应该像一个路线图,既能提供信息又便于阅读。所有的细节都应该往后放,添加额外的页面,组织成层次结构,越具体的页面也往后放。那么,一个页面上放多少个链接才不算拥挤呢?一般说来,页面上可以容纳几百个词,大概包括5到15个链接。如果所有人都按照网页设计书籍的建议,大多数网页的链接都有最优的链接数目,在信息内容最大化和可读性之间取得比较好的平衡。当然,有些页面拥有的链接数会多一些,也有一些会比最优值小一些,这取决于网站管理员的审美观。不过,我们会有一个黄金平均值,很好有人会偏离这个平均值太多。在这个理想的世界中,链接的分布会遵循钟形曲线,用数学语言称之为高斯曲线,峰值出现在最优值附近,非常类似于随机网络模型的预言。
万维网上高度连接的节点通常被称为枢纽节点和权威节点。枢纽节点是指有很多导出链接的节点,权威节点是指拥有很多导入链接的节点。参见J.Kleinberg,“Authoritative Sources in a Hyperlinked Environment,”Proceedings of the 9th Association for Computing Machinery-Society for Industrial and Applied Mathematics.Symposium on Discrete Algorithms(1998);extended version in Journal of the ACM,46(1999):604-632。
Craig Fass,Mike Ginelli,and Brian Turtle,Six Degrees of Kevin Bacon(New York:Plume,1996)。
位于弗吉尼亚的The Oracle of Bacon网站参见http://www.cs.virginia.edu/oracle/。
好莱坞演员网络中枢纽节点的重要作用可以通过下面这个例子看出来。玛丽莲·梦露、迈克·迈耶或查理·卓别林到达贝肯的最短路径都经过了同一个演员,那就是罗伯特·瓦格纳。瓦格纳是贝肯的邻居中最重要的枢纽节点,是其和好莱坞之间的关键链接。实际上,瓦格纳至少出演过101部电影,拥有2 017条链接。虽然他不是连接度最高的演员,但也高居第24位,这个排名足以让贝肯羡慕了。
好莱坞演员的排序依据是郑浩雄2000年测量出的结果,他下载IMDb.com数据库后重新构建了好莱坞背后的网络,据此给出了测量结果。类似的测量结果经常见诸报端。由于数据是在不同时期采集的,连接度最高的演员出现的精确顺序以及他们所拥有的链接数,可能会有一些细微差别。不过,在连接度最高的演员以及他们和好莱坞其他演员之间的间隔方面,这些测量大体上是一致的。
关于细胞的分子网络中存在枢纽节点的证据,参见第13链以及下述文献:Hawoong Jeong,Bálint Tombor,Réka Albert,Zoltán N.Oltvai,and Albert-László Barabási,“The Large-Scale Organization of Metabolic Networks,”Nature 407(2000):651;Hawoong Jeong,Sean Mason,Albert-László Barabási,and Zoltán N.Ohvai,“Centrality and Lethality of Protein Networks,”Nature 411(2001):41-42;Andreas Wagner and David Fell,“The Small World Inside Large Metabolic Networks,”Proceedings of the Royal Society of London B,Vol.268(Sept.7,2001):1803-1810。
关于互联网拓扑中的枢纽节点,参见M.Faloutsos,P.Faloutsos,and C.Faloutsos,“On Power-Law Relationships of the Internet Topology,”Proceedings of ACM Special Interest Group on Data Communication(SIGCOMM),1999(Cambridge,Mass.,Aug.1999)。
关于电话呼叫网络,参见J.Abello,P.M.Pardalos,and M.G.C.Resende,Disc.Math.and Theor.Comp.Sci., DIMACS ser.,50(1999):119;William Aiello,Fan Chung,Linyuan Lu,A Random Graph Model for Massive Graphs,Proceedings of the 32nd ACM Symposium on Theor.Comp.(2000)。
Emanuel Rosen, The Anatomy of Buzz(New York:Doubleday,2000)。
有关FDR熟人网络的讨论,参见H.Rosenthal,Acquaintances and Contacts of Franklin Roosevelt(master's thesis,Massachusetts Institute of Technology,1960)。也可以参见Linton C.Freeman,and Claire R.Thompson,“Estimating Acquaintanceship Volume,”147-158,in The Small Word,Edited by Manfred Kochen(Norwood:Ablex,NJ,1989)。
有关细胞内p53网络中枢纽节点的讨论,参见Bert Vogelstein,David Lane,and Arnold J.Levine,“Surfing the p53 Network,”Nature 408(2000):307-310。
有关关键物种的讨论,参见Simon Levin,Fragile Dominion(Cambridge,Mass.:Perseus,1999)。关于枢纽节点和关键物种的讨论,参见Ricard V.Solé and José M.Montoya,Complexity and Fragility in Ecological Networks,http://www.santafe.edu/sfi/publications/Abstracts/00-11-060 abs.html。
第6链 幂律
关于帕累托的奇闻轶事很多地方都提到过,譬如:Arthur Livingston的英译本Trattato di Sociologia Generale,The Mind and Society(New York:Harcourt Brace,1942)中的传记注释。
商业领域发表了大量关于80/20定律文章,最终形成了一本关于它的书。参见Richard Koch,The 80/20 Principle-The Secret to Success by Achieving More with Less(New York:Currency,1998)。
“幂律可以刻画万维网的拓扑”这一发现,最早见于Réka Albert,Hawoong Jeong,and Albert-László Barabási,“Diameter of the World Wide Web,”Nature 401(1999):130-131。一个独立的研究也得出了同样的结论,参见R.Kumar,P.Raghavan,S.Rajalopagan,and A.Tomkins,“Extracting Large-Scale Knowledge Bases from the Web,”Proceedings of the 9th ACM Symposium on Principles of Database Systems 1(1999)。
在科学论文中,度分布的幂律性质通常写成概率的形式。一个随机选择的节点恰好拥有k条链接的概率服从分布P(k)~k-γ,这里γ被称为度指数。
关于幂律的介绍以及幂律在多种系统中的出现,参见Mark Buchanan,Ubiquity:The Science of History…Or Why the World Is Simpler Than We Think(New York:Crown Publishers,2001)。关于幂律出现在另一个已经被深入研究的领域——自组织临界点方面的文献,参见Per Bak,How Nature Works(Oxford,England:Oxford University Press,1996)。
要了解好莱坞演员网络的幂律性质,参见Albert-László Barabási and Réka Albert,“Emergence of Scaling in Random Networks,”Science 286(1999),509-512;Albert-László Barabási,Réka Albert,and Hawoong Jeong,“Mean-Field Theory for Scale-Free Random Networks,”Physica A,272(1999),173-187。
有关科学合作网络中的幂律,参见A.-L.Barabási,H.Jeong,E.Ravasz,Z.Néda,T.Vicsek,A.Schubert,On the Topology of the Scientific Collaboration Networks,http://xxx.lanl.gov/abs/condmat/0104162。类似的结果由马克·纽曼在物理学家、计算机科学家以及其他领域学者的合作网络中独立得到,参见M.E.J.Newman,“The Structure of Scientific Collaboration Networks,”Proceedings of the National Academy of Sciences 98(2001):404-409;“Scientific Collaboration Networks:I.Network Construction and Fundamental Results,”Physics Review,E 64(2001),016131;“Scientific Collaboration Networks:II.Shortest Paths,Weighted Networks,and Centrality,”Physics Review,E 64(2001):016132。
关于细胞中的幂律,参见H.Jeong,B.Tombor,R.Albert,Z.N.Oltvai,and A.-L.Barabási,“The Large-Scale Organization of Metabolic Networks,”Nature 407(2000):651-654;Hawoong Jeong,Sean Mason,Albert-László Barabási,and Zoltán N.Oltvai,“Lethality and Centrality in Protein Networks,”Nature 411(2001):41-42;Adreas Wagner and David A.Fell,“The Small World Inside Large Metabolic Networks,”Proceeding of the Royal Society,London,268(2001):1803-1810。
关于科学引用的次数,参见"How Popular Is Your Paper?An Empirical Study of the Citation Distribution,”Euro.Phys.Journal,B,4(1998),131;也可以参见 S.Bilke and C.Peterson,“Topological Properties of Citation and Metabolic Networks,”Physical Review,E 64(2001):036106。
没错,美国航空路线图是由航空公司精心设计的,目的是让利润最大化。其结果,正如路易斯·阿马拉尔及其在波士顿大学的同事所证明的那样,机场乘客数的分布有一个指数尾巴。然而,由于该网络的拓扑是由枢纽节点主导的,它具有幂律网络的所有可见属性。因此,这是一个很好的例子,能够让人想起无尺度网络的主要特征。关于航空系统的研究,参见L.A.N.Amaral,A.Scala,M.Barthélémy,and H.E.Stanley,“Classes of Small-World Networks,”Proceedings of the National Academy of Sciences 97(2000):11149-11152。
为大众读者而写的,有关水的丰富而令人着迷的介绍,参见Philip Ball,Life's Matrix(New York:Farrar,Straus and Giroux,1999)。
关于临界现象中预重整组(prerenormalization-group)的精辟论述,参见H.Eugene Stanley,Introduction to Phase Transitions and Critical Phenomena(Oxford,England:Oxford University Press,1971)。
注意,尽管水和磁体都经历相变,但方式却极为不同。从水到冰的相变,被物理学家称为一阶相变,意思是说,相关的热力学量在相变点上是不连续变化的(即跳跃)。相反,磁体表现出的是二阶相变(即热力学量在相变点连续变化)。这说明,用来描述这些不同相变的理论工具,虽然起源相同,但在事情本质上却非常不同。在接近临界点时,只有二阶相变总能形成幂律。
卡达诺夫的圣诞节发现由利奥·卡达诺夫在临界现象历史背景中进行了回顾,参见Leo P.Kadanoff's,From Order to Chaos,Essays:Critical,Chaotic and Otherwise(Singapore:World Scientific,1993):157-163。卡达诺夫和其他人共享这份贡献,因为他提出的尺度原理由其他一些研究人员独立发现了,包括Michael Fisher、Ben Widom、A.Z.Patashinskii和V.L.Pokrovskii。威尔逊之所以因为临界现象的研究而独自获得了诺贝尔奖,是因为临界现象的关键前提——尺度概念被太多人独立发现了。很可惜,这一奖项让一些真正关键的科学贡献未能得到应有的荣誉。我们很多人认为,其他人的关键贡献也同样值得我们认可和尊重。
关于威尔逊的两篇开创性论文,参见Kenneth G.Wilson,“Renormalization Group and Critical Phenomena:I.Renormalization Group and the Kadanoff Scaling Picture,”Physics Review,B,4(1971):3174-3183;“Renormalization Group and Critical Phenomena.II.Phase-Space Cell Analysis of Critical Behavior,”Physical Review B,4(1971):3184-3205.关于这个领域的教学评论,参见J.J.Binney,N.J.Dowrick,A.J.Fisher,and M.E.J.Newman,The Theory of Critical Phenomena:An Introduction to the Renormaiization Group(Oxford,England:Oxford University Press,1992)。
二阶相变通常是可逆的,这意味着,我们观察到幂律和我们跨过临界点的方向没有关系,无论是从有序到无序,还是沿着相反的方向从无序到有序,都能观察到幂律。
普适性成为理解很多不相干现象的指导原则。普适性告诉我们,支配着复杂系统的物理定律以及从无序到有序的相变都是简单的、可重现的,且无处不在的。我现在知道了,导致雪花是六个瓣的普适机制,也控制着视网膜神经细胞的形状。幂律和普适性出现在经济系统中,描述公司如何生长以及棉花价格如何波动。它们能够解释鸟类和鱼类是如何成群的、地震在强度上是如何区分的。它们是20世纪后半期两个重要发现背后的指导原则:混沌和分形。因此,发生在80年代和90年代的统计力学的第二次革命,其焦点集中于一个重要问题:幂律如何能够出现在许多不同的系统中,而有些系统似乎并没有经历相变。作为统计力学的子领域,自组织临界点将很多研究人员联合起来,以期能够给出该问题的通用性答案。
说出是谁提出了尺度和重整组概念,相对比较容易。找出普适性概念的起源,就要难得多了。卡达诺夫在完成其关于尺度的开创性论文一年后,在一篇综述文章中提到了普适性。他记得自己是在莫斯科酒吧里和两位著名的俄罗斯物理学家聊天时听到的。这两位物理学家的研究领域处于相变和场论的边界上,这是物理学的一个分支,经常被粒子物理和凝聚物质物理涉及。然而,普适性在统计力学中已经被其他一些人在不同背景下使用过。不过,很少有人注意到,普适性已经有了新的含义:在经历从无序到有序的相变时,差异很大的系统会具有同样的性质。
第7链 富者愈富
这篇在飞机上写就的论文在五个月后发表了,参见Albert-László Barabási and Réka Albert,“Emergence of Scaling in Random Networks,”Science 286(1999):509-512。
关于未来十年万维网上存放的信息量,参见Phil Bernstein,Michael Brodie,Stefano Ceri,David DeWitt,Mike Franklin,Hector Garcia-Molina,Jim Gray,Jerry Held,Joe Hellerstein,H.V.Jagadish,Michael Lesk,Dave Maier,Jeff Naughton,Hamid Pirahesh,Mike Stonebraker,and Jeff Ullman,“The Asilomar Report on Database Research,”ACM Sigmod Record 27,no.4(1998):74-80。
有关好莱坞演员网络生长的信息,是基于郑浩雄从IMDb.com数据库采集的数据得到的。
关于模型A的详细分析,参见Albert-László Barabási,Réka Albert,and Hawoong Jeong,“Mean-Field Theory for Scale-Free Random Networks,”Physica A,272(1999):173-187。
关于在线广告预算方面的信息,参见Michell Jeffers and Evanthei Schibsted,“The Sizzle:What's New and Now in Marketing and Advertising for E-Business and E-Commerce,”Business 2.0(May 2000):161-162。
当然,涉及消息来源时,我们都有相似的偏好,希望浏览能给我们提供有趣及时消息的少数几个网站。不过,对于不那么主流的话题,我们的选择也就不那么好预测了,因此也更随机一些。实际上,可能只有同学才会将链接指向高中朋友的网页。然而,在绝大多数情况下,我们遵循着一种下意识的偏好,将链接指向连通性更好的节点。
网络中存在偏好连接的直接定量证据,可以在很多网络中找到了,包括互联网、好莱坞演员网络、合作网络和引文网络。参见H.Jeong,Z.Néda,A.-L.Barabási,“Measuring Preferential Attachment for Evolving Networks,”http://xxx.lanl.gov/abs/condmat/ 0104131;M.E.J,Newman,“Clustering and Preferential Attachment in Growing Networks,”Physical Review,E 64,(2001):025102;Ramualdo Pastor-Satorras,Alexei Vazquez,Alessandro Vespignani,“Dynamical and Correlation Properties of the Internet,”Physical Review Letters,87(2001):258701;K.A.Eriksen,and M.Hornquist,“Scale-Free Growing Networks Imply Preferential Attachment,”Physical Review,E 65,(2001):017102。
无尺度模型以及两个基本概念——生长机制和偏好连接,都是在以下文献中提出的,包括:Albert-László Barabási and Réka Albert,“Emergence of Scaling in Random Networks,”Science 286(1999):509-512;Albert-László Barabási,Réka Albert,and Hawoong Jeong,“Mean-Field Theory for Scale-Free Random Networks,”Physica A,272(1999):173-187。注意,为了简单起见,在本书讨论的例子中,我们让每个新节点和两个其他节点相连。一般来说,这些节点可以和任意数目的节点相连,且不会改变模型的基本特征。
无尺度模型能够产生度指数为3的幂律,这已经被埃尔德什以前的一些合作者精确证明了。参见B.Bollobás,O.Riordan,J.Spencer,G.Tusnády,“The Degree Sequence of a Scale-Free Random Graph Process,”Random Structures and Algorithms 18(May 2001):279-290。
无尺度模型后来进行了扩展,将内部链接包括了进去,该工作参见Réka Albert and Albert-László Barabási,“Topology of Evolving Networks:Local Events and Universality,”Physical Review Letters 85(2000):5234。
波士顿大学研究组在节点老化方面的研究工作,参见L.A.N.Amaral,A.Scala,M.Barthélémy,and H.E.Stanley,“Classes of Small-World Networks,”Proceedings of the National Academy of Sciences 97(2000):11149-11152。
波尔图的研究组发表了两篇非常相近的论文,参见S.N.Dorogovtsev,J.F.F.Mendes,“Evolution of Reference Networks with Aging,”Physical Review,E 62(2000):1842;S.N.Dorogovtsev,F.F.Mendes,and A.N.Samukhim,“Structure of Growing Networks with Preferential Linking”Physical Review Letters 85(2000):4633。
无尺度网络拓扑上的非线性效应,说明连接速率可能是正比于k-γ,该工作参见P.L.Krapivsky,S.Redner,and F.Leyvraz,“Connectivity of Growing Random Networks,”Physical Review Letters 85(2000):4629-4632。
关于无尺度模型各种扩展的详细总结以及关于复杂网络领域的一般性总结,参见最近两篇综述论文:S.N.Dorogovtsev and J.F.F.Mendes,“Evolution of Networks,”Advances in Physics(in press,2002);Réka Albert and Albert-László Barabási,“Statistical Mechanics of Complex Networks,”Reviews of Modern Physics 74,(Jan.2002):47-97。
一些研究组研究了语言的无尺度性质。我和宋勋毓、郑浩雄一起把所有的同义词用链接联系起来,发现所得到的网络具有无尺度拓扑。我们从未发表这一结果。不过,许多研究组已经发表过分析语言网络的优秀论文,他们用于定义链接的标准虽然不同,却都发现了无尺度拓扑。参见Ramon Ferrer i Cancho and Ricard V.Solé,“The Small-World of Human Language,”Proceedings of the Royal Society of London B,268(2001):2261-2265;Mariano Sigman and Guillermo Cecchi,Global Organization of the Wordnet Lexicon,Proceedings of the National Academy of Sciences,99(2002):1742-1747.S.N.Dorogovtsev,J.E F.Mendes,“Language as an Evolving Word Web,”Proceedings of the Royal Society of London B 268(Dec.2001):2603-2606。
第8链 爱因斯坦的馈赠
雅虎公司在2000年6月26日起不再将Inktomi作为其默认搜索引擎,转而使用Google提供的搜索引擎。各大媒体都报道了这一事件。按照预期,雅虎取消和Inktomi的合作并不会立即对Inktomi的财务状况造成影响。因为那时候Inktomi有80多个客户,而和雅虎的合作只占Inktomi收入的不到2%。然而,Inktomi在纳斯达克的股票暴跌255/16点,跌到了1151/16点。
互联网档案馆专题研讨会于2000年3月8日在档案馆所在地,圣弗朗西斯科的普雷西迪奥召开。关于互联网档案馆创办目标的更多信息,参见第12链。
关于牛顿掌上电脑诞生的详细图片介绍,参见Doug Menuez,Markos Kounalakis,and Paus Saffo,Defying Gravity:The Making of Newton(Hillsboro,Ore.:Beyond Words,1993)。可惜的是,随着牛顿掌上电脑进入市场,这本书在精彩部分戛然而止了。
有关商业中后来居上案例的详细介绍,参见Joan Indiana Rigdon,“The Second-Mover Advantage,”Red Herring,September 1,2000。
适应度模型发表于G.Bianconi,A.-L.Barabási,“Competition and Multiscaling in Evolving Networks,Europhysics Letters 54(May 2001):436-442。关于该模型的扩展,譬如将真实网络中发生的附加效应通过相加或相乘的方式引入到适应度模型,参见G.Ergun and G.J.Rodgers,Growing Random Networks with Fitness,Physica A 303(Jan.2002):261-272。
关于玻色-爱因斯坦关系的详细历史记录以及玻色-爱因斯坦凝聚想法的诞生,参见William Blanpied,“Einstein as Guru?The Case of Bose,”in Einstein:The First Hundred Years,ed.Maurice Goldsmith,Alan Mackay,and James Woudhuysen(Oxford,England:Pergamon Press,1980),93-99。也可以参见Albrech Fölsing,Albert Einstein:A Biography(New York:Viking,1997)。
1938年,彼得·卡皮查(Pyotr Kapitza)和约翰· 阿伦(John F.Allen)发现了玻色-爱因斯坦凝聚的一种奇怪表现。常用于充气球的氦气在开尔文温度2.2度以下会经历玻色-爱因斯坦凝聚,变成超流体。氦气的这一新状态具有一种令人惊讶的特性——丧失了粘性,使这种流体可以沿着容器壁向上滑出容器。想象一下,早上起来发现咖啡顺着杯子的壁爬上去,洒到了外面。不可思议吧,不过氦气的确能做到这一点,这是玻色-爱因斯坦凝聚的可见表现。
关于玻色-爱因斯坦凝聚的新发现及潜在应用的入门级介绍,可以参见Graham P.Collins,“The Coolest Gas in the Universe,”Scientific American(Dec.2000):92-99;Wolfgang Ketterle,“Experimental Studies of Bose-Einstein Condensation,”Physics Today 52(Dec.1999):30-35;Eric A.Cornell and Carl E.Wieman,“The Bose-Einstein Condensate,”Scientific American(Mar.1998):40-45。
网络和玻色-爱因斯坦凝聚之间的联系发表在G.Bianconi and A.-L.Barabási,“Bose-Einstein Condensation in Complex Networks,”Physical Review Letters,86(June 2001):5632-5635。一些研究人员对此项工作进行了扩展,他们指出,“胜者通吃”现象不需要和量子力学联系起来就能描述。参见S.N.Dorogovtsev and J.F.F.Mendes,“Evolution of random networks,”Advances in Physics(in press,2002)。
玻色-爱因斯坦凝聚并不是证明量子力学在复杂网络研究中有用途的唯一领域。随机矩阵的谱特性是20世纪60年代由尤金·维格纳(Eugene Wigner)开创的领域,是关于复杂网络谱特性研究的起点。例如,I.J.Farkas,I.Derenyi,A.L.Barabási,I.Vicsek,“Spectra of ‘Real-World’ Graphs:Beyond the Semi-Circle Law,”Physical Review E 64(2001):026704;K.I.Goh,B.Kahng,D.Kim,“Spectra and Eigenvectors of Scale-Free Networks,”Physical Review E 64(2001):051903。场论是量子力学的数学分支,也被应用到复杂网络研究中。参见A.Krzgwicki,“Defining Statistical Ensembles of Random Graphs,”http://www.laml.gov/abs/condmat/ 0110574;Z.Burda,J.D.Correia,A.Krzgwicki,“Statistical Ensemble of Scale-Free Random Graphs,”Physical Review E 64(2001):046118。
注意,在具有非线性偏好连接机制的网络中存在一种和玻色-爱因斯坦凝聚非常类似的现象。参见.L.Krapivsky,S.Redner,and E Leyvraz,“Connectivity of Growing Random Networks,”Physical Review Letters,85(2000):4629-4632。
描述操作系统市场的网络被称为二部图。二部图由两类不同的节点集合组成,每个节点只允许连向另一个集合的节点,同一个集合的节点之间不允许有直接链接。在微软的例子中,一类节点是操作系统,另一类节点是选择(即建立链接)操作系统的众多用户。类似的二部图也可以描述好莱坞网络。其中一类节点是演员,另一类是他们所出演的电影。在这个二部图中,演员之间彼此不相连。演员只和他们出演的电影相连接。从这个二部图出发,在连向同一部电影的演员之间建立链接,便可以很容易地构建出第5链讨论的演员网络。关于二部图的讨论,可以参见M.E.J.Newman,S.H.Strogatz,and D.J.Watts,“Random Graphs with Arbitrary Degree Distributions and Their Applications,”Physical Review E,64,(2001):026118;Steven H.Strogatz,“Exploring Complex Networks,”Nature 410(2001):268-276。
关于操作系统的历史,参见Neal Stephenson,In the Beginning Was the Command Line,http://www,cryptonomicon.com。
计算机制造商市场份额的数据由IDC提供,可以在http://www.idc.com/获得。
操作系统市场份额的信息来自Stephanie Miles and Joe Wilcox,“Windows 95 Remains the Most Popular Operating System,”Cnet.com,July 20,1999。
有些系统不得不使用适应度来解释其网络拓扑,互联网就是一个例子。参见Romualdo Pastor-Satorras,Alexei Vazquez,and Alessandro Vespignani,“Dynamical and Correlation Properties of the Internet,”Physical Review Letters,87(2001):258701。
第9链 阿喀琉斯之踵
关于1996年7月2日丹佛大面积停电的详细描述,可以参见L.M.Collins,“Power Grid Fails,Blackout Affects 1.5 Million in West,”Denver News-Times,July 3,1996;“Power Grid Fails,Blackout Affects Millions in West,”Nando.net,July 2,1996.For the August repeat of the same event,see Sagging power lines,hot weather blamed for blackout,CNN,August 11,1996。
美国遭遇的各种电力故障以及电路网络的脆弱性,受到大众媒体和一些专业组织的广泛讨论。参见Massoud Amin,“Toward Self-Healing Infrastructure Systems,”IEEE Computer(Aug.2000):2-11;D.N.Kosterev,C.W.Taylor,and W.A.Mittlestadt,“Model Validation of the August 10,1996 WSCC System Outage,”IEEE Transactions on Power Systems 14(Aug.1999):967-977。关于违规操作及其对基础设施造成的影响,相关的讨论参见Alan Weisman,“Power Trip:The Coming Darkness of Electricity Deregulation,”Harper's, Oct.2000,76-85。
关于地球上的物种数量、物种多样性和物种灭绝的讨论,参见Robert M.May,“How Many Species Inhabit the Earth?”Scientific American,Oct.1992,42-48;Joel L.Swerdlow,“Biodiversity:Taking Stock of Life,”National Geographic 192(Feb.1999):2-41;Virginia Morell,“The Sixth Extinction,”National Geographic 192(Feb.1999):43-59。
自然界的健壮性通常被认为源于自然界的冗余性,而冗余性是很多网络的固有性质,人类设计的系统却大多缺乏这一性质。在大多数网络中,大多数节点之间存在大量的可替代路径。例如,通过当地参议员联系到总统可能是条捷径,但他们也绝不是不可或缺的。如果参议员拒绝帮忙引荐,还有很多其他途径,而且通过这些途径联系到总统和通过参议员引荐需要的跳数同样少。互联网具有类似的冗余性。如果一个路由器不工作了,消息可以通过其他路径进行路由。冗余性同样出现在生态系统中。很少有哪个捕食者只依赖单一物种生存。实际上,随着老鼠的地位上升到家庭宠物,猫只好不情愿地改吃罐头食品了。可替代路由是冗余性和容错性的重要源头。也就是说,在大多数自然系统中,一些节点出现故障并不是致命的,因它们故障而消失的路径可以被其他众多替代路径来代替。很多人可能都经历过这种现象,当从广播里听到到达目的地的最短道路堵塞之后,我们会选择一条替代路径达到目的地。或者,遇到恶劣天气或者航班取消的情形,我们也会寻找替代路径。但是,是否有冗余性之外的某种东西能够产生健壮性呢?
通过随机节点删除使随机网络瘫痪是一个逆向渗漏问题。渗流理论告诉我们,网络从破碎状态变化到完全连通状态,是一种二阶相变。关于渗流的综述,参见D.Stauffer and A.Aharony,Introduction to Percolation Theory(London:Taylor and Francis,1994);A.Bunde and S.Havlin,eds.,Fractals and Disordered Systems(Berlin:Springer,1996);idem,eds.,Fractals in Science,(Berlin:Springer,1995)。
我们的容错研究表明,无尺度网络对于随机攻击并不脆弱。相关论文参见Réka Albert,Hawoong Jeong,and Albert-László Barabási,“Attack and Error Tolerance of Complex Networks,”Nature 406(2000):378。相关的综述和报道,参见News & Views article,Yuhai Tu,“How Robust Is the Internet?”Nature 406(2000):353-354。
关于互联网稳定性的讨论,参见Craig Labovitz,Abha Almja,and Farnam Jahanian,“Experimental Study of Internet Stability and Wide-Area Backbone Failures,”Proceedings of Institute of Electrical and Electronics Engineer(IEEE)Symposium on Fault-Tolerant Computing FTCS(Madison,Wis.:June 1999)。
说到健壮性,我们不能忽视复杂系统的动态性质。已知的具有健壮性的大多数系统具有大量的控制和反馈回路,以保证这些系统能够应对错误和故障。实际上,互联网协议在设计时,就考虑到了要绕过故障路由器。细胞有大量的反馈机制来纠正错误,分解出错的蛋白质,关闭有故障的基因。然而,通过计算机模拟,我们发现了容错性的新组成部分。我们知道了,自然界精心选择了大多数复杂系统的结构,使其具有高度的容错性。仅靠拓扑结构优势,这些系统就具备了高度的弹性——我们称之为拓扑健壮性。
计算无尺度网络的渗流阈值,参见Reuven Cohen,Keren Erez,Daniel ben-Avraham,and Shlomo Havlin,“Resilience of the Internet to Random Breakdowns,”Physical Review Letters 85(2000):4626。还有一些独立的研究发现了类似的结果,参见D.S.Callaway,M.E.J.Newman,S.H.Strogatz,and D.J.Watts,“Network robustness and fragility:Percolation on random graphs,”Physical Review Letters 85(2000):5468-5471。
MafiaBoy的相关链接,参见http://www.mafiaboy,com。
注意,并不是所有人都相信“操作合格接收机”真的存在。一些评论家认为,这只不过是五角大楼的传闻,被记者传来传去罢了。参见http://www.soci.niu.edu/~crypt/other/eligib.htm。
据计算机互联网字典(http://www.computeruser.com/resources/dictionary/dictionary.html)的解释,骇客是指“在未经授权的情况下,侵入计算机系统的人,他们有的是出于恶意,有的只是为了炫耀技术”。相比而言,黑客则“计算机知识丰富且具有创造性的编程技巧,通常具有使用汇编语言或底层语言编程的能力。”黑客可以指能够探测出系统的弱点、发现系统漏洞的编程专家。因此,为了和出于好意的黑客区分开来,我们用“骇客”一词来表示对互联网发起恶意攻击的人。更详细的讨论,参见Pekka Hirnanen,The Hacker Ethic and the Spirit of the Information Age(New York:Random House,2001);Richard Power,Tangled Web:Tales of Digital Crime from the Shadows of Cyberspace(Indianapolis,Ind.:Que,2000);Steven Levy,Hackers:Heroes of the Computer Revolution(New York:Penguin Books,1994)。
首次探讨网络面对攻击时的脆弱性和探讨容错性的论文是同一篇。参见Réka Albert,Hawoong Jeong,and Albert-László Barabási,“Attack and Error Tolerance of Complex Networks,”Nature 406(2000):378。
关于攻击问题的分析方法,参见Reuven Cohen,Keren Erez,Daniel ben-Avraham,and Shlomo Havlin,“Breakdown of the Internet un-der Intentional Attack,”Physical Review Letters 86(2001):3682;and D,S.Callaway,M.E.J.Newman,S.H.Strogatz,and D.J.Watts,“Network robustness and fragility:Percolation on random graphs,”Physical Review Letters 85(2000):5468-5471。
蛋白质网络抵抗基因突变和药物攻击的弹性,参见Hawoong Jeong,Sean Mason,Albert-lászló Barabási,and Zoltán N.Oltvai,“Lethality and Centrality in Protein Networks,”Nature 411(2001):41-42。
生态系统在去除某个关键物种后会瘫痪,相关讨论参见Ricard V.Solé and José M.Montoya,Complexity and Fragility in Ecological Networks,http://xxx.lanl.gov/abs/condmat/0011196和Ferenc Jordán and István Scheuring,“Can Keystones Help in Background Extinction?”(preprint,2000)。人类活动对生态系统稳定性和生态系统瘫痪的影响,参见Stuart L.Pimm and Peter Raven,“Biodiversity:Extinction by Numbers,”Nature 403(2000):843-845.生物多样性的保护,参见Norman Myers,Russell A.Mittermeier,Cristina G.Mittermeier,Gustavo A.B.da Fonseca,and Jennifer Kent,“Biodiversity Hotspots for Conservation Priorities,”Nature 403(2000):853-858。一些热点地区的著名摄影报道,参见Russell A.Mittermeier,Norman Myers,Patricio Robles Gil,and Cristina G.Mittermeier,Hotspots:Earth's Biologically Richest and Most Endangered Terrestrial Ecoregions (Mexico City:Cemex Conservation International,2000)。
使用“阿喀琉斯之踵”一词描述网络和互联网的脆弱性,是Janet Kelley在我为其解释我们发现的结果时向我建议的。最初,这个说法出现在了我们发表于《自然》杂志的论文标题中,不过只是出现在了封面上。
“关键物种”这一概念是由罗伯特·佩恩引入的,参见R.T.Paine,“A Note on Trophic Complexity and Community Stability,”American Naturalist,103(Jan.-Feb.1969):91-93.关于海獭的一般性讨论,参见Chapter 1 in Simon Levin,Fragile Dominion:Complexity and the Commons(Cambridge,Mass.:Perseus,1999)。
关于1996年夏季的电力瘫痪,详细的讨论参见D.N.Kosterev,C.W.Taylor,and W.A.Mittlestadt,“Model Validation of the August 10,1996,WSCC System Outage,”IEEE Transactions on Power Systems 14(Aug.1999):967-977。
关于级联失效的讨论,参见Duncan J.Watts,A Simple Model of Fads and Cascading Failures,http://www.santafe.edu/sfi/publications/Abstracts/00-12-062abs.html。
第10链 病毒和时尚
将盖坦·杜加斯作为首例艾滋病人,参见Randy Shilts,And the Band Played On(New York:St.Martin's Press,2000),这是一个逐日增加的关于艾滋病传播的记录。关于艾滋病传播的最新记录,参见“Nature Insight-AIDS,”Nature 410,no.9(2001):961-1007。
迈克·科林斯和佛罗里达选票漫画的故事,是科林斯告诉罗布·曼德尔鲍姆(Robb Mandelbaum)的,参见“Only in America,”New York Times Magazine,Nov.26,2000。
有关传染病和疾病的信息,参见Rob DeSalle,ed.,Epidemic!The World of Infectious Disease(New York:New Press,1999)。
注意,不同的扩散过程之间有着重要的差别,像思想传播或病毒传播。例如,很多疾病可以治愈,便不会再继续传播;或者,康复者体内会产生抗体,不能再被感染。关于思想,虽然你能够拒绝接受,但一旦你接受了,你就会继续传播。另外,有些病毒,比如埃博拉病毒,会快速杀死宿主,宿主能够传播该病毒的时间很短,这种现象在潮流和思想传播中也不存在。虽然有这么多差别,潮流传播、生物病毒传播以及计算机病毒传播,在很多根本特征上是非常相似的,因此我们经常将它们混为一谈。
关于艾奥瓦州农场主的研究,发表在Bryce Ryan and Neal C.Gross,“The Diffusion of Hybrid Seed Com In Two Iowa Communities,”Rural Sociology 8,no.1(1943):15-24。
钟形曲线的简单描述及其对口碑和营销的影响,参见Emanuel Rosen,The Anatomy of Buzz(New York:Doubleday,2000),94-95。
针对物理学家的研究,参见James Coleman,Elihu Katz,and Herbert Menzel,“The Diffusion of an Innovation Among Physicians,”Sociometry 20,no.4(1957):253-270)。关于意见领袖的早期研究,参见Elihu Katz and Paul F.Lazarsfeld,Personal Influence:The Part Played by People in the Flow of Mass Communications(Glencoe,III.,Free Press,1955)。
有关阈值模型,参见Mark Granovetter,“Threshold Models of Collective Behavior,”American Journal of Sociology 83,no.6(1978):1420-1443。有关该主题的综述,也可以参见 Thomas W.Valente,Network Models of the Diffusion of Innovations(Cresskill,N.Y.:Hampton Press,1995);Eric Abrahamson and Lori Rosenkopf,“Social Network Effects on the Extent of Innovation Diffusion:A Computer Simulation,”Organization Science 8,no.3(1997):289-309。
关于“爱虫”病毒的大众读物,参见Lev Grossman,“Attack of the Love Bug,”Time, May 15,2000。
通过邮件传播的计算机病毒,譬如爱虫病毒,是在由电子邮件用户形成的社会网络上传播的,该网络的节点是电子邮件用户,他们通过发送邮件彼此联系起来。最近,德国科学家证明,该网络是无尺度的。参见Holger Ebel,Latz-Ingo Mielsch,Stefan Bornholdt,Scale-Free Topology of Email Networks,http://xxx.lanl.gov/abs/condmat/0201476。
关于计算机病毒传播的介绍性文章,参见Jeffrey O.Kephart,Gregory B.Sorkin,David M.Chess,and Steve R.White,“Fighting Computer Viruses,”Scientific American(Nov.1997):88-93。更详细的方法,参见Jeffrey O.Kephart,Gregory B.Sorkin,William C.Arnold,David M.Chess,Gerald J.Tesauro,and Steve R.White,“Biologically Inspired Defenses Against Computer Viruses,”in Machine Learning and Data Mining:Methods and Applications,ed.R.S.Michalski(New York:John Wiley,1998);Steve R.White,“Open Problems in Virus Research,”International Virus Bulletin(Munich,Germany,Oct.22-23,1998)。
无尺度网络上不存在传播阈值,相关介绍参见Romualdo Pastor-Satorras and Alessandro Vespignani,“Epidemic Spreading in Scale-Free Networks,”Physical Review Letters 86(2001):3200-3203;Epidemic Dynamics and Endemic States in Complex Networks,Physical Review,E 63(2001):066117。针对这些结果的评论,参见Alun L.Lloyd and Robert M.May,“How Viruses Spread Among Computers and People,”Science 292(2001):1316。
Fredrik Liljeros,Christofer R.Edling,Luis A.Nunes Amaral,H.Eugene Stanley,and Yvonne Aberg,“The Web of Human Sexual Contacts,”Nature,411(2001):907-908。这个斯德哥尔摩-波士顿发现背后的故事,是该论文的前两个作者弗雷德里克·里耶罗斯和克里斯托弗·爱德林(Christopher R.Edling)告诉我的。
的里亚斯特的研究预言,当度指数γ小于3时,无尺度网络的扩散阈值就会消失。当度指数大于临界值3时,阈值会出现,其行为和随机网络中观察到的行为类似:传染性差的病毒会消亡。斯德哥尔摩-波士顿合作研究得出的度指数,在这方面并没能提供多少指导。在一年的数据上,他们得到的度指数是γ=3.54±0.2(女性)和γ=3.31±0.2(男性)。在更多(也可能更有偏见)的数据上,得到的度指数是γ= 3.1±0.3(女性)和γ=2.6±0.3(男性)。然而,前两个指数明显比3大,后两个指数则小于或接近3。很明显,需要更广泛的研究,才能得出确切的答案。
这个著名的20 000,出自Wilt Chamberlain,A View from Above(New York:Villard Books,1991)。
有关艾滋病二十年的传播及其对社会的影响,其调研报告参见Sharon Begley,“AIDS at 20,”Newsweek,June 11,2001。
关于支配病毒传播的定律,详细的描述参见Martin A.Nowak and Robert M.May,Virus Dynamics:Mathematical Principles of Immunology and Virology(Oxford,England:Oxford University Press,2000)。
严格来说,我们的模拟实验假设,枢纽节点在治愈后如果接触到其他被感染的节点,还会再次被感染。但目前的情况是,现在的药物会让治愈者携带的病毒数量大大降低,因此治愈者不大可能继续传染疾病了。对于艾滋病而言,可能还需要关注很多其他细节。我们只是为了说明,枢纽节点会让疾病传播阈值重新出现。因此,在不考虑疾病传播细节的情况下,如果能够治疗的人数有限,治疗枢纽节点要比随机发放药品有效得多。当然,最终的目标是治愈所有需要治疗的人。关于我们的研究,参见Zoltán Dezsö,Albert-László Barabási,Can We Stop the AIDS Epidemic? http://xxx.lane.gov/abs/condmat/0107420。也可以参见Romualdo Pastor-Satorras,Allesandro Vespignani,“Immunization of Complex Networks,”Physical Review,E 65(2002):036104。
第11链 觉醒中的互联网
书中对巴兰的介绍,来自John Naughton,A Brief History of the Future(Woodstock,NY:Overlook Press,2000),93。有关巴兰生平的更多介绍,可以参照那本书的第6章。
最近,有很多书籍和论文关注互联网的历史。除了前面引用的诺顿(Naughton)的书,还可以参见ames GiHies and Robert Cadhau,How the Web Was Born: The Story of the World Wide Web (Oxford,England:Oxford University Press,2000)。后者主要关注万维网,但是也涉及了互联网。
保罗·巴兰历史性的兰德备忘录,可以通过万维网看到,其网址参见 http://www.rand.org/publications/RM/baran.list.html。对于我们感兴趣的网络拓扑,参见 Paul Baran,Introduction to Distributed Communications Networks,RM-3420-PR,位于同一个网页上,图11-1就是来自这篇论文。
注意,分组路由的提出是后来才发布的。有些人认为莱约德·克莱恩洛克(Leonard Kleinrock)在巴兰和戴维斯之外独立提出了分组路由的想法。关于该历史争论,参见Katie Hafner,“A Paternity Dispute Divides Net Pioneers,”New York Times,Nov.8,2001。
詹姆斯·吉利斯(James Gillies)和罗伯特·卡里奥(Robert Cailliau)在前面引用的网络是如何诞生的(How the Web Was Born)中谈到,无论互联网的外观如何,其工作原理更接近邮政系统,而不是电话网络系统。在传统的模拟电话系统中,我们打电话时,电话是通过一连串的线路和交换机直接到达你想通话的人。一旦连接建立起来,这条物理线路就会完全分配给通话双方,无论这两个人在通话还是没有通话,其他电话都无法再使用这条线路。邮政系统的工作原理就不同了。邮局是通过道路网络连接在一起的。每个邮局收到信后,会根据信件的目的地进行分拣,然后将信件放到卡车或飞机上,将同一目的地的信件运过去。和电话系统相比,不会有单独的卡车直接去你家取邮件,然后专门送到目的地。与此类似,在互联网上,计算机通过将消息分成很小的数据包进行传递。和信件一样,每个数据包中都含有目的地信息。路由器每收到一个数据包,就会根据目的地地址,将其送到距离目的地最近的路由器。同一个消息的数据包通常会经历不同的路线,因为在消息源和目的地之间有多条路径可选。当所有数据包到达后,接收方的计算机会将数据包组装起来,得到我们看到电子邮件消息或者网页。
关于CAIDA合作研究工作的更好介绍,参见K.C.Claffy,T.Monk,and D.McRobb,“Internet tomography,”Nature(Jan.1999)available at http://www.nature.com/nature/webmatters/。
人们为了绘制万维网和互联网地图而进行的努力,其详细介绍参见Martin Dodge and Rob Kitchin,Atlas of Cyberspace(New York:Addison-Wesley,2002)。也可参见Martin Dodge and Rob Kitchin,Mapping Cyberspace(London:Routledge,2000)。
关于自组织对互联网拓扑的影响,一般性的讨论参见Albert-László Barabási,“The Physics of the Web,”Physics World(July 2001):33-38。
关于Email的诞生,参见John Naughton,A Brief History of the Future(Woodstock,NY:Overlook,2000)。
Veto Paxson and Sally Floyd,“Why We Don't Know How To Simulate the Intemet,”Proceedings of the 1997 Winter Simulation Conference,ed.S.Andradottir,K.J.Healy,D.H.Withers,and B.L.Nelson.“成功灾难”的说法出自这篇论文第149页。
互联网具有幂律的度分布,这一发现参见M.Faloutsos,P.Faloutsos,and C.Faloutsos,”On Power-Law Relationships of the Internet Topology,”[ACM SIGCOMM 99,comp.] Computer Communications Review 29(1999):251。最近的测量在更大的抽样上验证了该发现,参见R.Succ and H.Tangmunarunkit,“Heuristics for Internet Map Discovery,”Proceedings of Infocom(March 2000)。
关于互联网节点的时间表,参见John Naughton,A Brief History of the Future。
第一个互联网模型的提出,参见Bernard M.Waxman,“Routing of Multipoint Connections,”IEEE Journal on Selected Areas in Communications 6(Dec.1988):1617-1622。韦克斯曼(Waxman)将大量节点放到一个平面上,将这些节点随机连接起来。截至这里,该模型和埃尔德什-莱利的随机模型没有什么区别。不过,他意识到互联网的链路成本很高,所以想尽量减少长距离的链路。因此,他假设互联网上两个节点间形成连边的概率随着节点间的距离指数衰减。韦克斯曼的简单模型主宰了互联网模型数十年。直到1999年,人们发现了互联网的无尺度性质时,才对其提出质疑。但是,对距离的指数级依赖,加上生长机制和偏好连接,形成了更现代的互联网模型。首先,模拟结果表明,如果按照韦克斯曼模型所说的距离依赖,无尺度网络就不会出现。其次,也是更重要的一点,宋勋毓和郑浩雄的测量结果表明,距离为d的两个节点彼此相连的概率关于d线性衰减,这比韦克斯曼所假设的指数衰减要慢得多。
关于互联网中偏好连接的出现,一些论著对其进行了讨论。参见Soon-Hyung Yook,Hawoong Jeong,and Albert-László Barabási,Modeling the Internet's Large-Scale Topology,http://xxx.lanl.gov/abs/condmat/0107417;Hawoong Jeong,Zoltán Néda,Albert-László Barabási,Measuring Preferential Attachment for Evolving Networks,http://xxx.lanl.gov/abs/condmat/0104131;Romualdo Pastor-Satorras,Alexei Vazquez,Alessandro Vespignani,“Dynamical and Correlation Properties of the Internet,”Physical Review Letters,87(2001):258701。
假设节点数量正比于人口密度,如果一个节点拥有k条链接且与新节点的距离为r,那么新节点和该节点之间形成链接的概率正比于k/rσ。这里σ是自由参数,我们可以通过σ来调节距离的影响:如果σ较大,距离就会非常重要,如果σ为0,就只有偏好连接会对互联网演化起作用。模拟实验给出了清晰的答案:只要σ小于2,无尺度网络就会出现。但是,如果σ大于2,距离的限制效应就会占上风,网络呈现出指数度分布。我们的测量还清晰地说明,对于互联网而言,σ等于1,这解释了铺设长距离电缆获得更大带宽虽然成本很高而无尺度拓扑却还能够存在。除了解释为什么互联网是无尺度网络之外,这些测量结果还表明,以量化的形式揭示支配网络演化的不同原理,是多么得重要。参见Soon-Hyung Yook,Hawoong Jeong,and Albert-László Barabási,Modeling the Internet's Large-Scale Topology,http://xxx.lanl.gov/ abs/condmat/0107417。
最近建模互联网无尺度拓扑的其他互联网模型,参见Alberto Medina,Ibrahim Matta,and John Byers,“On the Origin of Power Laws in Internet Topologies,”[ACM SIGCOMM] Computer Communications Review 30,no.2(2000):18-28);G.Caldarelli,R.Marchetti,and L.Pietronero,“The Fractal Properties of the Internet,”Europhysics Letters 52(2000):386;K.I.Goh,B.Kahng,D.Kim,Universal Behavior of Load Distribution in Scale-Free Networks,Physical Review of Letters,87(2001):278701;A.Capocci,G.Caldarelli,R.Marchetti,L.Pietronero,“Growing Dynamics of Internet Providers,”Physical Review,E 64(2001):035101。
分形——具有不平凡几何性质的自相似物体,是由伯努瓦·曼德尔布罗提出的。随后,人们发现分形可以用来描述很多自然界的物理,包括雪花和细胞群体。参见B.Mandelbrot,The Fractal Geometry of Nature(New York:W.H.Freeman,1977)。最近的一篇综述,参见T.Vicsek,Fractal Growth Phenomena(Singapore:World Scientific,1992)。
MAI的路由失效在一些新闻报道中进行了描述。参见“Router Glitch Cuts Net Access,”CNET,April 25,1997。
有关“红色代码”蠕虫的讨论,参见Carolyn Meinel,“Code Red for the Web,”Scientific American,October 2001,42-51。
关于寄生计算,参见Albert-László Barabási,Vincent W.Freeh,Hawoong Jeong,and Jay B.Brockman,“Parasitic Computing,”Nature 412(2001):894497。进一步的信息,参见http://www.nd.edu/~parasite/。
关于分布式计算的详细讨论,参见Ian Foster,“Internet Computing and the Emerging Grid,”Nature(Dec.2000),可以在 http:// www.nature,com/nature/webmatters下载。
有关在全球开发电子皮肤的有趣讨论,参见Nell Gross,“The Earth Will Don and Electronic Skin,”Business Week(August 30,1999):68-70。
第12链 分裂的万维网
关于搜索引擎公司对NEC研究结果的反应,参见Thomas E.Weber's,“Fast Forward:Media in Motion,”Wall Street Journal,April 3,1998。
对于Inquirus,参见Steve Lawrence and C.Lee Giles,“Inquirius:The NECI Meta Search Engine,”Seventh International World Wide Web Conference,Brisbane,Australia(Amsterdam:Elsevier Science,1998),95-105。
NEC研究小组的发现发表在两篇论文中:Steve Lawrence and C.Lee Giles,“Searching the World Wide Web,”Science 280(1998):98-100;and Steve Lawrence and C.Lee Giles,“Accessibility of Information on the Web,”Nature 400(1999):107-109。
关于万维网大小的详细讨论,参见http://searchengine.com。关于搜索引擎大小的最新统计,参见Danny Sullivan's“Search Engine Sizes”Search Engine Report,August 15,2001,可以在http://searchengine.com/reports/sizes.html看到,也可以参见“Numbers,Numbers-But What Do They mean?”Search Engine Report,March 3,2000,http://searchengine.com/sereport/00/03-numbers.html。
万维网的破碎结构被称为蝴蝶结理论,其最早发现参见A.Broder,R.Kumar,E Maghoul,P.Raghavan,S.Rajagopalan,R.Stata,A.Tomkins,and J.Wiener,“Graph structure in the Web,”Ninth International World Wide Web Conference,Amsterdam,http://www9.org/w9cdrom/160/160.html。
网页随着年龄增加以及知名度提高,自然而言地就跨越了万维网上的各块大陆。这些网页的地位是由其创建者和万维网社区对该网页内容的兴趣共同决定的。随着链接和网页持续增加、删除、修改,这些大陆上的人口也在持续地变化。与此相比,20世纪末和本世纪初从欧洲移民到美国的人口小的可以忽略不计了。一条放置得好的链接可以决定数千个网页的命运和地位,整个万维网的地形图会随着这些大大小小的变化而重新组织。
最近关于有向网络性质的研究,参见S.N.Dorogovtsev,J.F.F.Mendes,and A.N.Samukhin,Giant Strongly Connected Component of Directed Networks,http://xxx.lanl.gov/abs/condmat/0103629;M.E.J.Newman,S.H.Strogatz,and D.J.Watts,“Random Graphs with Arbitrary Degree Distributions and Their Applications,”Physical Review,E 64(2001):026118;B.Tadic,“Dynamics of Directed Graphs:the World Wide Web,”Physica,A 293(2001):273-284。
Cass R.Sunstein,Republic.com(Princeton,Princeton University Press,2001)。
法官斯图尔特对于色情文学引证,被多处引用。参见“The Task of Defining What's Too Explicit to Be Seen,”USA Today,Jan.26,1999,你也可以在http://www.usatoday.com/life/cyber/tech/ctb114.htm访问到。
NEC对万维网上社区的研究,参见Gary William Flake,Steve Lawrence,and C.Lee Giles,“Efficient Identification of Web Communities,”Proceedings of the Sixth International Conference on Knowledge Discovery and Data Mining(Boston,Mass.:ACM Special Interest Group on Knowledge Discovery in Data and Data Mining,August 2000),156-160。其他一些研究组也研究了类似的问题,参见David Gibson,Jon Kleinberg,and Pranhakar Raghavan,“Inferring Web Communities from Link Topology,”Proceedings of the 9th ACM Conference on Hypertext and Hypermedia(1998)和Ray R.Larson,Bibliometrics of the World Wide Web:An Exploratory Analysis of the Intellectual Structure of Cyberspace,http://sherlock.berkeley.edu/asis96/asis96.html。
关于NP完全问题的讨论,参见M.Garey and D.S.Johnson,Computers and Intractability:A Guide to the Theory of NP-Completeness(San Francisco:H.W.Freeman,1979)。
Lada A.Adamic,“The Small World Web,”Proceedings of ECDL'99,LNCS 1696(Springer,1999),443-452.也可以参见Lada A.Adamic and Eytan Adar,Friends and Neighbors on the Web,http://www,hpl.hp.com/shl/papers/web 10/。
Lawrence Lessig,Code and Other Laws of Cyberspace(New York:Basic Books,1999)。
要想更多地了解互联网档案馆,可以访问其网站http://www.archive.org/。
我们的创造性生活,大部分已经转向了万维网。现代摄影师使用数码相机进行摄影,并通过对数码照片进行修改来更好地表达他们的想象力。一些图片会打印出来,展示在画廊里。但是,大多数图片只是以电子版的形式放在万维网上。大量的诗歌也不再以选集的形式出版,而是保存到万维网档案馆里。万维网日益成为很多视觉艺术家的主要媒介,没有浏览器便无法欣赏到他们的作品。然而,设计糟糕的网站、瘫痪的计算机和消失的资源,会造成不可挽回的损失。以后,我们不会再有梵高了,因为艺术家们的作品如果不被同时代的人欣赏,就会消失在万维网中而不会被后来人看到。随着计算机升级换代或技术革新,用不了几个世纪,可能只要短短几年,在线世界里富有创造力的天才作品就会湮没无闻。
只有一个办法能够阻止历史消失的悲剧,让当今万维网上存放的创造性能够延续。我们必须对万维网上的一切进行归档,留给我们的后代。我相信,我们应该严肃地对待这个事情,甚至由政府出面来提供支持。我们要保留每一个网页,使网络上过去的和现在的内容都可以让任何人在任何地方访问到。
在这一链,我们关注的主要是万维网的拓扑。然而,最近的一系列研究结果已经开始研究人们在万维网上的浏览模式和动态行为,为涌现性和幂律找到了更多的证据。参见Bernardo A.Huberman,Peter L.T.Pirolli,James E.Pitkow,and Rajan M.Lukose,“Strong Regularities in World Wide Web Surfing,”Science 280(1998):95-97;Anders Johansen and Didier Sornette,Download Relaxation Dynamics on the WWW Following Newspaper Publication of URL,http://xxxlanl.gov/abs/condmat/9907371;and Bernardo A.Huberman,The Laws of the Web(Cambridge,Mass.:MIT Press,2001)。
第13链 生命的地图
关于美国人口死亡(包括抑郁)的主要原因,参见疾病控制和防范中心(CDC)的网站:http://we-bapp.cdc.gov/。
关于躁郁症的专门研究,参见Nick Craddock and Ian Jones,“Molecular Genetics of Bipolar Disorder,”British Journal of Psychiatry 174,suppl.41(2001):128-133。有些关于抑郁症的研究也探讨了躁郁症,参见Charles B.Nemeroff,“The Neurobiology of Depression,”Scientific American,June 1998,42。
人类基因组的破译受到了媒体的广泛报道,这些报道集中在两个时间段。一个是2000年6月25日白宫的官方声明;另一个是2001年2月15至2月16日发表的关于基因组的论文,参见Science 291(Feb.2001),and Nature 409(Feb.2001)。
后基因组生物学的近期讨论以及人们对基因作用的认识变化,参见Evelyn Fox Keller,The Century of the Gene(Cambridge,Mass.:Harvard University Press,2000)。
网络在理解细胞方面日益重要的作用,更多的见解参见J.Craig Venter et al,“The Sequence of the Human Genome,”Science 291(2001):1304-1351,especially 1347-1348。
细胞生物学很好的入门读物,参见Bruce Alberts,Dennis Bray,Julian Lewis,Martin Raft,Keith Roberts,and James D.Watson,Molecular Biology of the Cell(New York:Garland,1994)。
新陈代谢的研究可以追溯到19世纪,研究动因主要源于:法国葡萄酒酿造商需要控制酵母细胞将葡萄糖转化成酒精和二氧化碳气泡的步骤。这一起源从“酶”(enzyme)这个单词中还能看出来,enzyme的词根的意思是“酵母”(in yeast)。因此,生物化学可以看作一个巨大的绘图项目,其目的是绘制出细胞内所有可能的化学物质及化学反应的地图。关于绘制新陈代谢地图的详细历史,参见Horace Freeland Judson,The Eighth Day of Creation:Makers of the Revolution in Biology(Plainview,NY:Cold Spring Harbor Laboratory Press,1996)。
注意,不同的子网络,如新陈代谢网络或蛋白质相互作用网络,都不是相互独立的。实际上,调控网络的蛋白质对化学反应有催化作用,因此控制着新陈代谢网络的链接。类似地,常见的蛋白质-基因相互作用,将蛋白质相互作用网络和基因以及DNA关联起来。
关于沃森的引用,出自James D.Watson,Molecular Biology of the Gene,2nd ed.(New York:W.A.Benjamin,1970):99。
WIT(那里有什么)是一个整合系统,能够对序列化的基因组进行对比分析。对我们而言重要的是,该系统能够支持从序列数据中重构出新陈代谢网络。可以通过网页http://www-unix.mcs.anl.gov/compbio/访问到该系统。
新陈代谢网络的无尺度性质,相关研究结果发表在H.Jeong,B.Tombor,R.Albert,Z.N.Oltvai,and A.-L.Barabási,“The large-scale organization of metabolic networks,”Nature 407(2000):651-654。
Andreas Wagner和David A.Fell在新陈代谢网络方面的工作发表在“The Small World Inside Large Metabolic Networks,”Proceedings of the Royal Society,London,B,268(2001):1803-1810。
对不同生命体的新陈代谢网络进行对比,可以揭示不同物种之间的进化关系。参见J.Podáni,Z.N.Oltvai,H.Jeong,B.Tombor,A.-L.Barabási,and E.Szathmary,“Comparable System-Level Organization of Archaea and Eukaryotes,”Nature Genetics 29(2001):54-56;C.V.Forst and K.Schulten,“Phylogenetic Analysis of Metabolic Pathways,”Journal of Molecular Evolution 52(2001):471-489。
酵母双杂交技术的提出,参见S.Fields and O.Song,“A Novel Genetic System to Detect Protein-Protein Interactions,”Nature 340(1989):245-246。关于该技术最近的进展,参见Li Zhu and Gregory J.Hannon,eds.,Yeast Hybrid Methods(Natick,MA:Eaton,2000)。
酵母完整的蛋白质相互作用网络,参见P.Uetz,et al.“A Comprehensive Analysis of Protein-Protein Interactions in Saccharomyces cerevisiae”Nature 403(2000):623-627;T.Ito et al's“Toward a Protein-Protein Interaction Map of the Budding Yeast:A Comprehensive System to Examine Two-Hybrid Interactions in All Possible Combinations 'Between the Yeast Proteins,”Proceedings of the National Academy of Sciences 97(2000):1143-1147和“A Comprehensive Two-Hybrid Analysis to Explore the Yeast Protein Interactome,”Proceedings of the National Academy of Sciences 98(2001):4569-4574。
关于酵母的蛋白质相互作用网络,探讨其无尺度特性的论文参见Hawoong Jeong,Sean Mason,Albert-László Barabási,and Zoltán N.Oltvai,“Centrality and Lethality of Protein Networks,”Nature 411(2001):41-42。该论文还探讨了致命性和拓扑之间的关系,关于该结果的讨论,参见论文J.Hasty and J.J.Collins,“Protein Interactions-Unspinning the Web,”Nature 411(2001):30-31的相关新闻报道和评论文章。
关于酵母蛋白质网络中存在幂律的独立研究,以及基因复制的势链接,参见Andreas Wagner,“The Yeast Protein Interaction Network Evolves Rapidly and Contains Few Redundant and Duplicate Genes,”Molecular Biology and Evolution 18(2001):1283-1292。
关于蛋白质域网络的研究结果,参见Stefan Wuchty,“Scale-Free Behavior in Protein Domain Networks,”Molecular Biology and Evolution 18(2001):1694-1702。研究酵母蛋白质网络的另外一种方法揭示了该网络的无尺度结构,参见Jong Park,Michael Lappe,and Sarah A.Teichmann,“Mapping Protein Family Interactions:Intramolecular and Intermolecular Protein Family Interaction Repertoires in the PBD and Yeast,”Journal of Molecular Biology 307(2001):929-938。关于H.Pylori蛋白质网络的研究结果,参见Hawoong Jeong,Sean Mason,Albert-László Barabási,and Zoltán N.Oltvai,“Centrality and Lethality of Protein Networks,”Nature 411(2001)41-42。
关于基因复制及其在进化中的作用,参见John Maynard Smith and Eörs Szathmáry,The Origins of Life(Oxford,England:Oxford University Press,1999)。
一些论文独立地发现:基因复制是基因调控网络无尺度拓扑的根源。参见A.Bhan,D.J.Galas,and T.G.Dewey,“A Gene Duplication Growth Model of Scaling in Gene Expression Networks(to be published);A.Vasquez,A.Flammini,A.Maritan,and A.Vespignani,Modeling of Protein Interaction Networks(http://xxx.lanl.gov/abs/condmat/0108043);and R.V.Sole,R.Pastor-Satorras,E.D.Smith,and T.Kepler,“A Mode of Large-Scale Proteome Evolution(Santa Fe Preprint,available at www.santafe.edu 2001)。See also J.Giam,N.M Luscombe,and M.Gerstein„“Protein Family and Fold Occurrences in Genomes:Power-law Behavior and Evolutionary Model,”Journal of Molecular Biology,313(2001):673-681。注意,从网络论的角度来看,基因复制模型具有很多有趣的性质。更详细的讨论,参见J.Kim,P.L.Krapivsky,B.Kahng,and S.Redner,“Evolving Protein in Interactive Networks,”http://xxx.lanl.gov/abs/condmat/0203167。
莱恩、莱文和沃格尔斯坦获得了医学界几乎所有的奖项和荣誉。因此,很多人认为,他们获得诺贝尔奖只是个时间问题。实际上,作为英国目前引用最多的科学家之一,截维·莱恩在2000年被女王伊丽莎白授予了爵位,被称为戴维·莱恩爵士。阿诺德·莱文目前是负有盛名的纽约洛克菲勒大学的校长,是奥尔巴尼医学中心奖(Albany Medical Center Prize)的第一个获得者。该奖项的奖金总额为50万美元,在医学界仅次于诺贝尔奖。沃格尔斯坦目前是霍普金斯医学院的霍华德-休斯研究员,他不断做出惊人的发现,医学界引用前十名的论文中有三篇是他的。
网络对于理解癌症具有重要作用,参见Bert Vogelstein,David Lane,and Arnold J.Levine,“Surfing the p53 Network,”Nature 408(2000):307-310。注意,该论文没有对癌症网络进行定量分析,而是为该网络的无尺度特性提供了相当有说服力的实证论断。我们随后分析了该网络的拓扑,的确发现,癌症网络很大程度上近似是无尺度的。参见Hawoong Jeong,D.A.Mongru,Z.N.Oltvai,and A.-L.Barabási,unpublished。
基因芯片技术是1991年由Stephen Fodor和合作者提出的(参见S.P.A.Fodor,J.L.Read,M.C.Pirrung,L.Stryer,A.T.Lu,and D.Solas,“Light-Directed,Spatially Addressable Parallel Chemical Synthesis,”Science 251 [1991]:767-773),该技术使得研究人员可以破译细胞内基因相互作用的动态过程。这一技术突破从根本上改变了大多数实验室进行生物学实验的方式。从医生诊断到新药研制的所有一切,早晚会发生根本性的变革。一个DNA芯片,或称基因芯片,是一个硅片或玻璃薄片,上面采用计算机芯片制造商使用的技术布上了“电路”。光刻录机在上面蚀刻出细小的圆孔,这些孔小到只能使用机器手才能将DNA片段放入到小孔中,每个小孔中有一个不同的基因。因此,使用30 000个孔便可以将人类基因组的所有基因放到一个芯片上。当细胞中的DNA产生蛋白质时,基因首先要复制到信使RNA(mRNA)分子上,然后转录成蛋白质。因此,细胞内mRNA的数量和类型精确记录着DNA形成的序。每个mRNA分子只能与一个基因芯片的小孔相连,该小孔中含有生成该mRNA分子的DNA分子。如果生物学家将某种罕见疾病的细胞放置到DNA芯片中,对应活跃基因的小孔会充满mRNA片段,而其他小孔则是空的。激光扫描仪可以扫描每个小孔,查出正在产生蛋白质的基因。因此,这样的测量能够告诉我们,哪些基因的功能是正常的,哪些基因被基因紊乱给关闭了。
关于新型生物学工具(譬如基因芯片)对未来医学和药物研制的影响,一般性的讨论参见《时代》杂志2001年1月15日的专刊,标题为《未来的药物》(Drugs of the Future)。
最近的一些论文指出,基因芯片能够很好地跟踪基因的关闭和打开情况,可以识别出在细胞周期的不同阶段同时活跃的基因。参见Neal S.Halter,Madhusmita Mitra,Amos Maritan,Marek Cieplak,Jayanth R.Banavar,and Nina V.Fedoroff,“Fundamental Patterns Underlying Gene Expression Profiles:Simplicity from Complexity,”Proceedings of the National Academy of Sciences 97(2000):8409-8414;和Orly Alter,Patrick 0.Brown,and David Botstein,“Singular Value Decomposition for Genome-Wide Expression Data Processing and Modeling,”Proceedings of the National Academy of Sciences 97(2000):10101-10106。
注意,虽然人类基因组只有大约30 000个基因,但是蛋白质的数量却高得多。这源于被称为“选择性剪接”(alternate splicing)的过程。在该过程中,mRNA被切割,然后以很多不同的方式进行重新拼接,从而形成不同的蛋白质。因此,在真核细胞中,蛋白质数量要比基因数量大得多,打破了分子生物学中“一个基因对应一个蛋白质”的约束,该约束在细菌中是成立的。
关于基因组复杂性以及基因网络作用的讨论,参见Jean-Michel Claverie,“What If There Are Only 30,000 Human Genes?”Science 291(2001):1255-1257。
第14链 网络新经济
关于网络在商业和经济中的作用的讨论,参见E.Bonabeau,The Alchemy' of Networks:Network Science Applied to Business (in preparation)。
时代华纳和美国在线的合并,其详情参见Daniel Okrent,“Happily Ever After?”Time,January 24,2000。也可以参见美国在线的史蒂夫·凯斯和时代华纳的杰瑞·列文的联合访谈,该访谈也刊登在该杂志的同一期上。
关于戴姆勒-奔驰和克莱斯勒合并的故事,参见Bill Vlasic and Bradley A Stertz,Taken for a Ride:How Daimler-Benz Drove Off with Chrysler(New York:William Morrow,2000)。
并不是所有的合并都是市场和经济扩张的结果,第一波合并实际上是在1883年全球经济萧条后开始的。关于合并的简短历史回顾,参见David Besanko,David Dranove,and Mark Shanley,Economics of Strategy(New York:John Wiley,2000):198-199。
层级结构已经有超过一个世纪的历史了。“在我们的组织中,我们不需要员工的创造力……我们只需要他们听从我们给出的命令,按我们说的做,并且快速地做。”这是科学管理之父——弗雷德里克·温斯洛·泰勒在20世纪之初说的话,他说这话是在总结财富和物质文明的哲学。布林克·林塞(Brink Lindsey)在《有计划的人》(The Man with the Plan)(Reason Online,1998,www.reason.com)中写道,在泰勒之前,制造业还是作坊式管理。作坊的工艺被作为秘密保护起来,从师父到学徒,代代传递下去。作坊的匠人们小心翼翼地保护着自己的工艺,因为当时的工资是计件的,而不是计时的。泰勒使用一块秒表就独自改变了这一切。他把所有制造过程分解成简单的任务,将工作任务和工资体系标准化。他对制造业的开创性方法,将伯利恒钢铁公司变成了世界上最现代化的工厂,将工人的人数从500降到了140,而生产力却翻了一番。泰勒也成为了自己成功的牺牲品,失业工人的愤怒最终导致泰勒被解雇了。然而,此后再也没有哪家工厂能够不使用他的管理方式而保持竞争力。泰勒引入了清晰的等级差别,将工人变成纯粹的命令执行者。他发明了白领工人,这些人的责任是规划每一个生产步骤,并保证工人能够不折不扣地执行。他留给我们的最大遗产就是被我们称为垂直组织的管理模式。该模式在过去一个世纪一直是公司内部架构的基础。弗雷德里克·温斯洛·泰勒的生平和贡献,是很多传记和科学专著的主题。参见Robert Kanigel,The One Best Way:Frederick Winslow Taylor and the Enigma of Efficiency(New York:Viking Penguin,1997)。正式的传记参见Frank Barkley Copley,Frederick W.Taylor,Father of Scientific Management,2 vols.(New York:Taylor Society,1923)。泰勒自己最有影响力的著作是The Principles of Scientific Management(New York:Harper & Brothers,1915:reprint,Mineola,N.Y.:Dover,1998)。
注意,福特工厂对现代制造业的诞生也起到了关键作用。流水线就是在那里产生的,这是大规模生产工厂的关键组成部分。关于福特发展的简史以及生产线背后的故事,参见Joseph B.White,The Line Starts Here(www.wsj.comipublickurrent/articles/SB915733342173968000.htm,Wall Street Journal Interactive,2000)。
经典经济学理论将组织、公司和企业视为优化的网络,其优化目的是为了使用最少的资源获得最大的财政产出。这是泰勒留给我们的遗产,他认为经营公司是一个优化过程,目的是增加利润。这种利润驱动的优化喜欢树形结构。实际上,如果生产是公司的主要目标,那么通过把所有重复性、专业化的任务分配给低工资的工人去做,可以大大降低成本。最近的研究表明,层级组织内部的信息管理也是最高效的,因为树形避免了不必要的信息重复和通信。由于每个公司的活动都是制造和信息管理的结合,这种金字塔式的结构看起来会一直保持下去。关于公司内部层级树形结构的详细讨论,参见Patrick Bolton and Mathias Dewatriport,“The Firm as a Communication Network,”Quarterly Journal of Economics 109(Nov.1994):809-839。
公司内部组织结构日益网络化,相关讨论参见Business Week's special double issue“The 21st Century Corporation,”August 21-28,2001。
关于组织结构的网络理论,一个简要的综述参见Peter R.Monge and Noshir S.Contractor,“Emergence of Communication Networks,”in The New Handbook of Organizational Communication,ed.Fredric M.Jablin and Linda L.Putnam(Thousand Oaks,Calif.:Sage Publications,2001):440-502。
关于乔丹在克林顿-莱温斯基丑闻中发挥的作用,参见Eric Pooley,“The Master Fixer Is a Fix,”Time,Feb.2,1998。
在芝加哥地区,一个关于管理者之间紧密关联的更为地域性的例子,参见Melissa Allison,“Directors Weave a Complex Web,”Chicago Tribune,June 17,2001,sec,5,p.1-2。
有关企业网络的消息讨论,参见Gerald E Davis,Mina Yoo,and Wayne E.Baker's“The Small World of the Corporate Elite”(Preprint,February 2001)。
对于董事网络的数学分析,参见M.E.J.Newman,S.H.Strogatz,and D.J.Watts,“Random Graphs with Arbitrary Degree Distributions and Their Applications”Physical Review,E 64(2001):026118。
关于乔丹在企业界的发展轨迹,参见Vernon E.Jordan,Jr.'s autobiography,with Annette Gordon-Reed,Vernon Can Read(A Memoir)(New York:Public Affairs,2001)一书的第12章和前面引用的戴维斯,柳和贝克的工作。
关于网络在硅谷的强大力量,参见Emilio J.Castilla,Hokyo Hwang,Ellen Granovetter,and Mark Granovetter,“Social Networks in Silicon Val-ley,”in The Silicon Valley Edge:A Habitat for Innovation and Entrepreneurship,ed.Chong-Moon Lee,William E Miller,Marguerite Gong Hancock,and Henry S.Rowen(Cambridge,England:Cambridge University Press,2001),218-247。
Walter W.Powell,Douglas White,and Kenneth W.Koput,“Dynamics and Movies of Social Networks in the Field of Biotechnology:Emergent Social Structure and Process Analyses,”(preprint,April 12,2001)。
有关制药业网络的详细数学分析,参见M.Riccaboni,E Pammolli,and G.Caldarelli,“Complexity of Connections in Social and Economical Structures”(preprint,2001)。
关于经济领域小世界的另外一个例子,参见Bruce Kogut and Gordon Walker,“The Small World of Germany and the Durability of National Networks,”American Sociological Review 66(2001):317-335。
除了无尺度之外,网络经济还呈现出聚团性。首先是地缘聚团,表现为公司和当地消费者之间有更多的联系。全球化,这个过去十年的流行词,实际上意味着公司需要建立长距离的、跨越地理界限的联系——即公司需要在全世界寻找消费者和供应商。其次是行业聚团——同一个市场或商业领域的公司共享很多链接。这种链接虽然也受地缘的影响,但却能够轻易地跨越遥远的距离。最近,经济的聚团性质受到了很多关注,参见Bruce Kogut and Gordon Walker,“The Small World of Germany and the Durability of National Networks,”American Sociological Review 66(2001):317-335。他们调查了德国公司的权属关系,绘制出了500家非金融公司、25家银行和25家保险公司之间的链接关系。在该网络中,两家公司如果被同一个人拥有,它们之间就有一条链接。最终得到的网络和演员网络很相似,演员对应着公司,电影对应着公司的所有者。一个典型的所有者通常拥有多家公司,就如同一部电影里有很多演员一样。对该公司网络的分析清晰地表明,德国公司之间形成了小世界网络。该网络的直径是4.81,也就是说,大多数公司通过由四个所有者形成的链条就能彼此相连。科洛特和沃克也发现了很高的聚团系数。如果这些公司之间形成了随机网络,某个公司的两个邻居之间存在链接的可能性是0.5%。相比之下,在真实网络中,任何公司的两个邻居拥有共同所有者的可能性为67%。这是一个显著的差别,说明了经济系统具有高度的聚团性。
Walter W.Powell,“Inter-Organizational Collaboration in the Biotechnology Industry,”Journal of Institutional and Theoretical Economics 512(1996):197-215。
艾克斯-马赛大学的阿兰·科曼(Alan Kirman)是最早提出将经济系统看作演化网络的人之一。他的论文对当前经济思维的缺点和网络在经济理论中的作用进行了精辟的论述。参见“The Economy as an Evolving Network,”Journal of Evolutionary Economics 7(1997):339-353;“Aggregate Activity and Economic Organization,”Revue europeenne des sciences sociales 37,no.113(1999):189-230;and“The Economy as an Interactive System,”in The Economy as an Evolving Complex System II(Proceedings of the Santa Fe Institute Studies in the Sciences of Complexity,vol.27),ed.W.Brian Arthur,Steven N.Durlauf,and David A.Lane(Reading,MA,Addison-Wesley,1997),491-532。
亚洲经济危机受到了媒体的广泛报道和很多学术论文的关注。关于该事件的逐日恶化,参见努里埃尔·鲁比尼(Nouriel Roubini)维护的网站。努里埃尔·鲁比尼是纽约大学斯特恩商学院经济和国际贸易专业的副教授,他网站的标题是“Chronology of the Asian Currency Crisis and Its Global Contagion”,网址是http://www.stern.nyu.edu/~nroubini/asia/AsiaChronology1.html。关于危机起源的讨论,参见Giancarlo Corsetti,Paolo Pesenti,and Nouriel Roubini,“What Caused the Asian Currency and Financial Crisis?”Japan and the World Economy,Sept.1999,305-373。
Economic Report of the President(Washington,D.C.:U.S.Government Printing Office,1999)。
Paul Krugman,What Happened to Asia?(January 1998)http://web.mit.edu/ krugrnan/www/DISINTER.html。
关于外包的影响以及思科、康柏和网络经济其他倡导者的故事,详细的讨论参见Bill Lakenan,Darren Boyd,and Ed Frey,“Why Cisco Fell:Outsourcing and Its Perils,”Strategy+Business(3rd quarter 2001):54-65。
Hotmail的故事是由史蒂夫·尤尔韦特松(Steve Jurvetson)讲述的,他是为Hotmail提供启动资金的风险投资公司的合伙人,该故事参见"Turning Customers into Sales Force,”Business 2.0,Nov.1,1998。See also the portrait of Sabeer Bhatia in“Driving Ambition”Asiaweek.com,http://www.asiaweek.comiasiaweek/technology/990625/bhatia.html。
注意,学术界对经济网络的研究兴趣日益浓厚。关于该领域研究工作的一些代表性例子,参见Matthew O.Jackson and Alison Watts,“The Evolution of Social and Economic Networks,”Journal of Economic Literature(in press,2001);Alison Watts,“A Dynamic Model of Network Formation,”Games and Economic Behavior 34(2001):331-341;Matthew O.Jackson and Alison Watts,“On the Formation of Interaction Networks in Social Coordination Games,”Journal of Economic Literature(in press,2001);Venkatesh Bala and Sanjeev Goyal,“A Noncooperative Model of Network Formation,” Econometrica 68(2000):1181-1229;“Learning,Network Formation and Coordination”(preprint);and“A Strategic Analysis of Network Reliability,”Review of Economic Design 5(2000):205-228;Nigel Gilbert,Andreas Pyka,and Petra Ahrweiler,“Innovation Networks:A Simulation Approach,”Journal of Artificial Societies and Social Simulation 4,no.3(2001);Lawrence E.Blume and Steven N.Durlauf,The Interactions-Based Approach to Socioeconomic Behavior,http://www.ssc.wisc.edidecon/archiveiwp2001.htm;Nicholas Economides,“Desirability of Compatibility in the Absence of Network Externalities,”American Economic Review 78(1989):108-421;“Compatibility and the Creation of Shared Networks,”in Electronic Services Networks:A Business and Public Policy Challenge,ed.Margaret Guerin-Calvert and Steven Wildman(New York:Praeger,1991);“Network Economics with Application to Finance,”Financial Markets,Institutions & Instruments 2(1993):89-97;Nicholas Economides and Steven C.Salop,“Competition and Integration Among Complements and Network Market Structure,”Journal of Industrial Economics 40,no.1(1992):105-123.See also D.McFadzean,D.Stewart,and L.Tesfatsion,“A Computational Laboratory for Evolutionary Trade Networks,”IEEE Transactions on Evolutionary Computation 5(2001):546-560;L.Tesfatsion,“A Trade Network Game with Endogenous Partner Selection,”in Computational Approaches to Economic Problems,ed.H.M.Amman,B.Rustem,and A.B.Whinston(Kluwer Academic,1997),249-269.See also the Websites of Leigh Tesfatsion,http://www.econiastate.eduitesfatsi/netgroup.htm,and Nicholas Economides,http://www.stern.nyu.edu/networks/site.html,那里有很多链接指向关注网络经济的研究人员和论文。
注意,物理学中有一个快速发展的领域,其目标是用定量的方式解释经济学现象,使用的是统计力学的工具。关于该领域的简短介绍,参见Rosario N.Mantegna and H.Eugene Stanley,An Introduction to Econophysics:Correlations and Complexity in Finance(Cambridge,England:Cambridge University Press,2000);Jean-Phillipe Bouchaud,Marc Potters,Theory of Financial Risk:From Statistical Physics to Risk Management(Cambridge,England:Cambridge University Press,2000)。See also J.Doyne Farmer,“Physicists Attempt to Scale the Ivory Towers of Finance,”IEEE Computing in Science and Engineering(Nov.-Dec.1999):26-39。这类网络研究大多关注股价的波动。关于网络和股票市场的关系,参见Hyun-Joo Kim,Youngki bee,Im-mook Kim,and Byungnam Kahng,“Scale-Free Networks in Financial Correlations,-http://xxx.lanl.gov/abs/condmat/0107449。
很多公司都在尝试将网络理念融入到不同的商业模型中。例如,Ecrush.com让用户告诉他们自己暗恋谁。他们会替你向你暗恋的人发送一条内容为“有人喜欢你”的信息,邀请对方也加入进来。如果你暗恋的人进行了登录注册,并把你列为其暗恋的人,程序会自动将你们进行匹配。如果你暗恋的人没有把你列为暗恋对象,就不会知道是谁在暗恋她。ICQ.com是另一个利用网络发展起来的创业公司,号称有1.16亿用户。不过,ICQ.com没有那么野心勃勃,而是要更务实一些。ICQ.com为用户提供一种环境,可以有效地激活用户的链接。利用ICQ这个免费软件,你可以知道你的朋友是否在线,并能够和他们进行即时通信。
关于经济组织和政策制定之间的相互作用,参见P.Cooke and K.Morgan,“The Networks Paradigm:New Departures in Corporate and Regional Development,”Environment and Planning,D:Society and Space 11(1993):543-564。
关于政策网络的讨论,参见David Marsh,ed.,Comparing Policy Networks(Buckingham:Open University Press,1998);Dirk Messner,The Network Society(London:Frank Cass,1997),and Manuel Castell,The Rise of the Network Soci ety(London:Blackwell,1996)。
第15链 一张没有蜘蛛的网
对911袭击事件负有责任的恐怖组织,有关其背后网络的讨论,参见www.orgnet.com,Valdis Kreb's Website。See also Thomas A.Steward,“Six Degrees of Mohamed Atta,”Business 2.0,Dec.2001,63。
有关在网络战争中与网络组织进行斗争的讨论,参见John Ar-quilla and David E Ronfeldt,eds.,Networks and Netwars(Santa Monica,CA:RAND Corp.,2001);and Thomas A.Steward,“Americas' Secret Weapon,”Business 2.0,Dec.2001,58-68。
克里斯托和珍妮·克劳德的研究工作,在很多书籍和专著中都有介绍。参见Jacob Baal-Teshuva,Christo and Jeanne-Claude(Cologne,Germany:Taschen,2001).The“revelation through concealment”phrase comes from David Bourdon,Christo(New York:Abrahams,1970)。
注意,复杂性是一个庞大的学科,包括物理学家、数学家和生物学家在内的很多研究人员都在从不同的方式研究复杂性。许多书籍都有涉及这些方法,参见第一链的注释部分。
后记 复杂网络的未来
关于网络在生物学中的应用,一篇最近的综述参见Nature Insight on Computational Biology,a collection of articles published in Nature 420(2002):205-251。关于万维网等复杂信息网络的搜索,参见Lada A.Adamic,Rajan M.Lukose,and Bernardo A.Huberman,“Local Search in Unstructured Networks,”in Handbook of Graphs and Networks:From the Genome to the Internet,edited by S.Bornholdt and H.G.Schuster(Berlin:Wiley-VCH,2002);L.A.Adamic,R.M.Lukose,A.R.Puniyani,and B.A.Huberman,“Search in Power-Law Networks,”Physical Review,E 64(2001):046135。关于Gnutella网络上的搜索,参见Matei Ripeanu,Ian Foster,Adriana Iamnitchi,“Mapping the Gnutella Network:Properties of Large-Scale Peer-to-Peer Systems and Implications for System Design,”IEEE Internet Computing Journal 6(2002):50-57。关于漫画角色形成的网络结构,参见R.Alberich,J.Miro-Julia,and F.Rossello,“marvel Universe Looks Almost Like a Real Social Network,”http://xxx.lanl.gov/abs/condmat/0202174。
书中正文部分引用的免疫学家是海因茨-甘特·蒂勒,他是德国汉堡大学免疫学系的前主任。相关内容参见H.-G.Thiele,“contemplations on the Paradigm of Self and Nonself Discrimination and on Other Concepts Ruling Contemporary Immunology,”Cellular and Molecular Biology 48(2002):221-236。
关于网络研究的最新进展,参见Handbook of Graphs and Networks:From the Genome to the Internet,edited by S.Bornholdt and H.G.Schuster(Berlin:Wiley-VCH,2002);S.N.Dorogovtsev and J.F.E Mendes,Evolution of Networks:From Biological Nets to the Internet and WWW(Oxford:Oxford University Press,2003)。
有关CNN对多任务的报道,参见Porter Anderson,“Study:Multitasking Is Counterproductive(Your Boss May Not Like This One),”http://www,cnn.com/2001/CAREER/trends/08/05/multitasking.study/。关于多任务的最初研究,参见Joshua S.Rubinstein,David E.Meyer,and Jeffrey E.Evans,“Executive Control of Cognitive Processes in Task Switching,”Journal of Experimental Psychology:Human Perception and Performance 27(2001):763-797。
《自然》杂志对科学预言错误的报道,参见Philip Cam-bell,”Tales of the Expected,”Nature 402(1999):C7-C9;J.L.Heilbron and W.E.Bynum,“Plus g.a change,”Nature 402(1999):C86-C88。
关于模块化假设,参见Leland H.Hartwell,Andrew W.Murray,John J.Hopfield,and Stanislas Leibler,“From Molecular to Modular Cell Biology,”Nature 402(1999):C47-C52。也可以参见D.A.Lauffenburger,“Cell Signaling Pathways as Control Modules:Complexity for Simplicity?”Proceedings of the National Academy of Sciences USA 97(2000):5031-5033和C.V.Rao and A.P.Arkin,“Control Motifs for Intracellular Regulatory Networks,”Annual Review of Biomedical Engineering 3(2001):391-419。
我们提出的这个模型有着一段传奇的历史。我以前的论文指导老师塔马斯·维则克(Tamás Vicsek)来自布达佩斯厄特沃什大学,2000年,他在圣母大学报告了他正在进行的研究工作。那时候,我的研究小组都在关注网络,塔马斯问了我们一个很直接的问题:我们是否能够建立一个确定性的网络模型来生成具有固定的、非随机架构的无尺度网络?分形学就是从这种视觉和计算上都很简单和吸引人的模型中获得了明显的好处,塔马斯是分形学的世界级专家之一。然而,我们那时候在几天内能够想出的大多数模型都不行,这些模型生成的网络中都没有枢纽节点。不过,塔马斯在回匈牙利的飞机上提出了一种网络构造方式。我们那时候忙于一些其他的项目,完全忘记了这件事。2001年夏天,为了理解模块性,伊丽莎白·拉瓦茨(Erzsébet Ravasz)和我一起再次开始研究塔马斯提出的问题,却都忘记了塔马斯当时已经给出了该问题的一种解答。我们设计了一个确定性的无尺度网络。几天后,我来到布达佩斯,在和塔马斯会面时,我们意识到,伊丽莎白和我一起设计的模型,与塔马斯一年前提出的模型非常接近。这篇首次探讨确定性的模块化无尺度网络的论文,在几个月后最终发表了。参见Albert-László Barabási,Erzsébet Ravasz,and Tamás Vicsek,“Deterministic Scale-Free Networks,”Physica A 299(2001):559-564。本章描述的模型是稍晚些时候给出的一个版本,参见E.Ravasz,A.L.Somera,D.A.Mongru,Z.N.Oltvai,and A.-L.Barabási,“Hierarchical Organization of Modularity in metabolic Networks,”Science 297(2002):1551-1555。关于该模型和真实网络中的层级结构,更详细的研究参见Erzsébet Ravasz,Albert-László Barabási,“Hierarchical Organization in Complex Networks,”Physical Review,E(in press),http://xxx.lanl.gov/abs/condmat/0206130。
波尔图研究组的论文探讨了层级网络中聚团系数的尺度问题,该论文发表在S.N.Dorogovtsev,A.V.Goltsev,and J.F.F.Mendes,“Pseudofractal Scale-Free Web,”Physical Review,E 65(2002):066122。
关于生物网络的层级组织结构,参见E.Ravasz,A.L.Somera,D.A.Mongru,Z.N.Oltvai,and A.-L.Barabási,“Hierarchical Organization of Modularity in Metabolic Networks,”Science 297(2002):1551-1555.其他系统中的层级组织结构,参见Erzsébet Ravasz and Albert-László Barabási,“Hierarchical Organization in Complex Networks,”Physical Review,E(in press)http://xxx.lanl.gov/abs/condmat/0206130.关于万维网中聚团系数尺度的证据,参见Jean-Pierre Eckmann and Elisha Moses,“Curvature of Co-Links Uncovers Hidden Thematic Layers in the World Wide Web,”Proceedings of the National Academy of Science USA 99(2002):5825-5829。关于互联网的层级结构,参见A.Vazquez,R.Pastor-Satorras,and A.Vespinani,“Large-Scale Topological and Dynamical Properties of the Internet,”Physical Review,E 65(2002):066130。