第三部分 复杂网络的影响

    第10链 病毒和时尚

    之前,人们一直把枢纽节点视为特殊现象,并不清楚它们为什么存在、究竟有多少。社会网络模型也并不支持枢纽节点的存在。但无尺度网络的框架首次为枢纽节点的存在提供了理论依据。我们即将看到,枢纽节点几乎改变了我们对思想、创新和病毒的传播所知道的一切。

    艾滋病“零号病人”

    盖坦·杜加斯(Gaetan Dugas)知道,自己已经拥有了想要的一切。他的衣橱里堆满了来自伦敦和巴黎最时髦商店的精品服装,他的体形健美却不会显得肌肉过于发达,无论在哪个俱乐部里,他都是出类拔萃的。他只需用那迷人的略带加拿大口音的法语说上几句,就能吸引任何他看上的人。“我是最帅的”,他以前经常这么说,而他的朋友们也都同意这一点。但是,他最近不再去那些热闹的迪斯科舞厅和夜总会了,他开始出入雾气弥漫的湾区公共浴室。杜加斯虽然很自恋,但他现在开始喜欢黑暗的场所,因为那里可以藏起他迷人的外表。浴室隔间的长长走廊成了他感觉最舒服的地方。1982年的一个晚上,当他准备从浴室隔间离开时,他打开灯,缓缓转向几分钟前刚认识就立刻发生了性关系的男人,指着自己脸上微微发紫的斑点和疙瘩说:“我得了同性恋癌,就要死了,你也一样。”

    杜加斯是一名法裔加拿大人,曾经是飞机乘务员,他通常被称为艾滋病“零号患者”。这并不是因为他是第一个诊断出得了艾滋病的人,而是因为在1982年4月之前诊断出患有艾滋病的248个人中,至少有40人曾经和他发生过性关系,或是与曾和他有过性关系的人发生过性关系。男同性恋之间形成了一个复杂的性关系网络,而杜加斯就处于这个网络的中心。这个网络横跨北美洲的东西海岸,覆盖旧金山、纽约、佛罗里达和洛杉矶。

    杜加斯处于中心地位绝非偶然。他是北美地区首批被诊断出患有卡波西肿瘤的男同性恋之一。到1983年,事情越来越清楚了,杜加斯和其他数百名男同性恋染上的这种病具有传染性,而杜加斯是第一批知道这件事的人之一。但是,他仍然坚持认为自己只是得了皮肤癌,而癌症是不传染的,所以多年来他从不承认自己会给性伴侣带来任何危险。他对自己的吸引力和性方面的征服力感到非常自豪,后来他向医护人员透露了他性习惯的详尽细节。他说他每年有大约250个性伴侣。有人估计,他的性伴侣总数高达20000。在同性恋俱乐部和公共浴室混迹的十年间,他至少和2500人有过性接触。

    是不是杜加斯把艾滋病带到了北美,目前尚不清楚。他经常去法国旅行,那里有一些最早的艾滋病患者。但是,我们永远无法确切地知道,杜加斯是在法国感染的还是在美国感染的。但是我们知道,北美很多最早的病例都和他有关,他处于这个传染病的源头,而目前已有近2千万人死于这种传染病。

    短短几年间,艾滋病从一个不起眼的、罕见的“同性恋癌”,变成危及北美健康体系的传染病,其间,杜加斯发挥了很大的作用。这个可怕的例子证明了经典的传染病模型不再适用,也证明了枢纽节点在高度流动和连通的社会中的威力。事实上,涉及病毒和传染病时,枢纽节点和普通节点截然不同。

    互联网,让一夜成名的梦想变为现实

    2000年11月8日晚,和数百万其他美国人一样,迈克·柯林斯(Mike Collins)在电视上看到了充满争议的佛罗里达州“蝴蝶选票”的画面。他的第一反应就是:“天哪,他们怎么会不按照箭头所指来点呢?也许我该画幅漫画,让选票更具迷惑性。”26岁的柯林斯来自纽约州的埃尔迈拉,他是一名市政用水的工程师,同时也是一位业余漫画家。他画了一幅只有四条线的漫画,通过电子邮件发送给了30个朋友(如图10-1所示)。

    第三部分 复杂网络的影响 - 图1

    这是迈克·柯林斯的漫画,为了讽刺2000年总统选举时使用的让人迷惑的蝴蝶选票。

    图10-1 佛罗里达州的总统选票

    第二天是他的生日,他姐姐在那天生了个女儿,因此他一整天都不在家。当他晚上回到家时,等待他的是一份大礼:他的页面上有17000个新点击,他的邮箱里有几百封新邮件。他画的这幅漫画完美地表达了人们对2000年总统大选的失望。他出门在外的这一天,这幅漫画传遍了全世界。看到这幅漫画的人都想保存一个副本。从美国到日本,无数报纸和网站都请求他允许自己刊登这幅漫画。在短短的几个小时里,他不再是普通的“迈克”,他一举成名。无数的女孩追求他,无数的父母想要把女儿嫁给他。当总统大选尘埃落定时,柯林斯的漫画或许已经成为过去十年来最广为流传的漫画。他在个人网站上出售的所有物品,从T恤到贺卡,到处都印着他的这幅漫画。这可能是2000年佛罗里达州命运多舛的投票留下的唯一经久不衰的印象。

    迈克·柯林斯的成名之路是经典美国梦的再现。但是,它的不寻常之处是它发生的速度。几十年前,即便是在美国也不会有人能在一夜间成为世界名人。如今情况不同了。我们通常会把这些变化归功于互联网,认为是互联网在酝酿和传播名声。但是,完全用技术来解释是不够的。我们正目睹一些全新的事物,它们可以让思想和时尚以光速传播到每个人。

    复杂网络中的传播规律

    表面上看,盖坦·杜加斯和迈克·柯林斯几乎没有共同之处。前者传播了一种致命的疾病;后者是小城镇的业余漫画家,因一个好想法而出名。艾滋病经过十年的时间从非洲蔓延到全世界,主要通过性行为从一个人传播到另一个人。柯林斯的漫画则是通过点击和电子邮件在一夜之间传遍了全世界。然而,他们有一个重要的相同点:他们都是在复杂网络中传播的例子。高度活跃的同性恋文化的出现,让艾滋病通过20世纪80年代复杂的性关系网络进行传播。我们能够通过电子邮件联系到我们的朋友,这种能力使得选票漫画通过复杂的计算机网络迅速传播。两者都遵循着同样的基本规律,这些规律支配着复杂网络中时尚、思想和疾病的传播。这些规律已经被广泛研究过:

    市场营销主管们研究如何卖出他们的商品;

    社会学家研究如何理解潮流、时尚和骚乱;

    政治学家研究投票模式和政治机遇;

    医生和传染病学家则希望能够抑制埃博拉病毒和周而复始的冬季流感;

    编写计算机病毒的年轻人试图在一夜之间摧毁所有的微软产品;

    系统管理员想方设法避免病毒摧毁他们的系统。

    这些规律被认为是普适的,事实上也的确如此。但我们对复杂网络的新认识促使我们从一个新的视角重新研究这些规律。

    创新者,传播钟形曲线的起点

    1933年,杂交玉米在美国仅有162平方千米的种植面积,到了1939年,已经增至9.7万平方千米,达到全国玉米种植面积的四分之一。杂交玉米给美国种植业带来革命性改变,在不到十年的时间里席卷整个美国中西部地区。其中,艾奥瓦州是最早接受杂交玉米的州。这一新品种在1929年才出现,但艾奥瓦州在1939年已经有75%的玉米种植区在种植杂交玉米。这个快速的扩张过程,加上农场主们详细的种植记录,为研究创新如何传播提供了第一手资料。1943年,艾奥瓦州立大学的布赖斯·瑞恩(Bryce Ryan)和尼尔·克劳斯(Neal C.Cross)开始了这项研究。

    在采用某种创新之前,我们一般会先问自己几个简单的问题:我应该花时间去评估这种新产品吗?应该为它花钱吗?我怎么知道它会不会像承诺的那样好用?这些问题在选择杂交玉米时也会遇到。要采用杂交玉米,农场主需要投资购买新种子以取代他们已经拥有的种子。虽然这种转换有可能会带来更好的收成,但是没人能够保证这些额外的收成能够抵消前期的投资。这种风险对早期采用者尤为重要。即便如此,还是有一些愿意承担风险的人,是他们让杂交玉米最终在艾奥瓦州扎下了根。今天,我们把这些人叫做“创新者”。

    每个人都认识一些创新者。他们是我们身边第一时间购买苹果牛顿掌上电脑(Newton Handheld Computer)的熟人——不过后来发现这个新产品并没有厂商声称的那样好。几年后,他们是第一批在Palm Pilot灰乎乎的屏幕上玩手写输入的人——这一次,他们开启了掌上电脑革命的新纪元。他们是在流行时尚成为主流之前就开始尝试的年轻人,是在新想法通过书籍、电影和杂志传播给我们之前把这些想法构思出来的艺术家和知识分子。在艾奥瓦州,他们就是在与销售代表交谈以及阅读宣传册之后就能下定决心试种新种子的农场主。

    瑞恩和克劳斯发现,如果把每年新增的采用新品种的农场主数量画成曲线,该曲线会先快速上升到极大值,然后又快速下降,形成一条钟形曲线。一种新产品如果通过了创新者的测试,借助他们的推荐,就会到达早期采用者的手中。接下来会有大量的早期追随者,直到达到最终采用者人数的一半为止。过了该时间点,新采用者的增长数量开始下降,那些做决定较慢却被大量有利证据说服的人开始采用。后期的追随者是那些看到四周全是杂交玉米而最终信服的人。该曲线最终以少数最磨蹭的人结尾,这些人在发现自己是明显的少数派时才加入进来。

    瑞恩和克劳斯观察到的钟形曲线不仅可用于描绘艾奥瓦州的农场主,它还刻画了大多数创新的传播过程,为市场营销和规划专家预测产品需求提供了有力工具。不过,该曲线并不能回答当今的流行病学家和首席执行官们想知道的一个问题:如果有的话,社交网络在病毒和创新的传播中到底发挥了什么作用?

    意见领袖的力量

    1954年,哥伦比亚大学应用社会研究中心的研究人员艾利休·凯茨(Elihu Katz)发起了主题为“社交关系对行为的影响”的研究倡议。医药巨头辉瑞公司(Pfizer)的市场研究主任恰好是哥伦比亚大学的校友,他正迫切地想知道医师采纳一种新药的过程,于是为凯茨及他的同事詹姆斯·科尔曼(James Coleman)和赫伯特·门泽尔(Herbert Menzel)提供了40000美元,资助他们追踪四环素(tetracycline)的传播过程——20世纪50年代中期推出的一种强力抗生素。

    科尔曼、凯茨和门泽尔采访了伊利诺伊州一个小镇上的125名医生,让他们分别写下自己最经常与之讨论行医实践的三个人,自己最常向其询问用药建议的三个人,以及自己认为是朋友的三个人。借助这些名单,他们建立起一个医药圈社交关系与影响力的复杂网络。

    结果表明,医生之间大有不同。被大部分同事认为对自己的日常决策有重要影响的医生只有少数几个。他们是医药圈里的枢纽节点。其余大多数人的作用都非常小。在四环素的推广过程中,和未被任何人提起的医生相比,那些被三个以上医生视为朋友的医生采用四环素这种新药的可能性要高出三倍。

    利用药店的处方记录,研究人员能够追踪医药沿着社会关系传播的过程。结果表明,早期采用者和早期追随者都是拥有大量社会关系的知名医生。这些高度连接的医生更有可能接触到创新者,从而更快地了解这种新药。新药一旦被这些医生采纳,就可以从这些枢纽节点传播到连接度较低的医生那里,他们就是后期的追随者。最后才是那些顽固派,他们会拒绝使用新药直到最后。

    辉瑞公司的研究表明,创新由创新者传播到枢纽节点,然后从枢纽节点将信息沿着大量的链接传播出去,传达给特定社会群体或职业圈子里的多数人。作为无尺度网络的重要组成部分,枢纽节点是数量少、连接度高的个体,他们将整个社会网络连接在一起。在艾滋病流行中,同性恋飞机乘务员盖坦·杜加斯显然是一个主要的枢纽节点。四处旅行、身边有一圈朋友与追随者的保罗,也是早期基督教最有影响力的枢纽节点。

    链接洞察

    枢纽节点在营销中通常被称为“意见领袖”、“强力用户”或“有影响力的人”。和普通人相比,他们能够就某个产品和更多的人交流。借助大量的社会关系,他们能够最先觉察和应用那些创新者的经验。尽管他们自身未必是创新者,但是他们对创新的接受却是发起新想法或创新的关键。枢纽节点如果抵制新产品,就会形成一面无法穿透并深有影响的墙,创新只能以失败告终。如果枢纽节点接受新产品,他们会影响一大批人接受新产品。

    社会学家和营销专家早就知道这些意见领袖的存在。然而,之前他们一直把枢纽节点视为特殊现象,并不清楚他们为什么存在、究竟有多少。社会网络模型并不支持枢纽节点的存在。无尺度网络的框架首次为枢纽节点的存在提供了理论依据。我们即将看到,枢纽节点几乎改变了我们对思想、创新和病毒的传播所知道的一切。

    先发未必先至

    1993年,苹果公司推出的牛顿掌上电脑是从百事可乐跳槽过来的首席执行官约翰·斯库利(John Sculley)的创意,虽经过公司努力的推广,但最终也没能热销。不过,它引领了一场革命。

    如今,市面上流通着数百万部掌上设备。虽然数字已经很大,但很多人仍然认为我们尚处在市场占有率钟形曲线的前端。对于苹果公司而言,不幸的是这些掌上设备没有一个是牛顿掌上电脑。Palm,Handspring,各种型号的Pocket PC,以及数不清的类似产品已经占领了苹果曾梦想占领的领地,这一事实有力地证明了先来者未必有先发优势。牛顿掌上电脑融合了多种新技术,是一种前所未有的产品,曾被寄予厚望。然而,事实证明,获得成功并没有那么容易。厄运开始于讥讽其糟糕的手写识别能力的一系列报道。随后,又有人指出它的电池只能使用20分钟。失望接踵而至,牛顿掌上电脑的重新设计版本MessagePad的销量在1995年仅达到85000部,令人大失所望。三年后,史蒂夫·乔布斯重任苹果首席执行官。为了减少亏损,这个产品被放弃了。

    牛顿掌上电脑和其他许多产品的失败需要一个解释。为什么某些发明、流言和病毒能够蔓延全球,而其他的却只能局部扩散或者干脆消失呢?这些赢家和输家之间为什么会有区别,而区别又在何处呢?显然,其中的缘由并不能简单地归结于广告宣传。毕竟,在苹果强大的营销机构支持下,牛顿掌上电脑还是倒下了。一个价值十亿的问题是:我们如何预先判断一个产品的成败?

    传播速率与关键阈值

    为了解释时尚和病毒的流行与消失,社会学家与流行病学家发明了一种非常有用的工具,叫做“阈值模型”。每个人接受创新的意愿有强有弱。一般而言,只要有足够充分的正面证据,每个人都能被说服接受一种新思想。不过,不同的人需要的证据的强弱程度不同。考虑到这种差异,扩散模型中为每个人赋予一个阈值,来量化这个人接受某个创新的可能性。例如,那些在牛顿掌上电脑发布之后就购买了产品的人,其阈值接近于零。不过,大多数人在刷信用卡之前都想先看看这种新产品是否好用,因此大多数人的阈值都高于零。

    虽然不同的扩散模型在目的和细节上存在明显的不同,但所有模型都在预测同一个现象:每种创新都有一个确定的“传播率”,表示人们在接触到该创新之后采纳它的可能性。例如,传播率包括你在见到一种新型掌上设备后立即购买它的可能性。不过,只知道传播率并不足以决定一种创新的命运。因此,我们必须计算“临界阈值”,该值是由创新传播网络自身的性质决定的。如果一个创新的传播率低于临界阈值,它很快就会消亡;如果传播率高于该阈值,接受该创新的人数将会呈指数增长,直到所有潜在接受者都接受为止。

    在对传播和扩散的理解方面,最重要的概念性进步可能是,认识到了时尚与病毒传播的必备条件是传播率要超过临界阈值。如今,临界阈值的概念出现在每一种扩散理论中。

    流行病学家在建模一种新型疾病变成流行病的概率时使用了临界阈值,艾滋病就是一个例子。

    营销学的教科书会在估计产品畅销的可能性以及解释产品滞销的原因时讲到临界阈值。

    社会学家用临界阈值来解释节育方法在女性间的扩散。

    政治学家用临界阈值来解释政党与运动的生命周期,并用它建模和平示威变成暴力冲突的概率。

    几十年来,遇到传播问题时,我们基本都采用这种简单而有效的范式。如果要估计一种创新的传播可能性,我们只需要知道它的传播率和它面临的临界阈值。没有人对这种方法提出过质疑。不过,最近我们了解到,某些病毒和创新无视这种范式。

    爱虫病毒的扩散

    迄今为止最有破坏力的病毒——爱虫病毒(Love Bug)从菲律宾出发,数小时内就到达全世界所有使用计算机的角落。2000年5月8日,随着太阳的升起,一块大陆接着一块大陆上的计算机接连中招——这是一场席卷东西方的全球多米诺骨牌效应。香港的第一批受害者还没有得到计算机安全专家的协助,德国一家知名报社的系统管理员就眼睁睁地看着2000多张电子照片被病毒吞噬了。在比利时,ATM机系统被破坏,焦急的客户取不出钱。一小时后醒来的伦敦市民发现议会被迫关门了。从欧洲再度出发之前,这种病毒已经让瑞典、德国和荷兰多达70%的计算机瘫痪。惨剧继续在美国上演,病毒钻进了华盛顿的国会大楼,感染了80%的联邦部门,包括国防和政府机构,并且关闭了布什竞选总统使用的电子邮件系统。

    爱虫病毒破坏了全球4500万台计算机,造成了100亿美元的损失。爱虫病毒是一个精心设计的、无人能抗拒的心理陷阱。看到一个标题为“致你的情书”的邮件,你怎么会不立即打开呢?如果你向这种冲动妥协了,那么被激活的病毒将从你的硬盘上删除一堆文档,尤其是含有数字图片和音乐的jpeg和mp3文件。接下来它会寻找微软的Outlook Express电子邮件程序。如果找到了,它将把新复制的情书发给你通信录里保存的朋友和熟人。

    菲律宾的理查德·程(Richard Cheng)和马里尔·索里亚诺(Maricel Soriano)编写了阻挡爱虫病毒入侵计算机的反病毒程序之后,惨剧得以缓和。但爱虫的神奇之处在于,虽然反病毒程序到处都能免费获得,这种病毒仍然存活着。记录病毒出没信息的网站Virus Bulletin显示,在2001年4月,爱虫仍然在最活跃的病毒排行榜上名列第七——这已经是针对它的杀毒程序发布一年之后了。我在2001年7月还收到一封含有爱虫病毒的邮件。

    对此,人们倾向于认为是爱虫过于凶险,所以才无法完全清除。然而,凶险并不足以解释它的持续存在。物理学家罗莫尔多·帕斯特-萨托雷斯(Romualdo Pastor-Satorras)和亚历山德罗·维斯皮那尼(Alessandro Vespignani)证明了,和阈值模型的预测不同,在真实网络中,高度凶险并不能保证病毒传播开来。

    无尺度网络中的传播规律

    的里雅斯特(Trieste)是独具特色的意大利北部小镇,历史复杂而纷乱,这里坐落着著名的国际理论物理中心。该中心由诺贝尔奖得主,巴基斯坦物理学家阿卜杜勒·萨拉姆(Abdus Salam)创立并经营数十年,为第三世界的物理学家提供安定并有智力挑战性的研究场所,让他们在这里和全世界的同行建立联系。1999年,西班牙物理学家罗莫尔多·帕斯特-萨托雷斯在回到巴塞罗那任教授之前,曾在该中心进行了为期两年的博士后研究。2000年夏,他回到的里雅斯特进行为期两个月的访问,并计划完成他上次在这里没有做完的几个研究项目。这些研究项目是他和他当时的指导老师亚历山德罗·维斯皮那尼一起发起的。在整理一篇新论文的参考文献时,他们偶然发现了一篇题为《计算机病毒研究中的开放问题》(Open Problems in Computer Virus Research)的论文,该论文的作者是IBM的计算机病毒专家史蒂夫·怀特(Steve R.White)。这篇论文论述了受生物学启发而提出的流行病模型并不能很好地描述爱虫病毒和其他计算机病毒的传播。

    受该发现的吸引,研究人员决定更仔细地研究病毒传播问题。利用计算机病毒预防网站“病毒公告板实验室”(Virus Bulletin)的记录,他们确定了病毒在出现之后若干个月仍然存活的概率。结果令人惊讶:大多数病毒的生命期在6到14个月之间。也就是说,病毒在首次出现一年多之后,还在感染新的计算机,这要比预期的消亡时间长很多。正如帕斯特-萨托雷斯和维斯皮那尼所说:“病毒典型的活跃时间相比杀毒软件出现的时间(一般在第一例病毒感染被报告之后的几天或几周内)要长很多。”就像木乃伊那样,病毒会从石棺中反复醒来,永不停息。

    研究者常用标准阈值模型的各种版本描述计算机病毒的传播。在这些模型中,每台计算机要么健康,要么被感染。在每个时间段里,一台健康的计算机如果和一台被感染的计算机有接触,就有可能感染病毒。被感染的计算机被“治愈”之后,依然能够被再次感染。假定计算机是随机连接在一起的,这种模型刻画了病毒传播的经典情形:传染性超过临界阈值的凶恶病毒能够传播给大多数计算机。相反,如果病毒的传染性低于该阈值,新感染的计算机数量将迅速减少,直到病毒消失。

    2000年8月,帕斯特-萨托雷斯和维斯皮那尼得出了结论:怀特是正确的,计算机病毒并不服从经典流行病模型的预测。不过,他们还不了解这种差异出现的原因。也许是运气使然,我的研究组关于“互联网的阿喀琉斯之踵”的论文恰好在那一周登上了《自然》杂志的封面。在读过该论文之后,他们豁然开朗,找出了缺失的环节:互联网上的计算机并不是随机连接在一起的。承载病毒传播的网络具有无尺度拓扑。因此,计算机病毒应该在无尺度网络上进行建模,而不是像先前的研究那样在随机网络上建模。帕斯特-萨托雷斯和维斯皮那尼立即进行了尝试,他们第一次在真实的无尺度网络上研究扩散现象。结果非常让人吃惊:在无尺度网络上,传染阈值奇迹般地消失了!这就是说,即便病毒不那么具有传染性,仍然能够传播和存活。这颠覆了过去五十年关于扩散的研究积累下的所有结论,无尺度网络上传播的病毒根本没有碰到任何阈值,它们是不可阻挡的。

    链接洞察

    这种高度异常的行为源自互联网不均匀的拓扑。无尺度网络是由枢纽节点主导的。由于枢纽节点连接着数量巨大的其他计算机,所以被其中一台计算机感染的机会很大。而枢纽节点一旦被感染,就会把病毒传染给所有与它连接的计算机。因此,高度连接的枢纽节点为病毒的持续存活和传播提供了独一无二的便利。虽然凶恶的病毒在任何网络中都能快速到达所有节点,但相对温和的病毒在无尺度环境下也有很大的概率存活下来。

    这些结果不仅适用于计算机病毒。对帕斯特-萨托雷斯和维斯皮那尼所用的模型进行一些修改,就可将之用于描述思想、创新和新产品的传播以及流行病的扩散。近似来看,该模型同样刻画了宗教传播的过程:作为高度连接且四处活动的枢纽节点,保罗在将早期基督教的信仰传播给尽可能多的人时发挥了重要作用。思想和创新沿着社会网络中的链接在人与人之间传播。由于社会网络具有无尺度拓扑,在计算机病毒那里观察到的异常也会出现在这些系统中。

    无尺度拓扑,病毒得以传播和存活的基础

    在我们每个人所拥有的数百个社会链接中,只有少数几个能达到可以传播性病的亲密程度。因此,艾滋病是在高度互联的社交网络中一个非常稀疏的子网络上传播的。再加上这种疾病相对较低的传染性,按常理来说,这种流行病早就应该消失了。但实际上,艾滋病已经感染了大约5000万人,而且这个数字还在不断增加。我们很容易会想到的里雅斯特的研究成果,把艾滋病的快速传播归因于社会网络的无尺度拓扑。但是,并非所有的社会关系都对应着性链接,于是我们会问,承载这种致命疾病的性关系网络的拓扑是什么样的呢?

    2000年11月下旬的某一天,瑞典斯德哥尔摩大学的社会学博士生卡丽娜·穆德·罗曼(Carina Mood Roman)在不断尝试着理解她在课后作业中观测到的极端不对称的误差。她对一组瑞典人进行研究,预测他们的性伴侣数量。瑞典是第一批在法律上允许未婚夫妇同居的国家,那里的性观念相对开放。同时,瑞典还有着优良而覆盖面很广的医疗和社会保障。艾滋病在北欧出现之后,瑞典研究人员开始了关于性接触的广泛研究,希望找出能有效减缓其传播的手段。

    获取人们之间的性关系网络几乎是不可能的。如果我问你跟哪些人发生过性关系,而且你知道我还会找到他们再接着问下去,你会愿意告诉我吗?幸运的是,我们不需要完整的性关系网络就能判定其是无尺度的还是随机的。我们需要知道的只是度分布,这可以通过向有代表性的社会子集询问他们各自有几个性伴侣来完成。这样,就不必让受访对象讲明每个性伴侣的身份,任务的难度也大大降低了。1996年,瑞典科学家对4781个年龄在18到74岁的随机个体发放了数千张调查问卷,收集他们的性习惯信息,最后收回了59%的问卷。这样,他们得到了瑞典性关系网络上2810个节点的链接数量。

    如今,这份数据经常用于让学生测试各种统计方法。罗曼当时就有这份数据,她请室友弗雷德里克·里耶罗斯(Fredrik Liljeros)帮她解读误差曲线。

    里耶罗斯当时刚开始进行社会学研究,他被一系列数学社会学的讲座深深吸引,投身到数学社会学领域,专注于研究社会组织的演化。这样的研究让他掌握了很多数学工具和概念,包括自组织和幂律。

    虽然是典型的北欧人,但研究热情一旦迸发,二十来岁的里耶罗斯就没有了他的同胞所具有的沉默和保守。“这看起来像幂律!”他看到罗曼屏幕上的曲线之后,冲着室友喊道。他没有继续帮她完成作业,而是要走了数据去验证他的猜测。然后,他把数据通过电子邮件发给了曾与他合作的波士顿大学的路易斯·阿马拉尔(Luis Amral)。阿马拉尔当时刚开始关注复杂网络的研究,并发表了一些有关无尺度网络建模的开创性论文。阿玛拉尔立刻就发现,里耶罗斯发给他的数据包含了关键的信息,能够回答我们先前提出的问题:性关系网络的拓扑是什么样的?

    性习惯的相关研究都面临着严重的记忆偏差问题,相比而言,男人似乎能记住更多的性伴侣。因此,瑞典这次研究中的受访者首先被问道的问题是:上一年内他们有多少个性伴侣。这个问题的答案可能会准确一些。很显然,如果问他们整个人生中的性伴侣总数,每个人的回答都会受到破碎的记忆与期望的影响。虽然存在潜在的偏差,结果却是一致的:大多数受访者一生中的性伴侣个数介于1和10之间,有些人则有几十个或更多,少数人甚至有几百个。无论是只考虑一年之内的还是考虑一生的,无论是男人还是女人,分布都服从幂律。综上所述,这些数据强有力地证明:性关系网络具有无尺度拓扑。后来,以美国人为对象的调查验证了这一结论。

    表面上看,盖坦·杜加斯保持着每年250个性伴侣的纪录。然而,威尔特·张伯伦声称他和20000个女性发生过性关系,这个让人惊愕的数字远远超出了杜加斯的纪录。

    “没错,的确如此,是20000个不同的女性,”他写道,“如果从我15岁开始算起,到我现在的年龄,相当于每天和1.2个女人发生过性关系。”这位NBA名人堂里的名人因混乱的性生活招致了很多人的批评。

    不过,斯德哥尔摩-波士顿的合作研究发现,张伯伦并不是唯一的。无尺度拓扑意味着,虽然大多数人只有少数几个性链接,但整张性接触网是通过一系列高度连接的枢纽节点连接在一起的。他们都是威尔特·张伯伦和盖坦·杜加斯,拥有数目惊人的性伴侣。

    链接洞察

    考虑到这些结果,的里雅斯特的预测提供了关于艾滋病流行的新观点。这种致命的病毒必然走了一条新事物与计算机病毒传播过程中已经走过的路:枢纽节点因其大量的性接触成为最早被感染的那一批;一旦被感染,他们迅速再度感染其他成百上千人。如果我们的性网络是同构的、随机的网络,艾滋病或许早就消亡了。艾滋病面对的无尺度拓扑使得该病毒可以传播和存活。

    优先治疗枢纽节点,优先对付“毒王”

    1997年,艾滋病死亡人数首次下降,我们以为最坏的时候已经过去。但是,我们错了。现在,全球每天都有15000人感染艾滋病。他们中的大多数都会在十年内死去。如今,如果你是博茨瓦纳(Botswana)一名15岁的年轻人,你今生因感染艾滋病而死去的可能性接近90%。事实上,从这里或其他撒哈拉以南的非洲国家找出一个将来不会被艾滋病夺去生命的年轻人实在是太难了。虽然市面上已经出现了一些相对有效的艾滋病治疗办法,但这种情形的确是事实。实际上,这些治疗办法中,没有哪一个能根治这种疾病。但是,每个治疗办法都确实能够让艾滋病变成慢性病,从而让大多数病人可以活到自然死亡。最大的问题在于,每年15000美元的治疗费用对于欧洲和北美以外的大多数国家来说太昂贵了。

    非洲遭遇的危机最严重。问题不仅仅是大多数非洲国家负担不起昂贵的药物。即便药物价格下降,这些国家也缺乏分发药品和监督治疗的基础设施。在20世纪,艾滋病已经成为令人恐怖的著名杀手。通过宣传以及比尔·盖茨和众多公众人物的支持,抵抗艾滋病运动已经得到了关注,大型医药厂商被迫以成本价向贫穷国家提供药品。然而,这只是第一步。很显然,即便有多达几十亿美元的国际援助,即便只需要支付成本价,还是没有足够的费用为每个人购买治疗药物。那么,先治疗哪些人呢?

    艾滋病早期的传播方式主要是同性性交,如今的主要传播方式则是异性性交。正如我们前面所言,枢纽节点在传播过程中发挥着关键作用。枢纽节点的独特作用为我们提供了一个大胆而冷酷的解决方案:由于资源有限,应该只治疗枢纽节点。也就是说,如果存在治疗方案,但没有足够的钱提供给每一个需要的人,那就应该主要提供给枢纽节点。这是最近两项研究得出的结论,一项研究来自帕斯特-萨托雷斯和维斯皮那尼,另一项研究来自我研究组的研究生佐尔丹·戴索(Zoltán Dezsö)。这些研究结果表明,如果我们为度大于某个预设值的所有节点提供治疗,无论我们将预设值设定成多少,传播阈值都会变成一个有限的值。我们治疗的枢纽节点越多,传播阈值就越高,病毒消亡的可能性就越大。

    问题是我们无法确切地知道谁是枢纽节点。因此,佐尔丹·戴索和我开始着手解决一个更为困难的问题。虽然我们不知道如何准确找出枢纽节点,但是几十年的社会学研究为我们提供了有效的方法,来识别给定社区里的高危群体以及最可能是传染源的个体。社会地位、年龄、职业和许多其他因素都发挥着作用。因此,我们能以一定的概率找到枢纽节点。确实有很多枢纽节点会被漏掉,也会有一些非枢纽节点被误当成枢纽节点。但是,我们仍然需要知道这种不完美的方法是否有用。无法准确地识别出枢纽节点,我们是否仍能找出传播阈值呢?为回答该问题,我们假定,节点并不是随机治疗的,而是让医疗机构按照有偏的策略选择节点进行治疗:让那些性关系链接数多的节点比链接少的节点有更高的概率得到治疗。这种基于概率的方法让我们可以将“有针对性地识别和治疗高度连接的节点”的治疗方案和“随机选择节点进行治疗”的治疗方案进行对比。佐尔丹·戴索对比之后发现了让人意外的结果。没错,随机治疗方案具有零阈值,病毒无法阻止。不过,任何偏向于选择链接数高的节点进行治疗的策略,哪怕略微偏向一些,都能得到一个有限的传播阈值。也就是说,即便我们找不到所有的枢纽节点,只要我们偏向于选择枢纽节点进行治疗,一样能降低疾病的传播率。

    任何选择性策略都会引发重要的伦理问题。实际上,我们的研究结果表明,当面临有限的资源时,有选择的治疗策略最终是鼓励混乱的性生活:一个人的性伴侣越多,被我们选出来进行治疗的可能性就越大。我们在选择和治疗性生活混乱的个体方面做得越好,会感染这种疾病的人越少。我们准备好为了整体的利益而放弃那些链接数少的病人了吗?我们准备好把药物提供给链接数高的贫穷妓女,而不是更富裕但链接数少的中产阶层了吗?

    有一种解决方案让这种伦理争论变得更学术一些:疫苗。现在,整个世界在艾滋病疫苗研究上的投入仅为3.5亿美元。相比于美国和欧洲每天花费在艾滋病药物上的30亿美元以及单个战斗机就价值十几亿美元的军费,这点钱实在算不上什么。在我们不断与优先权角力的同时,我的感觉是,我们还需要竭尽所能去阻止这种疾病的传播,哪怕是要鼓励混乱的性生活。

    社会网络的变化影响传播与扩散规律

    自从艾奥瓦州的开创性研究以来,我们对产品成败、流行病和时尚的理解有了明显的进步。在最近几十年,这个课题有了非常高的多元化趋势。我们已经知道了,研究新玉米品种的采纳有助于理解艾滋病的传播和畅销产品的出现。我们已经知道了,虽然每个扩散过程都有随机性,但是它们都服从精确的数学语言描述的规律。而且,我们已经开始理解,社会网络在这些过程中发挥的重要作用。

    不过,最近50年发生了许多变化。随着传真机、电子邮件等高速通信设备的普及,世界范围的社会网络得到了爆炸式发展,将我们以史无前例的程度联系在一起。我们迫切地想知道,社会网络的这种变化会如何影响扩散的规律。在这个持续运动的世界中,随着生化恐怖主义的威胁扩大以及艾滋病的持续扩散,我们非常需要预测和跟踪致命病毒的行踪,因为感染的个体可以登上一架飞机,迅速将局部流行病变成全球瘟疫。在这个对计算机的依赖不断扩大的世界里,已经有人造出不受国界束缚的新型病毒。爱虫的各种变形体不仅是令人讨厌的破玩意儿,还代表着对我们人身安全和生活方式的巨大威胁,很容易造成致命的危险。由于它们的滋生,一类新的流行病学家出现了,他们就是时刻关注着网上空间健康状态的计算机安全专家。

    创新以及生物或计算机病毒在枢纽节点主导的异质网络上传播。的里雅斯特的研究意味着,有关传播和扩散的知识我们还知之甚少。我相信,迄今得到的结论只是冰山一角。尽管传播和扩散具有普适性质,同时单个系统也具有一些独特性质,而且这些性质的重要性不亚于普适规律,但如果有人说计算机病毒的传播模型可以直接用于刻画艾滋病的流行,那一定是在自欺欺人。要对疾病的传播做出精细的预测,模型就必须含有关于流行病的具体细节。这仍然是个未实现的遥远梦想。不过,清楚理解传播和扩散所服从的基本规律是迈向成功的必要一步。最近,该领域的突破刺激着我们重新审视从营销到流感传播的老问题,并且严谨地检查原有的假设。沿着这一路径,我确信我们将收获更多的惊喜和潜在的突破。

    最近,互联网提供的丰富数据,使得传播和流行病的研究范式有可能发生变革。作为讨论最多的网络,互联网帮助我们首次找到了无尺度网络。沿着互联网蔓延的病毒,为我们提供了具有启发性和必要的数据,使得的里雅斯特的研究成为可能,让我们可以揭示出某些流行病的“无阈值”特性。这些研究得出的结论,促使我们重新审视从时尚到艾滋病传播的方方面面。现在,让我们退后一步,仔细看看这个让所有这些发现成为可能的复杂媒介,勾勒出互联网背后的网络。