起源:从数据到知识的挑战和跨越

    信息消费了什么是很明显的:它消费的是信息接受者的注意力。信息越丰富,就会导致注意力越匮乏……信息并不匮乏,匮乏的是我们处理信息的能力。我们有限的注意力是组织活动的主要瓶颈。02

    ——赫伯特·西蒙

    美国经济学家、政治学家、人工智能的创始人之一,1973年

    1946年,人类历史上第一台电子计算机在美国费城问世。03来自匈牙利的移民冯·诺伊曼是这台计算机的主要设计者,他被后世称为“计算机之父”。

    起源:从数据到知识的挑战和跨越 - 图1
    赫伯特·西蒙(1916-2001)
    20世纪全世界最具影响力的科学家之一,他横跨多个学科和领域,曾获得1975年的图灵奖、1978年的诺贝尔经济学奖、1993年的美国心理协会终身成就奖。(图片来源:卡内基梅隆大学图书馆)

    仅一年之后,卡内基梅隆大学的赫伯特·西蒙(Herbert Simon)教授出版了《行政组织的决策过程》一书。在这本被后世视为经典的著作里,他指出,人类的理性是有限的,因此所有的决策都是基于有限理性(Bounded Rationality)的结果。这位天才科学家继而提出,如果能利用存储在计算机里的信息来辅助决策,人类理性的范围将会扩大,决策的质量就能提高。

    他进而预测:在后工业时代,也就是信息时代,人类社会面临的中心问题将从如何提高生产率转变为如何更好地利用信息来辅助决策。

    西蒙教授毕业于芝加哥大学,1943年获得政治学博士学位,此后半个多世纪,他长期在卡内基梅隆大学任教。

    卡内基梅隆大学,是美国信息技术研究的“火车头”,它以计算机科学和“交叉性研究”闻名于世。西蒙的整个学术生涯都浸润着卡内基梅隆的色彩,他从政治、经济出发,把毕生的精力都集中在对决策和信息的研究上,将不同学科之间的“交叉性”应用得炉火纯青,也硕果累累。1975年,由于对人工智能的贡献,他获得了计算机学界的最高奖项:图灵奖;1978年,他又因为对“商务决策过程”的出色研究戴上了诺贝尔经济学奖的桂冠。

    追本溯源,学界普遍认为,西蒙对决策支持系统的研究,是现代商务智能概念最早的源头和起点。04但西蒙可能没有想到,他播下的“决策支持”的种子,在半个世纪以后,却结出了“商务智能”的果实,并成为信息时代的一朵奇葩。

    从决策支持系统到商务智能,名字变了,但新瓶装的还是旧酒。现代商务智能技术回答的还是决策支持系统面对的老问题:如何将数据、信息转化为知识,扩大人类的理性,辅助决策?

    从数据到知识,这个跨越,人类用了半个多世纪。

    在半个多世纪的漫长过程中,决策支持系统曾经一度因为缺乏有效的数据组织方式而徘徊不前。直到上世纪90年代,由于若干新技术的出现,打破了瓶颈,“商务智能”的概念才横空出世。随后,其发展取得了前所未有的加速度,在本世纪第一个十年蓬勃向上。今天,回头考察这些新技术的一一出现,可以清楚地看到商务智能的产业链条不断向前延伸的轨迹。

    从数据、信息到知识的演变

    起源:从数据到知识的挑战和跨越 - 图2

    数据、信息和知识的区别和联系

    起源:从数据到知识的挑战和跨越 - 图3

    这个轨迹的起点当然就是计算机。计算机,是硬件和软件相结合的产物。它的发明,是诸多不同领域的科学家共同努力的结果。冯·诺伊曼其实是一名数学家,他之所以被称为“计算机之父”,其最大的贡献之一,在于他明确了计算机内部的数据组织形式:二进制。

    二进制的引进,解决了在没有“情感、智能和生命”的物理机器中表达、计算、传送数据的最大难题,有了二进制,软件的运行才有了支点。

    如前文所述,软件是由程序和数据组成的。二进制的确定,解决了数据在计算机内部传送“理解”和“流动”的问题,但当数据在计算机内部累积得越来越多的时候,如何快速地组织、存储和读取数据又成为新的挑战。

    计算机科学家一直在研究数据在软件内部的最佳组织方式。1970年,IBM的研究员埃德加·科德(Edgar Codd)发明了关系型数据库,成为软件发展历史上一个跨越性的里程碑。

    此前,数据库的组织结构以网状、层级制为主,复杂多变,程序和数据之间你中有我、我中有你,彼此有很强的依赖性。科德提出的关系型数据库具有结构化高、冗余度低、独立性强等优点,彻底把软件中的程序和数据分立开来。从此,软件的发展成了“两条腿”走路,程序和数据在各自的轨道上自由奔跑。

    科德后来又总结出构建关系型数据库的“黄金十二定律”,把理论扎扎实实地推向了实践,关系型数据库开始得到大范围地推广,引发了一场软件领域的革命。科德也因此获得1981年的图灵奖。

    此后,大型软件,即大型信息管理系统的应用一日千里、遍地开花。

    这些信息系统的建立和运行,使人类从繁杂的重复性劳动当中解放出来,大大提高了商业效率。但这些信息系统,都是针对特定的业务过程、处理离散事务的“运营式”信息系统。

    所谓“运营式系统”,是指为提高日常工作的效率而设计的系统,数据在其中的作用,是一个个商务流程的记录,数据在这些系统内不断累积的结果,仅仅用于查询,而不是分析。

    上个世纪90年代,面对信息管理系统的普及、各行各业数据记录的激增,管理大师彼得·德鲁克(Peter Drucker)曾发出慨叹:迄今为止,我们的系统产生的还仅仅是数据,而不是信息,更不是知识!05

    怎样从各个独立的信息系统中提取、整合有价值的数据,从而实现从数据到信息、从信息到知识、从知识到利润的转化?这个要求,随着信息管理系统的普及,变得越来越迫切。企业的规模越来越庞大、组织越来越复杂,市场更加多变、竞争更加激烈,信息是否及时准确、决策是否正确合理,对组织的兴衰存亡影响越来越大,一步走错,可能全盘皆输。

    由于实业界这些迫切的需要,决策支持系统的旧问题又重新占据了顶尖科学家的大脑。

    商务智能的“幽灵”开始徘徊……