1.2 统计学概论

1.2.1 统计学的发展历史

从字面上看,统计学这个名词最早来自欧洲,英语单词statistics(统计学)源自欧语系字根standing,status,state等,这几个字根的意义基本上是在描述事物的现象,这也是统计学的基本意义。

其实统计的起源是很早的,远在奴隶社会,由于赋税、徭役、征兵等需要,国家就要掌握人口、土地等数字。据历史记载,公元前3050年,埃及建造金字塔,为征集建筑费,就有对全国的人口与财产调查。罗马皇帝恺撒·奥古斯都曾下过一道命令,要全世界向他纳税,于是每个人都向就近的收税人登记。中国在夏禹时代就开始有人口统计的数字,春秋时期反映齐国丞相管仲思想的重要著作《管子》一书中曾有这样的记载:不明于计数,而欲举大事,犹无舟楫而欲经于水险也。这就是说不善于利用计数而进行宏伟事业,犹如没有船和桨而想渡过急流险滩一样。可见当时的人们就已经意识到统计是治理国家必不可少的一项重要工作。

但是作为一门科学,统计学的出现要比统计工作和统计资料晚得多,它的产生与当时的社会背景以及其他科学的相互影响密不可分。17世纪的欧洲,随着工商业的迅猛发展,海外市场和殖民地的不断开拓,一些主要国家深感有系统调查国内外情况的必要。18世纪,在德国和意大利相继出现了“国势论”的著作,德国哥廷根大学教授阿亨瓦尔在其著作《近代欧洲各国国势学纲要》的绪论中首次提出了“统计学”这一名词,把统计学定义为国家显著事项的结晶体。另外,英国在资本主义的发展过程中,也较早地利用数字对经济问题进行记载和推断。1661年,英国人格朗特在《对死亡标的自然观察和政治观察》一书中对当时英国情况的分析揭示出一系列的数量关系。虽然他没有提到“统计学”这一名词,但却已应用了现代统计中的大量观察方法去发现规律性的问题,其独特和新颖的方法给人诸多启示。

此后,比利时统计学家凯特勒综合已有的学术成果,并把概率论的原理和大量观察法引入统计研究领域,使统计学的发展进入到一个新的阶段。他认为:“统计学不仅仅是国势的记述,还应当把它作为学术问题来研究,因为统计学是对性质相同的事物进行大量观察,从而探索出社会现象相继不绝的一门学问。”这正是现代统计学的核心。

在他之后又有许多统计学家把统计方法应用于自然科学,出现了一批有重大影响的学者,如皮尔逊(K. Pearson)、费雪(R. A. Fisher)、沃尔德(A. Wald)等。他们在实践中进一步发展了统计理论,使统计学逐步成为一门比较成熟的科学。

1.2.2 统计学的特点

简单地说,统计学是研究如何有效地收集、整理、分析和解释带有随机性的数据资料的一门科学,它的性质特点主要表现在以下几个方面:

(1)统计学是研究数量方面的学问。统计的语言是数字,没有数字,就不是从数量方面入手进行认识,就谈不上统计。凡能以数量来表现的问题均可以作为统计学的研究对象。统计方法已渗透到其他科学领域,成为当前最活跃的学科之一。

(2)统计学研究的是客观现象总体的数量特征。数量有个体数量与总体数量之分,统计学主要研究后者。单个数字不能成为统计,只有对大量现象进行观察,才可能找到总体的数量特征及其规律性。不过,统计学研究总体,必须从样本的调查入手,遵循由样本到总体的认识逻辑。

(3)统计学主要研究不确定性现象。所谓不确定性是指由于受到偶然的、随机因素的作用,客观事物的实际数量表现存在一定程度的“不确定性”。在现代统计学中,处理不确定性问题,是统计学的主要课题和任务。

(4)统计学是一门方法论的科学。统计学的实用性很强,就统计工作而言,它总是研究实际问题的,统计的方法也是从现实问题中产生的。它的内容包括研究如何用有效的方法收集资料,如何对资料加以整理、概括和表征,以及如何对取得的数据进行分析和推断等一系列方法以至为采取某种行动提供依据和建议。目前,统计方法已经成为科技研究和信息管理的重要工具,并且还在不断发展之中。

1.2.3 统计学的分类

由于研究人员观察的角度不同,研究的重点不同,任何一门科学都会出现各个相互联系而又有区别的分支。统计学也不例外,大致有以下两种分类。

1.2.3.1 理论统计学与应用统计学

理论统计学是统计学的数学基础,它扎根于数学的一个领域——概率论,此外还包括一些并不属于传统概率论的内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理。在统计实践中常常会遇到一些新问题,原有的统计方法不适用,需要统计学家针对新问题去建立一个与实际情况相适应的统计模型,创建新的统计方法去分析,这就要靠统计理论来指导。理论统计学也常被称作数理统计学(mathematical statistics)。

与理论统计学相对应的是应用统计学,将统计学的基本原理应用于各个领域就形成了各种各样的应用统计学。它包括一整套统计分析方法,有的是一般性的统计方法,适用于各个领域,如参数估计、相关与回归等;有的则是某一专业领域中特有的分析方法,如统计过程控制中的控制图等。这类统计学的特点是不着重于统计数学原理的推导,而是着重于阐明统计的思想,并将理论统计学的结论作为工具应用于各个具体领域。

本书属于应用统计学范畴,尤其侧重于质量管理方面的应用。

1.2.3.2 描述统计学与推论统计学

描述统计学是研究如何对构成研究对象的总体全面逐一地进行调查以及数字的计量、概括、表示的方法。有些客观现象的数字计量比较简单,如人的身高、体重等,而另一些比较复杂,如居民生活费的变动,会涉及很多方面,因此需要确定一系列反映客观现象数量特征的范畴,即统计指标体系。此外,刚刚收集到的数据往往杂乱无章,需要对其提炼加工,分门别类进行整理,再通过一些图表醒目地表达出来。这些都是描述统计学所要研究的内容。

推论统计学也称归纳统计学或推断统计学,它研究如何根据样本的部分数据去推论总体的情况。因为对客观现象收集数据时,有时不可能对全部个体做调查,即使有时可以调查但工作量也太大,故通常采取抽取部分样本来进行研究,从而对总体作出推论。虽然样本只是总体的一部分,包含的信息不完备,而且随机抽样必然会出现误差,从而导致对推论的可靠与否要冒一定的风险,但是推论统计学根据概率论的原理可以使推断所产生的不确定性得到控制,所获得的结论一定是对于现有样本的“最佳”的统计结论。

所以说,描述统计学是推论统计学的基础,而推论统计学则是描述统计学的深化和发展。本书注意兼顾这两方面的内容,除第3章属于描述统计学之外,其余各章主要是推论统计学的内容。