第9章
相关分析和回归分析
在实际工作中,我们经常会与变量打交道,比如:炼钢温度与含碳量、广告支出与营业额、汽车使用年限与年平均维修成本、加工工艺条件与产品性能指标等,它们会随着条件的变化,取不同的值,在数学上称之为变量。
变量之间常常是相互联系的,它们之间存在一定的关系,通常有两种类型。
一种类型是:变量间的关系是确定的,总可以用某种函数来表达。比如:圆的面积S=πr2,这里变量r和S间的关系是完全确定的,称之为函数关系。
另一种类型是:变量间有某种关系,但又不是确定性的关系,称之为相关关系。
可以看出,函数关系和相关关系是两种不同的关系,但它们之间又没有严格的界限。在理论上存有函数关系的变量,由于实验或测量的误差,数值会有不确定性;而相关变量间本来是没有确定性关系的,但在特定条件下,从统计意义上看,它们又是存在某种函数关系的。
在变量存在相关关系时,又有两种情况:
第一种,这些变量都是随机变量,彼此间地位相同,任一个变量既可以做因变量也可以做自变量。这类问题可以用相关分析解决。
第二种,某些变量是可以控制和测量的非随机变量,称之为自变量,另一个变量与它们有关,它是不可控的,是随机变量,称之为因变量。这里因变量与自变量地位不同,不能互换。这类问题我们用回归分析去解决。
相关分析主要用来衡量变量间线性相关的密切程度;回归分析则是定量地给出变量间变化规律,它不仅能提供变量相关关系的经验公式(回归方程),而且可以判明所建立的回归方程的有效性。在方程有效的前提下,可以利用方程做预测和控制,并了解预测和控制的精度。在多元回归中,还可以分析判定出哪些是重要的变量,哪些是次要的变量。
本章9.1节讨论相关分析;9.2节讨论简单线性回归;9.3节讨论多元线性回归;9.4节讨论离散变量Logistic回归;9.5节讨论广义回归。