8.8 小结
在统计中,回归分析是许多方法的一个总称。相信你已经看到,它是一个交互性很强的方法,包括拟合模型、检验统计假设、修正数据和模型,以及为达到最终结果的再拟合等过程。从很多角度来看,获得模型的最终结果也是一种艺术和技巧,堪与自然科学相媲美。
由于回归分析是一个有很多步骤的过程,所以本章相对较长。我们先讨论了如何拟合OLS回归模型、如何使用回归诊断评估数据是否符合统计假设,以及一些修正数据使其符合假设的方法。然后,我们介绍了一些从众多可能模型中选出最终回归模型的途径,学习了如何评价模型在新样本上的表现。最后,我们又解决了变量重要性这个恼人的问题:鉴别哪个变量对预测最为重要。
本章的每个例子中,预测变量都是定量的。但是,并没有任何限制不允许使用类别型变量作为预测变量。使用诸如性别、处理方式或者生产过程这类类别型变量,可以鉴别出响应变量或结果变量的组间差别。这便是我们下章的主题。