第三部分 中级方法
第二部分涵盖了作图和统计的基本方法,主要是对两个变量的关系进行描述性分析,第三部分将介绍一些中级方法,讲解如何对数值型结果变量和一系列数值型和(或)类别型预测变量之间的关系进行建模。
第 8 章介绍对数值型结果变量和单个或多个预测变量间的关系进行建模的回归方法。由于建模通常都是一个复杂、多步骤、交互的过程,因此第 8 章将逐步讲解如何拟合线性模型、评价模型适用性,并解释模型的意义。
第 9 章介绍基于方差分析及其变体对基本实验和准实验设计的分析。在这一章,我们感兴趣的是处理方式的组合,或条件对数值型结果变量的影响。这一章介绍 R 函数在方差分析、协方差分析、重复测量方差分析、多因素方差分析和多元方差分析中的用法,同时还讨论模型适用性的评价方法以及结果的可视化。
在实验和准实验设计中,判断样本量对检测处理效果是否足够(功效分析)非常重要——否则,为何要做这些研究呢?第 10 章详细介绍功效分析。在讨论假设检验后,这一章的重点是如何使用 R 函数判断 :在给定置信度的前提下,需要多少样本才能判断处理效果。这个结论可以帮助我们安排实验和准实验研究来获得有用的结果。
第 11 章扩展了第 5 章的内容,涵盖有助于两个或多个变量间关系可视化的图形绘制,包括各种 2D 和 3D 的散点图、散点图矩阵、折线图、气泡图,以及实用但相对少为人知的相关图和马赛克图。
在第 8 章和第 9 章中,回归模型的假设条件很苛刻:结果或响应变量不仅是数值型的,而且还必须来自正态分布的随机抽样。但很多情况并不满足正态分布假设,第 12 章便为此介绍一些稳健的数据分析方法,它们能处理比较复杂的情况,比如数据来源于未知或混合分布、小样本问题、恼人的异常值,或者依据理论分布设计假设检验很复杂而且数学上非常难处理。这一章介绍的方法包括重抽样和自助法,这些涉及大量计算机资源的方法很容易在 R 中实现,允许你对那些不符合传统参数假设的数据去修正假设检验。
阅毕第三部分,你将可以运用这些工具分析常见的实际数据分析问题,而且还可以绘制一些非常漂亮的图形!