9.1 术语速成
实验设计和方差分析都有自己相应的语言。在讨论实验设计分析前,我们先快速回顾一些重要的术语,并通过对一系列复杂度逐步增加的实验设计的学习,引入模型最核心的思想。
以焦虑症治疗为例,现有两种治疗方案:认知行为疗法(CBT)和眼动脱敏再加工法(EMDR)。我们招募10个焦虑症患者作为志愿者,随机分配一半的人接受为期五周的CBT,另外一半接受为期五周的EMDR,设计方案如表9-1所示。在治疗结束时,要求每个患者都填写状态特质焦虑问卷(STAI),也就是一份焦虑度测量的自我评测报告。 表9-1 单因素组间方差分析
治疗方案 | |
---|---|
CBT | EMDR |
s1
s2
s3
s4
s5 | s6
s7
s8
s9
s10 |
在这个实验设计中,治疗方案(treatment)是两水平(CBT、EMDR)的组间因子,之所以称作组间因子是因为每个患者都仅被分配到一个组别中,没有患者同时接受CBT和EMDR。表中字母s代表受试者(患者),STAI是因变量,治疗方案是自变量。由于在每种治疗方案下观测数相等,因此这种设计也称为均衡设计(balanced design);若观测数不同,则称作非均衡设计(unbalanced design)。
因为仅有一个类别型变量,表9-1的统计设计又称为单因素方差分析(one-way ANOVA),或进一步称为单因素组间方差分析。方差分析主要通过F检验来进行效果评测,若治疗方案的F检验显著,则说明五个星期后两种疗法的STAI得分均值不同。
假设你只对CBT的效果感兴趣,则需将10个患者都放在CBT组中,然后在治疗五周和六个月后分别评价疗效,设计方案如表9-2所示。 表9-2 单因素组内方差分析
患 者 | 时 间 | |
---|---|---|
5周 | 6个月 | |
s1
s2
s3
s4
s5
s6
s7
s8
S9
s10 |
此时,时间(time)是两水平(五周、六个月)的组内因子。因为每个患者在所有水平下都进行了测量,因此这种统计设计称单因素组内方差分析;又由于每个受试者都不止一次被测量,也称作重复测量方差分析。当时间的F检验显著时,说明患者的STAI得分均值在五周和六个月间发生了改变。
现假设你对治疗方案差异和它随时间的改变都感兴趣,则将两个设计结合起来即可:随机分配五个患者到CBT,另外五个到EMDR,在五周和六个月后分别评价他们的STAI结果(见表9-3)。 表9-3 含组间和组内因子的双因素方差分析
患 者 | 时 间 | |||
---|---|---|---|---|
5周 | 6个月 | |||
疗法 | CBT | s1
s2
s3
s4
s5 | ||
EMDR | s6
s7
s8
s9
s10 |
疗法(therapy)和时间(time)都作为因子时,我们既可分析疗法的影响(时间跨度上的平均)和时间的影响(疗法类型跨度上的平均),又可分析疗法和时间的交互影响。前两个称作主效应,交互部分称作交互效应。
当设计包含两个甚至更多的因子时,便是因素方差分析设计,比如两因子时称作双因素方差分析,三因子时称作三因素方差分析,以此类推。若因子设计包括组内和组间因子,又称作混合模型方差分析,当前的例子就是典型的双因素混合模型方差分析。
本例中,你将做三次F检验:疗法因素一次,时间因素一次,两者交互因素一次。若疗法结果显著,说明CBT和EMDR对焦虑症的治疗效果不同;若时间结果显著,说明焦虑度从五周到六个月发生了变化;若两者交互效应显著,说明两种疗法随着时间变化对焦虑症治疗影响不同(也就是说,焦虑度从五周到六个月的改变程度在两种疗法间是不同的)。
现在,我们对上面的实验设计稍微做些扩展。众所周知,抑郁症对病症治疗有影响,而且抑郁症和焦虑症常常同时出现。即使受试者被随机分配到不同的治疗方案中,在研究开始时,两组疗法中的患者抑郁水平就可能不同,任何治疗后的差异都有可能是最初的抑郁水平不同导致的,而不是由于实验的操作问题。抑郁症也可以解释因变量的组间差异,因此它常称为混淆因素(confounding factor)。由于你对抑郁症不感兴趣,它也被称作干扰变数(nuisance variable)。
假设招募患者时使用抑郁症的自我评测报告,比如白氏抑郁症量表(BDI),记录了他们的抑郁水平,那么你可以在评测疗法类型的影响前,对任何抑郁水平的组间差异进行统计性调整。本案例中,BDI为协变量,该设计为协方差分析(ANCOVA)。
以上设计只记录了单个因变量情况(STAI),为增强研究的有效性,可以对焦虑症进行其他的测量(比如家庭评分、医师评分,以及焦虑症对日常行为的影响评价)。当因变量不止一个时,设计被称作多元方差分析(MANOVA),若协变量也存在,那么就叫多元协方差分析(MANCOVA)。
学习进行到现在,你已经掌握了基本的方差分析术语。此时,应该可以让朋友们大开眼界,并和他们讨论如何使用R拟合ANOVA/ANCOVA/MANOVA模型了。