5.4　方差检验

5.4　方差检验
- 5.4.1　单正态总体方差检验
- 5.4.2　双总体等方差检验

5.4.1　单正态总体方差检验

在实际问题中，常常要检验一批数据的方差是否比设定的值大，或是否已经变小。例如，希望检验本次购进的原材料的方差是否比供应商宣称的要大？改进工作后的方差是否比改进工作前的方差（作为固定值是已知的）有所降低？这些都导致我们要进行单正态总体的方差检验。

1．临界值法

我们计算出检验统计量的观测值，看它是否落在拒绝域内，从而做出判断。

（1）关于总体方差σ²常用的三对假设：

alt

（2）检验统计量选择χ²统计量，在 alt 时：

alt

服从自由度为n－1的卡方分布。

（3）对应这三对假设，它们各自的拒绝域分别为：

1）H₁： alt 时，拒绝域是：

alt

2）H₁： alt 时，拒绝域是：

alt

3）H₁： alt 时，拒绝域是：

alt

2．p值比较法

通过MINITAB软件指令“统计＞基本统计量＞单总体方差（Stat＞Basic Statistics＞1-Variance）”来实现。

例5—11

某种金属丝折断力服从N（μ，64），μ未知，现随机抽取了30根做折断力试验，测得其数据见表5—8（数据文件：BS_单总体方差检验.MTW）。试问在α＝0.05水平上能否认为这批金属丝的折断力标准差仍然是8？

表5—8

alt

解　应用MINITAB，打开“BS_单总体方差检验.MTW”数据文件，直接对单正态总体标准差进行假设检验。

建立假设：

H₀：σ＝8

H₁：σ≠8

（1）从“统计＞基本统计量＞单方差（State＞Basic Statistics＞1Variance）”入口；

（2）如图5—16所示输入数据，输入变量名后，选定“进行假设检验”，再选中“假设标准差”（如果要检验的是方差，就可以选择“假设方差”）。

alt

图5—16　单方差检验操作图1

（3）点击“确定”后，得到如下输出结果：

单方差检验和置信区间：折断力

方法

alt

卡方方法仅适用于正态分布。

Bonett方法适用于任何连续分布。

统计量

alt

95％置信区间

alt

检验

alt

（4）输出结果说明。由于已知金属丝折断力服从正态分布，看到输出结果p值＝0.139＞0.05，因此我们的结论是：不能拒绝原假设，即认为这批金属丝的折断力标准差还是8。此例说明，当样本量较小时，样本的标准差（或方差）的波动可以是很大的。原来总体标准差是8，现在样本的标准差是9.51，在稍微有些变化时不能认为总体标准差已经发生变化。在实际工作中，如果是为了讨论有关平均值问题，样本量应该超过15；如果是为了讨论有关方差问题，样本量应该超过30；本例勉强达到要求，否则是得不到有意义的结论的。

在MINITAB的早期版本（R14及以前）中，对于单总体的方差检验没有专门的窗口，只能用原始数据计算出标准差的置信区间（例如用“统计＞基本统计量＞图形化汇总（STAT＞Basic Stat＞Graphical Summary）”），然后将此置信区间与要检验的值比较。但用置信区间进行检验仍有局限性，这是因为，使用置信区间一般只能进行双侧检验，对于单侧检验则要麻烦得多（要将α加倍，再看其单侧置信限）。

对于此例，我们可以使用“统计＞基本统计量＞图形化汇总（STAT＞Basic Stat＞Graphical Summary）”入口，求出标准差的95％双侧置信区间为（7.57，12.78），而总体标准差8落入此置信区间，因此不能拒绝原假设，认为这批金属丝的折断力标准差还是8。

例5—12

车工生产精密轴杆，其长度的规格限为15±0.3。原来的标准差已达到0.1，过程能力达到4个西格玛水平。现经六西格玛团队完成黑带项目，过程能力达到5个西格玛水平。现随机抽取了30根轴杆测量其长度，数据见表5—9（数据文件：BS_轴杆长度.MTW）。

表5—9

alt

试问在α＝0.05水平上能否认为这批轴杆长度的标准差比原来的0.1确实有所降低？

解　应用MINITAB，打开“BS_轴杆长度.MTW”数据文件，直接对单正态总体方差进行假设检验。

建立假设：

H₀：σ＝0.1

H₁：σ＜0.1

（1）从“统计＞基本统计量＞单方差（Stat＞Basic Statistics＞1 Variance）”进入相关界面。

（2）如图5—17所示输入数据，注意在图5—17左半图中选择“假设标准差”。

alt

图5—17　单方差检验操作图2

（3）点击“确定”后，得到如下输出结果：

单方差检验和置信区间：轴杆长度

方法

alt

卡方方法仅适用于正态分布。

Bonett方法适用于任何连续分布。

统计量

alt

95％单侧置信区间

alt

检验

alt

结果是p值＝0.030（分布为正态，所以只看上面这行），拒绝原假设，即可以断言轴杆长度的标准差比0.1确实有所降低。

这里要注意的是，如果把此问题当作双侧检验，则结论会稍有差异。从“统计＞基本统计量＞图形化汇总（Stat＞Basic Statistics＞Graphical Summary）”入口，求出标准差的95％双侧置信区间为（0.061，0.101），而总体标准差0.1落入此置信区间，因此不能拒绝原假设，应认为这批轴杆长度的标准差与原来的0.1无显著变化。

为什么会有这种差别呢？这就是因为假设检验的单侧问题与双侧问题是有很大不同的，在选定备择假设时一定要非常小心。单侧备择假设问题能得到显著结果的，在双侧备择假设问题中不一定能得到显著结果，两者的拒绝域是有差别的。当然在通常情况下，单侧备择假设问题能得到显著结果的，在双侧备择假设问题中一般也能得到显著结果，但举上述这个例子的目的是给大家敲个警钟。另外，本例题的计算只能在MINI-TABR15版本增加了新功能后才能进行，在以前的版本中没有此功能。这里要再次提醒大家关于样本量的问题：对于均值方面的检验，样本量至少应该是15以上，对于方差（或标准差）方面的检验，样本量至少应该是30以上。正如在计算过程能力时要求样本量达到50，达到30属于“勉强可以”。样本量太小时是不可能进行有关方差（或标准差）方面检验的。

许多统计工具如双样本t检验（2-Samplet）、方差分析（ANOVA）等，都要假定总体方差相等，因此还要讨论双总体等方差检验或多总体等方差检验等问题。

5.4.2　双总体等方差检验

在实际问题中，常常要检验两批数据的方差是否可以认为是相等的，例如，希望检验两批购进的原材料的方差是否相等？改进工作后的方差是否比改进工作前的方差有所降低？另一方面，双样本t检验（2-Samplet）要在假定两总体方差相等的条件下才能进行，这些都导致我们要进行双正态总体的方差检验。

1．临界值法

我们计算出检验统计量的观测值 alt ，看它是否落在拒绝域内，从而做出判断。

（1）常用的三对假设：

alt

（2）检验统计量选择F统计量，在 alt 时：

alt

（3）对应这三对假设，它们各自的拒绝域分别为：

1）H₁： alt 时，拒绝域是：

alt

2）H₁： alt 时，拒绝域是：

alt

3）H₁： alt 时，拒绝域是：

alt

单／双正态总体方差的显著性水平为α的检验中检验统计量和拒绝域等见表5—10。

表5—10　单／双正态总体方差的显著性水平为α的检验

alt

2．p值比较法

通过MINITAB软件指令“统计＞基本统计量＞双方差（Stat＞Basic Statistics＞2-Variances）”来实现。

例5—13（续例5—8）

一家冶金公司需要减少其排放到废水中的生物氧需求量（BOD）含量。考虑用纯氧取代空气吹入活化泥以改善BOD含量。在两种处理的废水中，空气法抽了10个样品，氧气法抽了9个样品，数据见表5—11（数据文件：BS_生物氧需求量.MTW）。

表5—11

alt

已知BOD含量服从正态分布，问在显著性水平α＝0.05下，该公司采用这两种不同方法对BOD含量影响的方差是否相等？

解　（1）建立假设：

alt

（2）在正态条件下，可以用F检验。

（3）据显著性水平α＝0.05及备择假设可知拒绝域为：

alt

（4）样本观察值，求得

alt

由于样本观察值未落在拒绝域中，因此不能拒绝原假设，可以认为该公司采用这两种不同方法对BOD含量影响的方差是相等的。

由于F检验的拒绝域是双侧，使用者必须同时考虑F值的拒绝范围：F太大要拒绝，F太小也要拒绝。为了使判断中的思考简化，不少中外六西格玛黑带培训教材中建议，在F统计量的计算中规定要使分子大于分母，这样一来，拒绝域可以只考虑右侧，也就是说只考虑F值太大则拒绝。这种处理方法可以简化我们的思考，但是若把F定义为分子大于分母则又是错误的（这时F肯定大于1，根本不再是F分布了），拒绝域取为右侧5％也是错误的（应该仍保留2.5％）。本书在此特别予以提醒，请大家在使用时注意。

使用MINITAB软件求解本题步骤：

（1）建立假设：

alt

（2）从“统计＞基本统计量＞双方差（Stat＞Basic Statistics＞2-Variances）”进入相关界面。

（3）输入数据后，在“图形”中勾选“区间图”和“箱线图”。点击“确定”后，得到下列输出结果及图5—18。

alt

图5—18　两总体方差相等性检验1

双方差检验和置信区间：空气，氧气

方法

alt

统计量

alt

标准差比＝1.358

方差比＝1.845

95％置信区间

alt

检验

alt

（4）输出结果说明。由于BOD含量服从正态分布，输出的F检验的p值＝0.401＞0.05，因此我们的结论是：不能拒绝原假设，该公司采用这两种不同方法对BOD含量影响的方差是相等的。

值得注意的是，对于等方差检验输出有两种检验结果：

●F检验，适于正态数据。

●Levene检验：是以样本中位数而非样本均值为基准，在小样本时更稳健，适于非正态连续数据。

如何比较F检验和Levene检验这两种方法呢？从表面上看，Levene检验适用于任何类型连续性分布，当然也适用于正态分布，应用范围要比F检验广泛得多。那么是否可以说Levene检验要比F检验“好”呢？不能这样说。大家都知道有种药叫“板蓝根”，它可以治感冒、淋巴腺炎、扁桃腺炎、腮腺炎、肝炎，预防“非典”，最近发现又增加一项“抗高原反应症”功能。能说它是“天下第一药”吗？恐怕不能。得了肝炎，在治疗时很少有人再去用板蓝根，因为市面上有很多专门治疗肝炎的药，在治疗肝炎时，用板蓝根绝对不如那些专门治疗肝炎的药。对于检验两总体方差相等性这个问题，如果数据为正态分布，F检验绝对是最灵敏（也就是犯第二类错误最小）的方法，只有当数据为非正态时，F检验不能使用了，才会使用Levene检验方法。

例5—14（续例4—8）

假定A，B两名工人生产相同规格的轴棒，关键尺寸是轴棒的直径。由于A使用的是老式车床，B使用的是新式车床，二者精度可能有差异。现他们各测定了13根轴棒直径的结果（数据见例4—8，数据文件：BS_轴棒直径.MTW）。试分析A，B两名工人生产的轴棒直径的方差相等吗？

解　建立假设：

alt