8 假设检验¶
8.1 假设检验基本知识¶
假设检验是数理统计的一类基本而重要的问题,特别在质量控制中有普遍应用。假设检验包括:
(1)已知总体分布的形式,但不知其参数的情况,提出参数的假设,并根据样本进行检验。即参数的假设检验
(2)在总体的分布函数完全未知的情况下,提出总体服从某个已知分布的假设,并根据样本进行检验。即非参数的假设检验,也即分布的假设检验
下面我们以一个例子来阐述各个概念
8.1.1 检验统计量与拒绝域¶
用于判断原假设 \(H_0\) 是否成立的统计量 \(T = T(X_1, \cdots, X_n)\)称为对应假设问题的检验统计量,对应于拒绝原假设 \(H_0\) 时,样本值的范围称为拒绝域,记为 \(W\),其补集 \(\overline{W}\) 称为接受域。
上述例子中,可取检验统计量为 \(\bar{X}\) (或 \(\bar{X} - \mu_0\)),拒绝域为 \(W = \{(X_1, \cdots, X_n) : |\bar{X} - \mu_0| \geq C\}\)
在确定临界值 \(C\) 时注意:即使确定了临界值 \(C\),但也不能保证判断一定正确,不管 \(C\) 取什么样的值判断都有可能犯错误。在确定 \(C\) 之前先明确一下概念。
8.1.2 两类错误¶
由于样本的随机性,任一检验规则在应用时,都有可能发生错误的判断。
第一类错误:原假设 \(H_0\) 成立,作出拒绝原假设的决策。即弃真。
第二类错误:原假设 \(H_0\) 不成立,作出接受原假设的决策。即存伪。
例1中,犯第I类错误的概率
\(\because \text{当} H_0 \text{成立时,} \mu = \mu_0, \quad \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)\)
犯第II类错误的概率计算
\(\therefore\) 只有 \(\mu\) 已知才能知道犯第II类错误的概率!关于 \(\mu\) 的函数
综上所述,我们得到
显然,犯第I类错误的概率 \(\alpha(C)\) 关于 \(C\) 是单调减函数,而犯第II类错误的概率 \(\beta(C)\) 关于 \(C\) 是单调增函数。
在样本容量 \(n\) 固定时,不可能找到界值 \(C\),同时使得 \(\alpha(C)\) 和 \(\beta(C)\) 都很小。即,犯两类错误的概率相互制约!
实际上,需要同时使得 \(\alpha(C)\) 和 \(\beta(C)\) 都在要求范围内时,可以增加样本容量!
8.1.3 奈曼-皮尔逊 (Neyman-Pearson) 原则¶
首先控制犯第I类错误的概率不超过某个较小的常数 \(\alpha\) (0 < \(\alpha\) < 1),再寻找检验,使得犯第II类错误的概率尽可能小。
其中的常数 \(\alpha\) 称为显著水平,是允许犯第一类错误的最大概率值,常取 \(\alpha = 0.01, 0.05, 0.1\) 等。
为什么取较小的常数 \(\alpha\),而不是最小?
\(\alpha\) 太小了的话,第二类错误概率会比较大
由奈曼-皮尔逊原则确定 \(C\)
在例1中,若取显著水平为 \(\alpha\),则有
由于犯第II类错误的概率 \(\beta(C)\) 关于 \(C\) 单调增函数,根据Neyman-Pearson原则,应取以上的最小值:
因此,假设检验 “\(H_0: \mu = \mu_0\), \(H_1: \mu \neq \mu_0\)” 中
\(H_0\) 的拒绝域为:
或写为:
一般简单写为:
虽然这只是一个样本,但如果一个样本使得上述不等式成立,则可根据实际推断原理(小概率事件几乎在一次试验中不发生),就可以拒绝 \(H_0\),否则无理由拒绝 \(H_0\)。
Example
在例1中,\(\mu_0 = 6\), \(\sigma = 0.6\), \(n = 9\), \(\bar{x} = 6.4\),
若取 \(\alpha = 0.05\),则 \(z_{\alpha/2} = z_{0.025} = 1.96\)
有 \(\left| \bar{x} - 6 \right| = 0.4 > 0.392\),说明样本落入拒绝域。
也有 \(\left| \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} \right| = \left| \frac{6.4 - 6}{0.6 / \sqrt{9}} \right| = 2 > z_{0.025}\),样本落入拒绝域。
所以可拒绝 \(H_0\),也即我们有95%的把握认为该批次清漆的平均干燥时间与以往有显著差异!
8.1.4 假设类型¶
原假设 (零假设) \(H_0\),备择假设 (对立假设) \(H_1\)
关于总体参数 \(\theta\) 的假设有三种:
求左边假设问题的拒绝域(右边假设问题类似)
其中 \(\mu_0\) 是已知的常数。
以 \(\bar{X}\) 作为 \(\mu\) 的参考,若 \(H_0\) 为真,\(\bar{X}\) 比 \(\mu_0\) 大些,但是,由于样本的随机波动性,也有可能导致 “\(\bar{X} < \mu_0\)” 发生,但如果 “\(\bar{X} - \mu_0 \leq k\)” 时,则认为 \(H_0\) 为假。因为同样含有 “\(\bar{X} - \mu_0\)”,所以,检验统计量仍取为
(与双边检验相同)
拒绝域形式可表示为
左边检验的拒绝域
以上也可写为 \(\sup_{\mu \geq \mu_0} \alpha(\mu, C) = \alpha(\mu_0, C) = \Phi(C) = \alpha\)
因此,左边检验的拒绝域为
8.1.5 P_值定义及计算¶
定义: 当原假设成立时,检验统计量取比观察到的结果更为极端的数值的概率称为P值。
Example
例1中的检验
\(H_0\) 的拒绝域为:
例1中,若取显著性水平 \(\alpha = 0.05\), 则由
可知,样本数据必定落在 \(H_0\) 的拒绝域内。所以应拒绝原假设!
说明: 统计量 \(Z\) 的值的绝对值 \(|z_0|\) 取代拒绝域中的 \(z_{\alpha/2}\)。
P值与统计显著性¶
在实际运用中,通过 \(P\) 值来衡量拒绝 \(H_0\) 的理由是否充分。 \(P\) 值较小说明观察的结果在一次试验中发生的可能性较小,值越小,拒绝 \(H_0\) 的理由越充分;值越大,越没有足够的理由拒绝 \(H_0\)。
一般, \(P\) 值与显著性水平 \(\alpha\) 作比较,
- 若 \(P \leq \alpha\),则拒绝原假设;
- 若 \(P > \alpha\),则接受原假设。
拒绝原假设,称在水平 \(\alpha\) 下统计显著;
接受原假设,称在水平 \(\alpha\) 下统计不显著。
左边Z假设检验的P值计算¶
参照左边检验的拒绝域\(Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \leq -z_\alpha\)
对给定的样本观察值 \(x_1, \cdots, x_n\),
计算检验统计量值\(z_0 = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}.\)
简写: \(P_- = P(Z \leq z_0) = \Phi(z_0)\)
右边Z假设检验的P值计算¶
对给定的样本观察值 \(x_1, \cdots, x_n\), \(z_0 = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}.\)(拒绝域为 \(Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \geq z_\alpha\))
简写: \(P_- = P(Z \geq z_0) = 1 - \Phi(z_0)\)
8.1.6 H0 与 H1 的不对等性¶
一般,在有关参数的假设检验中,备择假设是我们根据样本资料希望得到支持的假设。或:题目中问的问题写到 \(H_1\)中
8.1.7 参数的假设检验问题处理步骤¶
- 根据实际问题的要求,提出原假设 \(H_0\) 和备择假设 \(H_1\);特别注意 \(H_0\) 与 \(H_1\) 的不对等性。
- 根据已知条件选取检验统计量(选取方法与区间估计中枢轴量的选取相同),画出统计量密度函数草图。
- 按照 “在原假设 \(H_0\) 成立时,拒绝原假设的概率不大于显著性水平 \(\alpha\)” 这一原则,画出统计量分布的分位数图,(左边检验左边留 \(\alpha\),右边检验右边留 \(\alpha\),两边检验两边各留 \(\alpha/2\))确定 \(H_0\) 拒绝域。
- 查分位数表、用样本观测值数据代入公式进行计算;根据样本数据是否落在 \(H_0\) 拒绝域内,作出拒绝原假设还是接受原假设的决策。
(3') 按 “3.” 确定拒绝域,计算检验统计量的观测值与 \(P\) 值。
(4') 根据给定的显著水平 \(\alpha\) 与 \(P\) 值大小,作出判断。
(3)(4) 为显著性假设检验
(3’)(4’) 为P值假设检验
8.2 关于正态总体的假设检验¶
8.2.1 正态总体下常用的检验统计量¶
单个总体 \(N(\mu, \sigma^2)\) 下常用检验统计量
- \(\sigma^2\) 已知,对 \(\mu\) 的检验:
- \(\sigma^2\) 未知,对 \(\mu\) 的检验:
- \(\mu\) 未知,对 \(\sigma^2\) 的检验:
- \(\mu\) 已知,对 \(\sigma^2\) 的检验:
双总体 \(N(\mu_1, \sigma_1^2), N(\mu_2, \sigma_2^2)\) 下常用检验统计量
- \(\sigma_1^2, \sigma_2^2\) 已知,对 \(H_0: \mu_1 - \mu_2 = \delta\) 的检验:
- \(\sigma_1^2 = \sigma_2^2\) 未知,对 \(H_0: \mu_1 - \mu_2 = \delta\) 的检验:
其中,
- \(\mu_1, \mu_2\) 未知,对 \(H_0: \sigma_1^2 = \sigma_2^2\) 的检验:
- \(\mu_1, \mu_2\) 已知,对 \(H_0: \sigma_1^2 = \sigma_2^2\) 的检验:
8.2.2 单个正态总体均值的假设检验¶
σ² 已知时的双边检验¶
假设:\(H_0: \mu = \mu_0, H_1: \mu \neq \mu_0\)
取检验统计量
\(H_0\) 的拒绝域为:
称此检验为 “Z检验法”
利用P值判断 \(H_0\) 真伪
参照 \(H_0\) 的拒绝域
对给定的样本观察值 \(x_1, \cdots, x_n\),
记检验统计量 \(Z\) 的取值为
(即 \(|z_0|\) 代替了拒绝域式中的 \(z_{\alpha/2}\))
判断: - 当 \(P_- \leq \alpha\) 时,拒绝原假设,
- 否则,接受原假设。
σ²未知时的双边检验¶
原假设和备择假设:\(H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0\)
由于\(σ^2\)未知,故不能用 \(\frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}\) 来确定拒绝域了。
取检验统计量:\(t = \frac{\bar{X} - \mu_0}{S / \sqrt{n}}\)
\(H_0\) 的拒绝域为
称此检验为 \(t\) 检验法
对给定的样本观察值 \(x_1, \cdots, x_n\),记检验统计量 \(t\) 的取值为
则有(拒绝域为:\(|t| \geq t_{\alpha/2}(n-1)\))
当 \(P_- \leq \alpha\) 时,拒绝原假设,
当 \(P_- > \alpha\) 时,接受原假设。
σ²未知时的左右边检验¶
右边检验的原假设和备择假设:\(H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0\)
取检验统计量:\(t = \frac{\bar{X} - \mu_0}{S / \sqrt{n}}\)
\(H_0\) 的拒绝域为
P值计算
左边检验的原假设和备择假设:\(H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0\)
\(H_0\) 的拒绝域是什么?
P值计算
8.2.3 单个正态总体方差的假设检验¶
原假设与备择假设:\(H_0: \sigma^2 = \sigma_0^2, \quad H_1: \sigma^2 \neq \sigma_0^2\)
检验统计量:\(\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)\)
原假设 \(H_0\) 的拒绝域
双边检验的P值,令\(\chi_0^2 = (n-1)S^2 / \sigma_0^2\)
则 \(P_- = 2 \min \left\{ P[\chi^2(n-1) \leq \chi_0^2], P[\chi^2(n-1) \geq \chi_0^2] \right\}\)
简化的P值:\(p_0 = P\{\chi^2(n-1) \leq \chi_0^2\}\) 得到 \(P_- = 2 \min \left\{ p_0, 1 - p_0 \right\}\)
8.2.4 两个正态总体均值的假设检验¶
数据 - \(X_1, X_2, \ldots, X_{n_1}\) 来自 \(N(\mu_1, \sigma_1^2)\)。 - \(Y_1, Y_2, \ldots, Y_{n_2}\) 来自 \(N(\mu_2, \sigma_2^2)\)。
\(\bar{X}, \bar{Y}, S_1^2, S_2^2\) 分别为第一、二个总体的样本均值和方差,显著性水平为 \(\alpha\)。
原假设与备择假设
- \(H_0: \mu_1 - \mu_2 = \delta\)
- \(H_1: \mu_1 - \mu_2 \neq \delta\)
(其中 \(\delta\) 为已知常数,通常为 0)
当 \(\sigma_1^2\) 和 \(\sigma_2^2\) 已知时¶
原假设与备择假设:\(H_0: \mu_1 - \mu_2 = \delta, \quad H_1: \mu_1 - \mu_2 \neq \delta\)
检验统计量,在 \(H_0\) 为真的适合,符合标准正态分布
检验拒绝域
P值
当 \(\sigma_1^2 = \sigma_2^2 = \sigma^2\) 但未知时¶
原假设与备择假设:\(H_0: \mu_1 - \mu_2 = \delta, \quad H_1: \mu_1 - \mu_2 \neq \delta\) (其中 \(\delta\) 为已知常数)
检验统计量, \(t \sim t(n_1 + n_2 - 2)\)
其中
检验拒绝域
计算 P 值
这种 t 检验被称为两样本精确 t 检验
8.2.5 两个正态总体方差的假设检验¶
当 \(\sigma_1^2\) 和 \(\sigma_2^2\) 未知时,设 \(\mu_1\), \(\mu_2\) 未知
原假设与备择假设:\(H_0: \sigma_1^2 = \sigma_2^2, \quad H_1: \sigma_1^2 \neq \sigma_2^2\)
检验统计量
拒绝域
称此检验为 \(F\) 检验法
P值
记 \(p_0 = P \left\{ F(n_1 - 1, n_2 - 1) \leq f_0 \right\}\),则
8.3 假设检验与区间估计¶
若总体 \(X \sim N(\mu, \sigma^2)\),\(\mu\) 未知,\(\sigma^2\) 已知,对于样本 \(X_1, X_2, \ldots, X_n\),置信度设为 \(1 - \alpha\),则 \(\mu\) 的置信区间为:
即:
对于假设检验问题 \(H_0: \mu = \mu_0\),\(H_1: \mu \neq \mu_0\),显著性水平为 \(\alpha\),
\(H_0\) 的拒绝域为:
即:
即拒绝域可以这样得到:将置信区间不等号反向,将原假设成立时的值代入到参数中即可。
双侧置信限与双边假设检验的关系
一般,若假设检验问题 \(H_0: \theta = \theta_0\), \(H_1: \theta \neq \theta_0\) 的显著水平为 \(\alpha\) 的接受域能等价地写成 \(\hat{\theta}_L < \theta_0 < \hat{\theta}_U\),那么 \((\hat{\theta}_L, \hat{\theta}_U)\) 是参数 \(\theta\) 的置信水平为 \(1 - \alpha\) 的置信区间。
反之,若 \((\hat{\theta}_L, \hat{\theta}_U)\) 是 \(\theta\) 的置信水平为 \(1 - \alpha\) 的置信区间,则当 \(\theta_0 \in (\hat{\theta}_L, \hat{\theta}_U)\) 时,在 \(\alpha\) 水平下接受双边检验 \(H_0: \theta = \theta_0\), \(H_1: \theta \neq \theta_0\) 中的原假设 \(H_0\),且检验的拒绝域为 \(\theta_0 \leq \hat{\theta}_L \text{ 或 } \theta_0 \geq \hat{\theta}_U\)