跳转至

8 假设检验

文本统计:约 3491 个字

8.1 假设检验基本知识

假设检验是数理统计的一类基本而重要的问题,特别在质量控制中有普遍应用。假设检验包括:

(1)已知总体分布的形式,但不知其参数的情况,提出参数的假设,并根据样本进行检验。即参数的假设检验

(2)在总体的分布函数完全未知的情况下,提出总体服从某个已知分布的假设,并根据样本进行检验。即非参数的假设检验,也即分布的假设检验

下面我们以一个例子来阐述各个概念

Example

8.1.1 检验统计量与拒绝域

用于判断原假设 \(H_0\) 是否成立的统计量 \(T = T(X_1, \cdots, X_n)\)称为对应假设问题的检验统计量,对应于拒绝原假设 \(H_0\) 时,样本值的范围称为拒绝域,记为 \(W\),其补集 \(\overline{W}\) 称为接受域

上述例子中,可取检验统计量为 \(\bar{X}\) (或 \(\bar{X} - \mu_0\)),拒绝域为 \(W = \{(X_1, \cdots, X_n) : |\bar{X} - \mu_0| \geq C\}\)

在确定临界值 \(C\) 时注意:即使确定了临界值 \(C\),但也不能保证判断一定正确,不管 \(C\) 取什么样的值判断都有可能犯错误。在确定 \(C\) 之前先明确一下概念。

8.1.2 两类错误

由于样本的随机性,任一检验规则在应用时,都有可能发生错误的判断。

第一类错误:原假设 \(H_0\) 成立,作出拒绝原假设的决策。即弃真

第二类错误:原假设 \(H_0\) 不成立,作出接受原假设的决策。即存伪

例1中,犯第I类错误的概率

\[ \begin{aligned} P_1=\alpha(C) &= P\{\text{拒绝} H_0 \mid H_0 \text{为真}\} \\ &= P\left\{\left|\bar{X} - \mu_0\right| \geq C \mid \mu = \mu_0\right\} \\ &= P_{\mu=\mu_0}\left\{\left|\bar{X} - \mu_0\right| \geq C\right\} \\ &= P_{\mu=\mu_0}\left\{\left|\frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}\right| \geq \frac{C}{\sigma / \sqrt{n}}\right\} \\ &= 1 - P_{\mu=\mu_0}\left\{\left|\frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}\right| < \frac{C}{\sigma / \sqrt{n}}\right\} \\ &= 2 - 2\Phi\left(\frac{C}{\sigma / \sqrt{n}}\right) \end{aligned} \]

\(\because \text{当} H_0 \text{成立时,} \mu = \mu_0, \quad \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)\)

犯第II类错误的概率计算

\[ \begin{aligned} \beta(C) &= P\{\text{接受} H_0 \mid H_0 \text{为假}\} \\ &= P_{\mu \neq \mu_0} \left\{ \left| \bar{X} - \mu_0 \right| < C \right\} \\ &= P_{\mu \neq \mu_0} \left\{ \mu_0 - C < \bar{X} < \mu_0 + C \right\} \\ &= P_{\mu \neq \mu_0} \left\{ \frac{\mu_0 - C - \mu}{\sigma / \sqrt{n}} < \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} < \frac{\mu_0 + C - \mu}{\sigma / \sqrt{n}} \right\} \\ &= \Phi \left\{ \frac{\mu_0 + C - \mu}{\sigma / \sqrt{n}} \right\} - \Phi \left\{ \frac{\mu_0 - C - \mu}{\sigma / \sqrt{n}} \right\}, \quad \mu \neq \mu_0 \end{aligned} \]

\(\therefore\) 只有 \(\mu\) 已知才能知道犯第II类错误的概率!关于 \(\mu\) 的函数

综上所述,我们得到

\[ \begin{aligned} \alpha(C) &= 2 - 2\Phi\left(\frac{C}{\sigma / \sqrt{n}}\right)\\ \beta(C) &= \Phi\left\{\frac{\mu_0 + C - \mu}{\sigma / \sqrt{n}}\right\} - \Phi\left\{\frac{\mu_0 - C - \mu}{\sigma / \sqrt{n}}\right\} \end{aligned} \]

显然,犯第I类错误的概率 \(\alpha(C)\) 关于 \(C\) 是单调减函数,而犯第II类错误的概率 \(\beta(C)\) 关于 \(C\) 是单调增函数。

在样本容量 \(n\) 固定时,不可能找到界值 \(C\),同时使得 \(\alpha(C)\)\(\beta(C)\) 都很小。即,犯两类错误的概率相互制约!

实际上,需要同时使得 \(\alpha(C)\)\(\beta(C)\) 都在要求范围内时,可以增加样本容量!

8.1.3 奈曼-皮尔逊 (Neyman-Pearson) 原则

首先控制犯第I类错误的概率不超过某个较小的常数 \(\alpha\) (0 < \(\alpha\) < 1),再寻找检验,使得犯第II类错误的概率尽可能小。

其中的常数 \(\alpha\) 称为显著水平,是允许犯第一类错误的最大概率值,常取 \(\alpha = 0.01, 0.05, 0.1\) 等。

为什么取较小的常数 \(\alpha\),而不是最小?

\(\alpha\) 太小了的话,第二类错误概率会比较大

由奈曼-皮尔逊原则确定 \(C\)

在例1中,若取显著水平为 \(\alpha\),则有

\[ \alpha(C) = 2 - 2\Phi\left(\frac{C}{\sigma / \sqrt{n}}\right) \leq \alpha, \]
\[ \Phi\left(\frac{C}{\sigma / \sqrt{n}}\right) \geq 1 - \frac{\alpha}{2}, \]
\[ \frac{C}{\sigma / \sqrt{n}} \geq z_{\alpha/2}, \]
\[ C \geq z_{\alpha/2} \frac{\sigma}{\sqrt{n}}. \]

由于犯第II类错误的概率 \(\beta(C)\) 关于 \(C\) 单调增函数,根据Neyman-Pearson原则,应取以上的最小值:

\[ C = z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \]

因此,假设检验 “\(H_0: \mu = \mu_0\), \(H_1: \mu \neq \mu_0\)” 中

\(H_0\) 的拒绝域为:

\[ W = \left\{ \left| \bar{X} - \mu_0 \right| \geq z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right\} \]

或写为:

\[ W = \left\{ \left| \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \right| \geq z_{\alpha/2} \right\} \]

一般简单写为:

\[ \left| \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \right| = |Z| \geq z_{\alpha/2} \]

虽然这只是一个样本,但如果一个样本使得上述不等式成立,则可根据实际推断原理(小概率事件几乎在一次试验中不发生),就可以拒绝 \(H_0\),否则无理由拒绝 \(H_0\)

Example

在例1中,\(\mu_0 = 6\), \(\sigma = 0.6\), \(n = 9\), \(\bar{x} = 6.4\),

若取 \(\alpha = 0.05\),则 \(z_{\alpha/2} = z_{0.025} = 1.96\)

\[ C = z_{\alpha/2} \frac{\sigma}{\sqrt{n}} = 1.96 \cdot \frac{0.6}{\sqrt{9}} = 0.392 \]

\(\left| \bar{x} - 6 \right| = 0.4 > 0.392\),说明样本落入拒绝域。

也有 \(\left| \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} \right| = \left| \frac{6.4 - 6}{0.6 / \sqrt{9}} \right| = 2 > z_{0.025}\),样本落入拒绝域。

所以可拒绝 \(H_0\),也即我们有95%的把握认为该批次清漆的平均干燥时间与以往有显著差异!

8.1.4 假设类型

原假设 (零假设) \(H_0\),备择假设 (对立假设) \(H_1\)

关于总体参数 \(\theta\) 的假设有三种:

\[ \begin{aligned} &H_0: \quad \theta = \theta_0, \quad H_1: \quad \theta \neq \theta_0 \quad \text{(双边检验)} \\ &H_0: \quad \theta \geq \theta_0, \quad H_1: \quad \theta < \theta_0 \quad \text{(左边检验)} \\ &H_0: \quad \theta \leq \theta_0, \quad H_1: \quad \theta > \theta_0 \quad \text{(右边检验)} \end{aligned} \]

左边假设问题的拒绝域(右边假设问题类似)

\[ H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0, \]

其中 \(\mu_0\) 是已知的常数。

\(\bar{X}\) 作为 \(\mu\) 的参考,若 \(H_0\) 为真,\(\bar{X}\)\(\mu_0\) 大些,但是,由于样本的随机波动性,也有可能导致 “\(\bar{X} < \mu_0\)” 发生,但如果 “\(\bar{X} - \mu_0 \leq k\)” 时,则认为 \(H_0\) 为假。因为同样含有 “\(\bar{X} - \mu_0\)”,所以,检验统计量仍取为

\[ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \]

(与双边检验相同)

拒绝域形式可表示为

\[ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \leq C \]

左边检验的拒绝域

\[ \begin{aligned} \alpha(\mu, C) &= P\{\text{拒绝} H_0 \mid H_0 \text{是真的}\} = P_{\mu \geq \mu_0} \left\{ \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \leq C \right\}\\ &= P_{\mu \geq \mu_0} \left\{ \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \leq C - \frac{\mu - \mu_0}{\sigma / \sqrt{n}} \right\} = \Phi_{\mu \geq \mu_0} \left( C - \frac{\mu - \mu_0}{\sigma / \sqrt{n}} \right)\\ &\leq \Phi \left( C - \frac{\mu_0 - \mu_0}{\sigma / \sqrt{n}} \right) = \Phi(C) = \alpha \end{aligned} \]

以上也可写为 \(\sup_{\mu \geq \mu_0} \alpha(\mu, C) = \alpha(\mu_0, C) = \Phi(C) = \alpha\)

\[ \Rightarrow C = -z_{\alpha} \]

因此,左边检验的拒绝域为

\[ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \leq -z_{\alpha} \]

8.1.5 P_值定义及计算

定义: 当原假设成立时,检验统计量取比观察到的结果更为极端的数值的概率称为P值。

Example

例1中的检验

\[ H_0: \mu = \mu_0 = 6.0, \quad H_1: \mu \neq \mu_0 \]

\(H_0\) 的拒绝域为:

\[ |Z| = \left| \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \right| \geq z_{\alpha/2} \]
\[ |z_0| = \left| \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} \right| = \left| \frac{6.4 - 6.0}{0.6 / \sqrt{9}} \right| = 2 \]
\[ P = P_{H_0} \left( |Z| \geq |z_0| \right) = P_{H_0} \left( |Z| \geq 2 \right) = 2 - 2 \Phi(2) = 0.046 \]

例1中,若取显著性水平 \(\alpha = 0.05\), 则由

\[ P = P_{H_0}(|Z| \geq 2) = 0.046 < \alpha = 0.05 \]

可知,样本数据必定落在 \(H_0\) 的拒绝域内。所以应拒绝原假设!

说明: 统计量 \(Z\) 的值的绝对值 \(|z_0|\) 取代拒绝域中的 \(z_{\alpha/2}\)

P值与统计显著性

在实际运用中,通过 \(P\) 值来衡量拒绝 \(H_0\) 的理由是否充分。 \(P\) 值较小说明观察的结果在一次试验中发生的可能性较小,值越小,拒绝 \(H_0\) 的理由越充分;值越大,越没有足够的理由拒绝 \(H_0\)

一般, \(P\) 值与显著性水平 \(\alpha\) 作比较,

  • \(P \leq \alpha\),则拒绝原假设;
  • \(P > \alpha\),则接受原假设。

拒绝原假设,称在水平 \(\alpha\) 下统计显著;

接受原假设,称在水平 \(\alpha\) 下统计不显著。

左边Z假设检验的P值计算

参照左边检验的拒绝域\(Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \leq -z_\alpha\)

对给定的样本观察值 \(x_1, \cdots, x_n\),

计算检验统计量值\(z_0 = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}.\)

\[ \begin{aligned} P_- &= \sup_{\mu \geq \mu_0} P\left\{ Z \leq z_0 \right\} = \sup_{\mu \geq \mu_0} P\left\{ \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \leq z_0 \right\}\\ &= P\left\{ Z \leq z_0 \mid \mu = \mu_0 \right\} = \Phi(z_0) \end{aligned} \]

简写: \(P_- = P(Z \leq z_0) = \Phi(z_0)\)

右边Z假设检验的P值计算

对给定的样本观察值 \(x_1, \cdots, x_n\), \(z_0 = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}.\)(拒绝域为 \(Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \geq z_\alpha\)

\[ \begin{aligned} P_- &= \sup_{\mu \leq \mu_0} P_{H_0} \left\{ Z \geq z_0 \right\} = \sup_{\mu \leq \mu_0} P_{H_0} \left\{ \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \geq z_0 \right\}\\ &= P \left\{ Z \geq z_0 \mid \mu = \mu_0 \right\}\\ &= 1 - \Phi(z_0). \end{aligned} \]

简写: \(P_- = P(Z \geq z_0) = 1 - \Phi(z_0)\)

8.1.6 H0 与 H1 的不对等性

一般,在有关参数的假设检验中,备择假设是我们根据样本资料希望得到支持的假设。或:题目中问的问题写到 \(H_1\)

8.1.7 参数的假设检验问题处理步骤

  1. 根据实际问题的要求,提出原假设 \(H_0\) 和备择假设 \(H_1\);特别注意 \(H_0\)\(H_1\) 的不对等性。
  2. 根据已知条件选取检验统计量(选取方法与区间估计中枢轴量的选取相同),画出统计量密度函数草图。
  3. 按照 “在原假设 \(H_0\) 成立时,拒绝原假设的概率不大于显著性水平 \(\alpha\)” 这一原则,画出统计量分布的分位数图,(左边检验左边留 \(\alpha\),右边检验右边留 \(\alpha\),两边检验两边各留 \(\alpha/2\)确定 \(H_0\) 拒绝域。
  4. 查分位数表、用样本观测值数据代入公式进行计算;根据样本数据是否落在 \(H_0\) 拒绝域内,作出拒绝原假设还是接受原假设的决策。

(3') 按 “3.” 确定拒绝域,计算检验统计量的观测值与 \(P\) 值。

(4') 根据给定的显著水平 \(\alpha\)\(P\) 值大小,作出判断。

(3)(4) 为显著性假设检验

(3’)(4’) 为P值假设检验

8.2 关于正态总体的假设检验

8.2.1 正态总体下常用的检验统计量

单个总体 \(N(\mu, \sigma^2)\) 下常用检验统计量

  1. \(\sigma^2\) 已知,对 \(\mu\) 的检验:
\[ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1) \]
  1. \(\sigma^2\) 未知,对 \(\mu\) 的检验:
\[ t = \frac{\bar{X} - \mu_0}{S / \sqrt{n}} \sim t(n - 1) \]
  1. \(\mu\) 未知,对 \(\sigma^2\) 的检验:
\[ \chi^2 = \frac{(n - 1)S^2}{\sigma_0^2} \sim \chi^2(n - 1) \]
  1. \(\mu\) 已知,对 \(\sigma^2\) 的检验:
\[ \chi^2 = \sum_{i=1}^n \left( \frac{X_i - \mu}{\sigma_0} \right)^2 \sim \chi^2(n) \]

双总体 \(N(\mu_1, \sigma_1^2), N(\mu_2, \sigma_2^2)\) 下常用检验统计量

  1. \(\sigma_1^2, \sigma_2^2\) 已知,对 \(H_0: \mu_1 - \mu_2 = \delta\) 的检验:
\[ Z = \frac{(\bar{X} - \bar{Y}) - \delta}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1) \]
  1. \(\sigma_1^2 = \sigma_2^2\) 未知,对 \(H_0: \mu_1 - \mu_2 = \delta\) 的检验:
\[ t = \frac{(\bar{X} - \bar{Y}) - \delta}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2) \]

其中,

\[ S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2} \]
  1. \(\mu_1, \mu_2\) 未知,对 \(H_0: \sigma_1^2 = \sigma_2^2\) 的检验:
\[ F = \frac{S_1^2}{S_2^2} \sim F(n_1 - 1, n_2 - 1) \]
  1. \(\mu_1, \mu_2\) 已知,对 \(H_0: \sigma_1^2 = \sigma_2^2\) 的检验:
\[ F = \frac{\sum_{i=1}^{n_1} \left( \frac{(X_i - \mu_1)^2}{n_1} \right)}{\sum_{i=1}^{n_2} \left( \frac{(Y_i - \mu_2)^2}{n_2} \right)} \sim F(n_1, n_2) \]

8.2.2 单个正态总体均值的假设检验

σ² 已知时的双边检验

假设:\(H_0: \mu = \mu_0, H_1: \mu \neq \mu_0\)

取检验统计量

\[ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \]

\(H_0\) 的拒绝域为:

\[ |Z| = \left| \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \right| \geq z_{\alpha/2} \]

称此检验为 “Z检验法

利用P值判断 \(H_0\) 真伪

参照 \(H_0\) 的拒绝域

\[ |Z| = \left| \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \right| \geq z_{\alpha/2} \]

对给定的样本观察值 \(x_1, \cdots, x_n\),

记检验统计量 \(Z\) 的取值为

\[ z_0 = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} \]
\[ P_- = P_{H_0} \left\{ |Z| \geq |z_0| \right\} = 2 P_{H_0} \left\{ Z \geq |z_0| \right\} = 2 \left( 1 - \Phi(|z_0|) \right) \]

(即 \(|z_0|\) 代替了拒绝域式中的 \(z_{\alpha/2}\)

判断: - 当 \(P_- \leq \alpha\) 时,拒绝原假设,

  • 否则,接受原假设。

σ²未知时的双边检验

原假设和备择假设:\(H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0\)

由于\(σ^2\)未知,故不能用 \(\frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}\) 来确定拒绝域了。

取检验统计量:\(t = \frac{\bar{X} - \mu_0}{S / \sqrt{n}}\)

\(H_0\) 的拒绝域为

\[ |t| = \left| \frac{\bar{X} - \mu_0}{S / \sqrt{n}} \right| \geq t_{\alpha/2}(n - 1) \]

称此检验为 \(t\) 检验法

对给定的样本观察值 \(x_1, \cdots, x_n\),记检验统计量 \(t\) 的取值为

\[ t_0 = \frac{\bar{x} - \mu_0}{s / \sqrt{n}} \]

则有(拒绝域为:\(|t| \geq t_{\alpha/2}(n-1)\)

\[ \begin{aligned} P_- &= P_{H_0} \left( |t| \geq |t_0| \right) = P_{H_0} \left( \{ t \geq |t_0| \} \cup \{ t \leq -|t_0| \} \right)\\ &= 2 P(t \geq |t_0|) = 2 P(t(n-1) \geq |t_0|) \end{aligned} \]

\(P_- \leq \alpha\) 时,拒绝原假设,

\(P_- > \alpha\) 时,接受原假设。

σ²未知时的左右边检验

右边检验的原假设和备择假设:\(H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0\)

取检验统计量:\(t = \frac{\bar{X} - \mu_0}{S / \sqrt{n}}\)

\(H_0\) 的拒绝域为

\[ t = \frac{\bar{X} - \mu_0}{S / \sqrt{n}} \geq t_{\alpha}(n - 1) \]

P值计算

\[ P_- = \sup_{\mu \leq \mu_0} \{ t \geq t_0 \} = P \left\{ t(n - 1) \geq t_0 \right\} \]

左边检验的原假设和备择假设:\(H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0\)

\(H_0\) 的拒绝域是什么?

\[ t = \frac{\bar{X} - \mu_0}{S / \sqrt{n}} \leq -t_{\alpha}(n - 1) \]

P值计算

\[ P_- = \sup_{\mu \geq \mu_0} \{ t \leq t_0 \} = P \left\{ t(n - 1) \leq t_0 \right\} \]

Example

两者结果均正确!但答案并不相同

我们可以发现H0和H1的认定会影响结果的判断,主要是因为H0和H1之间的地位并不相同,H0是受保护的一方

所以考试的时候一般会给你相应的H0和H1

8.2.3 单个正态总体方差的假设检验

原假设与备择假设:\(H_0: \sigma^2 = \sigma_0^2, \quad H_1: \sigma^2 \neq \sigma_0^2\)

检验统计量:\(\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)\)

原假设 \(H_0\) 的拒绝域

\[ \frac{(n-1)S^2}{\sigma_0^2} \leq \chi^2_{1-\alpha/2}(n-1) \text{ 或 } \frac{(n-1)S^2}{\sigma_0^2} \geq \chi^2_{\alpha/2}(n-1) \]

双边检验的P值,令\(\chi_0^2 = (n-1)S^2 / \sigma_0^2\)

\(P_- = 2 \min \left\{ P[\chi^2(n-1) \leq \chi_0^2], P[\chi^2(n-1) \geq \chi_0^2] \right\}\)

简化的P值:\(p_0 = P\{\chi^2(n-1) \leq \chi_0^2\}\) 得到 \(P_- = 2 \min \left\{ p_0, 1 - p_0 \right\}\)

单边假设检验

Example

8.2.4 两个正态总体均值的假设检验

数据 - \(X_1, X_2, \ldots, X_{n_1}\) 来自 \(N(\mu_1, \sigma_1^2)\)。 - \(Y_1, Y_2, \ldots, Y_{n_2}\) 来自 \(N(\mu_2, \sigma_2^2)\)

\(\bar{X}, \bar{Y}, S_1^2, S_2^2\) 分别为第一、二个总体的样本均值和方差,显著性水平为 \(\alpha\)

原假设与备择假设

  • \(H_0: \mu_1 - \mu_2 = \delta\)
  • \(H_1: \mu_1 - \mu_2 \neq \delta\)

(其中 \(\delta\) 为已知常数,通常为 0)

\(\sigma_1^2\)\(\sigma_2^2\) 已知时

原假设与备择假设:\(H_0: \mu_1 - \mu_2 = \delta, \quad H_1: \mu_1 - \mu_2 \neq \delta\)

检验统计量,在 \(H_0\) 为真的适合,符合标准正态分布

\[ Z = \frac{\bar{X} - \bar{Y} - \delta}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \]

检验拒绝域

\[ |Z| = \frac{|\bar{X} - \bar{Y} - \delta|}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \geq z_{\alpha/2} \]

P值

\[ P_- = P_{H_0} \left\{ |Z| \geq |z_0| \right\} = 2 P_{H_0} \left\{ Z \geq |z_0| \right\} = 2 (1 - \Phi(|z_0|)) \]

\(\sigma_1^2 = \sigma_2^2 = \sigma^2\) 但未知时

原假设与备择假设:\(H_0: \mu_1 - \mu_2 = \delta, \quad H_1: \mu_1 - \mu_2 \neq \delta\) (其中 \(\delta\) 为已知常数)

检验统计量, \(t \sim t(n_1 + n_2 - 2)\)

\[ t = \frac{\bar{X} - \bar{Y} - \delta}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \]

其中

\[ S_w = \sqrt{\frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}} \]

检验拒绝域

\[ |t| = \frac{|\bar{X} - \bar{Y} - \delta|}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \geq t_{\alpha/2}(n_1 + n_2 - 2) \]

计算 P 值

\[ t_0 = \frac{\bar{x} - \bar{y} - \delta}{s_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \]
\[ P_- = P \left\{ |t| \geq |t_0| \right\} = 2 P \left\{ t(n_1 + n_2 - 2) \geq |t_0| \right\} \]

这种 t 检验被称为两样本精确 t 检验

单边假设检验

8.2.5 两个正态总体方差的假设检验

\(\sigma_1^2\)\(\sigma_2^2\) 未知时,设 \(\mu_1\), \(\mu_2\) 未知

原假设与备择假设:\(H_0: \sigma_1^2 = \sigma_2^2, \quad H_1: \sigma_1^2 \neq \sigma_2^2\)

检验统计量

\[ F = \frac{S_1^2}{S_2^2} \sim F(n_1 - 1, n_2 - 1) \]

拒绝域

\[ \frac{S_1^2}{S_2^2} \leq F_{1-\alpha/2}(n_1 - 1, n_2 - 1) \text{ 或 } \frac{S_1^2}{S_2^2} \geq F_{\alpha/2}(n_1 - 1, n_2 - 1) \]

称此检验为 \(F\) 检验法

P值

\[ P_- = 2 \min \left\{ P[F(n_1 - 1, n_2 - 1) \leq f_0], P[F(n_1 - 1, n_2 - 1) \geq f_0] \right\} \]

\(p_0 = P \left\{ F(n_1 - 1, n_2 - 1) \leq f_0 \right\}\),则

\[ P_- = 2 \min \left\{ p_0, 1 - p_0 \right\} \]

单侧假设

Example

8.3 假设检验与区间估计

若总体 \(X \sim N(\mu, \sigma^2)\)\(\mu\) 未知,\(\sigma^2\) 已知,对于样本 \(X_1, X_2, \ldots, X_n\),置信度设为 \(1 - \alpha\),则 \(\mu\) 的置信区间为:

\[ \bar{X} - \frac{\sigma}{\sqrt{n}} z_{\alpha/2} < \mu < \bar{X} + \frac{\sigma}{\sqrt{n}} z_{\alpha/2} \]

即:

\[ P \left\{ \left| \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \right| < z_{\alpha/2} \right\} = 1 - \alpha \]

对于假设检验问题 \(H_0: \mu = \mu_0\)\(H_1: \mu \neq \mu_0\),显著性水平为 \(\alpha\)

\(H_0\) 的拒绝域为:

\[ \left| \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \right| \geq z_{\alpha/2} \]

即:

\[ P_{\mu_0} \left\{ \left| \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \right| \geq z_{\alpha/2} \right\} = \alpha \]

即拒绝域可以这样得到:将置信区间不等号反向,将原假设成立时的值代入到参数中即可。

双侧置信限与双边假设检验的关系

一般,若假设检验问题 \(H_0: \theta = \theta_0\)\(H_1: \theta \neq \theta_0\) 的显著水平为 \(\alpha\) 的接受域能等价地写成 \(\hat{\theta}_L < \theta_0 < \hat{\theta}_U\),那么 \((\hat{\theta}_L, \hat{\theta}_U)\) 是参数 \(\theta\) 的置信水平为 \(1 - \alpha\) 的置信区间。

反之,若 \((\hat{\theta}_L, \hat{\theta}_U)\)\(\theta\) 的置信水平为 \(1 - \alpha\) 的置信区间,则当 \(\theta_0 \in (\hat{\theta}_L, \hat{\theta}_U)\) 时,在 \(\alpha\) 水平下接受双边检验 \(H_0: \theta = \theta_0\)\(H_1: \theta \neq \theta_0\) 中的原假设 \(H_0\),且检验的拒绝域为 \(\theta_0 \leq \hat{\theta}_L \text{ 或 } \theta_0 \geq \hat{\theta}_U\)

评论区

对你有帮助的话请给我个赞和 star => GitHub stars
欢迎跟我探讨!!!