検定とは
統計学における検定とは、ある仮説に対して、それが正しいか否かを統計学的に検証する手段です。検定の基本的な用語について説明します。
- 帰無仮説(きむかせつ)
検定の対象になる母平均(母集団の平均)や母分(母集団の分散)散などの仮説です。$H_0$ で表します。 - 対立仮説
帰無仮説の反対の仮説です。$H_1$ で表します。 - 有意水準
帰無仮説が成立しているかどうかの判定基準で、帰無仮説が成立していない割合を表します。通常は、$5\%$ または $1\%$ が使われます。
標準化された正規分布 $N(0,1^2)$ の場合、例えば有意水準が $5\%$ であれば、全体の $5\%$ がバラつき $\pm1.960$ の範囲外に存在することを表します。 - 過誤
検定で誤った判断を行うことです。統計学的手法は少ないデータから母集団全体を推し量るため、誤った結果が出ることがあります。過誤には以下の2種類があります。 - 第1種の過誤
本当は帰無仮説が成り立っているのに、棄却する誤りで、この誤りを犯す確率は有意水準 $\alpha$ に等しくなります。 - 第2種の過誤
本当は帰無仮説が成り立っていないのに、棄却しない誤りで、この誤りを犯す確率は $\beta$($0\sim1-\alpha$)で表されます。
母平均の検定
母平均に対する検定の手順は以下になります。尚、母分散は未知と仮定します。
帰無仮説の設定
帰無仮説として母平均 $\mu_0$ を仮定します。
帰無仮説 $H_0$ | $\mu=\mu_0$ |
対立仮説 $H_1$ | $\mu\ne\mu_0$ |
検定統計量の計算
$x_1\sim x_n$ が $N(\mu,\sigma^2)$ に従うとき、$\bar{x}$ は $N(\mu,\sigma^2/n)$ に従い、$\bar{x}$ を標準化して得られる以下の $u$ は $N(0,1^2)$ に従います。
$$u=\frac{\bar{x}-\mu}{\sqrt{\sigma^2/n}}$$
ここでは母分散 $\sigma^2$ は未知としているので、代わりに点推定量 $V$ に置き換えると、以下の $t$ は自由度 $\phi=n-1$ の $t$ 分布に従うことが知られています。
$$t=\frac{\bar{x}-\mu}{\sqrt{V/n}}$$
以上より、検定統計量 $t_0$ を帰無仮説 $\mu_0$ を用いて計算します。
$$t_0=\frac{\bar{x}-\mu_0}{\sqrt{V/n}}$$
有意判定
有意水準 $\alpha$ は通常 $0.05$ または $0.01$ が選ばれます。対立仮設と棄却域は以下で設定されます。
対立仮設 | 棄却域 |
$H_1$:$\mu\ne\mu_0$ | $|t_0|\gt t(\phi,\alpha)$ |
検定統計量 $t_0$ が、自由度 $\phi$ と有意水準 $\alpha$ から得られる分布の値より大きい(棄却域)場合、対立仮設が成り立つ、言い換えると帰無仮説は不成立と判定されます。
$|t_0|\ne$ 棄却域 | 帰無仮説 $\mu_0$ を採択(成立) | 有意水準 $\alpha$ で有意で”ない” |
$|t_0|=$ 棄却域 | 帰無仮説 $\mu_0$ を棄却(不成立) | 有意水準 $\alpha$ で有意で”ある” |
母分散の検定
母分散に対する検定の手順は以下になります。
帰無仮説の設定
帰無仮説として母分散 $\sigma_0^2$ を仮定します。
帰無仮説 $H_0$ | $\sigma^2=\sigma_0^2$ |
対立仮説 $H_1$ | $\sigma^2\ne\sigma_0^2$ |
検定統計量の計算
$x_1\sim x_n$ が $N(\mu,\sigma^2)$ に従うとき、以下の $\chi^2$ は自由度 $\phi=n-1$ の $\chi^2$(カイ2乗)分布に従うことが知られています。
$$\chi^2=\frac{S}{\sigma^2}$$
以上より、検定統計量 $\chi_0^2$ を帰無仮説 $\sigma_0^2$ を用いて計算します。
$$\chi_0^2=\frac{S}{\sigma_0^2}$$$$S=\sum_{i=1}^nx_i^2-\frac{1}{2}\Big(\sum_{i=1}^nx_i\Big)^2$$
有意判定
有意水準 $\alpha$ は通常 $0.05$ または $0.01$ が選ばれます。対立仮設と棄却域は以下で設定されます。
対立仮設 | 棄却域 |
$H_1$:$\sigma^2\ne\sigma_0^2$ | $\chi_0^2\le \chi^2(\phi,1-\alpha/2)$ $\chi_0^2\ge \chi^2(\phi,\alpha/2)$ |
検定統計量 $\chi_0^2$ が棄却域に含まれる場合、対立仮設が成り立つ、言い換えると帰無仮説は不成立と判定されます。
$\chi_0^2\ne$ 棄却域 | 帰無仮説 $\sigma_0^2$ を採択(成立) | 有意水準 $\alpha$ で有意で”ない” |
$\chi_0^2=$ 棄却域 | 帰無仮説 $\sigma_0^2$ を棄却(不成立) | 有意水準 $\alpha$ で有意で”ある |
2つの母平均の検定
2つの母平均 $\mu_1,\mu_2$ の比較(差)についての検定の手順は以下になります。尚、母分散 $\sigma_1,\sigma_2$ は未知と仮定します。
帰無仮説の設定
帰無仮説として母平均 $\mu_1=\mu_2$ を仮定します。
帰無仮説 $H_0$ | $\mu_1=\mu_2$ |
対立仮説 $H_1$ | $\mu_1\ne\mu_2$ |
検定統計量の計算
$x_{11}\sim x_{1n}$ が $N(\mu_1,\sigma_1^2)$ に従い、$x_{21}\sim x_{2n}$ が $N(\mu_2,\sigma_2^2)$ に従うとき、$\bar{x}_1-\bar{x}_2$ は $N\Big(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}\Big)$ に従い、$\bar{x}_1-\bar{x}_2$ を標準化して得られる以下の $u$ は $N(0,1^2)$ に従います。
$$u=\frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}$$
ここでは母分散 $\sigma_1^2,\sigma_2^2$ は未知としているので、代わりに点推定量 $V_1,V_2$ に置き換えると、以下の $t$ は自由度 $\phi^*$ の $t$ 分布に近似的に従うことが知られています。
$$t=\frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}$$
$$\phi^*=\frac{\Big(\frac{V_1}{n_1}+\frac{V_2}{n_2}\Big)^2}{\frac{1}{\phi_1}\Big(\frac{V_1}{n_1}\Big)^2+\frac{1}{\phi_2}\Big(\frac{V_2}{\phi_2}\Big)^2}$$$$\phi_1=n_1-1 , \phi_2=n_2-1$$
以上より、検定統計量 $t_0$ を帰無仮説 $\mu_1=\mu_2$ を用いて計算します。
$$t_0=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}$$
有意判定
有意水準 $\alpha$ は通常 $0.05$ または $0.01$ が選ばれます。対立仮設と棄却域は以下で設定されます。
対立仮設 | 棄却域 |
$H_1$:$\mu_1\ne\mu_2$ | $|t_0|\ge t(\phi^*,\alpha)$ |
検定統計量 $t_0$ が、自由度 $\phi^*$ と有意水準 $\alpha$ から得られる分布の値より大きい(棄却域)場合、対立仮設が成り立つ、言い換えると帰無仮説は不成立と判定されます。
$|t_0|\ne$ 棄却域 | 帰無仮説 $\mu_1=\mu_2$ を採択(成立) | 有意水準 $\alpha$ で有意で”ない” |
$|t_0|=$ 棄却域 | 帰無仮説 $\mu_1=\mu_2$ を棄却(不成立) | 有意水準 $\alpha$ で有意で”ある” |
2つの母分散の検定
2つの母分散 $\sigma_1,\sigma_2$ の比較(比)についての検定の手順は以下になります。
帰無仮説の設定
帰無仮説として母分散 $\sigma_1^2=\sigma_2^2$ を仮定します。
帰無仮説 $H_0$ | $\sigma_1^2=\sigma_2^2$ |
対立仮説 $H_1$ | $\sigma_1^2\ne\sigma_2^2$ |
検定統計量の計算
$x_{11}\sim x_{1n}$ が $N(\mu_1,\sigma_1^2)$ に従い、$x_{21}\sim x_{2n}$ が $N(\mu_2,\sigma_2^2)$ に従うとき、以下の $F$ は自由度 $\phi_1=n_1-1$ 、$\phi_2=n_2-1$ の $F$ 分布に従うことが知られています。
$$F=\frac{V_1/\sigma_1^2}{V_2/\sigma_2^2}$$
以上より、検定統計量 $F_0$ を帰無仮説 $\sigma_1^2=\sigma_2^2$ を用いて、$V_1\ge V_2$ と $V_1\lt V_2$ に分けて計算します。
$$F_0=\frac{V_1}{V_2} (V_1\ge V_2)$$$$F_0=\frac{V_2}{V_1} (V_1\lt V_2)$$
有意判定
有意水準 $\alpha$ は通常 $0.05$ または $0.01$ が選ばれます。対立仮設と棄却域は以下で設定されます。
対立仮設 | 棄却域 | |
$H_1$:$\sigma_1^2\ne\sigma_2^2$ | $V_1\ge V_2$ | $F_0\ge F(\phi_1,\phi_2,\alpha/2)$ |
$V_1\lt V_2$ | $F_0\ge F(\phi_2,\phi_1,\alpha/2)$ |
検定統計量 $F_0$ が棄却域に含まれる場合、対立仮設が成り立つ、言い換えると帰無仮説は不成立と判定されます。
$F_0\ne$ 棄却域 | 帰無仮説 $\sigma_1^2=\sigma_2^2$ を採択(成立) | 有意水準 $\alpha$ で有意で”ない” |
$F_0=$ 棄却域 | 帰無仮説 $\sigma_1^2=\sigma_2^2$ を棄却(不成立) | 有意水準 $\alpha$ で有意で”ある |