検定とは(統計学)

/統計学

検定とは

統計学における検定とは、ある仮説に対して、それが正しいか否かを統計学的に検証する手段です。検定の基本的な用語について説明します。

  • 帰無仮説(きむかせつ)
    検定の対象になる母平均(母集団の平均)や母分(母集団の分散)散などの仮説です。$H_0$ で表します。
  • 対立仮説
    帰無仮説の反対の仮説です。$H_1$ で表します。
  • 有意水準
    帰無仮説が成立しているかどうかの判定基準で、帰無仮説が成立していない割合を表します。通常は、$5\%$ または $1\%$ が使われます。
    標準化された正規分布 $N(0,1^2)$ の場合、例えば有意水準が $5\%$ であれば、全体の $5\%$ がバラつき $\pm1.960$ の範囲外に存在することを表します。
  • 過誤
    検定で誤った判断を行うことです。統計学的手法は少ないデータから母集団全体を推し量るため、誤った結果が出ることがあります。過誤には以下の2種類があります。
  • 第1種の過誤
    本当は帰無仮説が成り立っているのに、棄却する誤りで、この誤りを犯す確率は有意水準 $\alpha$ に等しくなります。
  • 第2種の過誤
    本当は帰無仮説が成り立っていないのに、棄却しない誤りで、この誤りを犯す確率は $\beta$($0\sim1-\alpha$)で表されます。

    母平均の検定

    母平均に対する検定の手順は以下になります。尚、母分散は未知と仮定します。

    帰無仮説の設定

    帰無仮説として母平均 $\mu_0$ を仮定します。

    帰無仮説 $H_0$ $\mu=\mu_0$
    対立仮説 $H_1$ $\mu\ne\mu_0$

    検定統計量の計算

    $x_1\sim x_n$ が $N(\mu,\sigma^2)$ に従うとき、$\bar{x}$ は $N(\mu,\sigma^2/n)$ に従い、$\bar{x}$ を標準化して得られる以下の $u$ は $N(0,1^2)$ に従います。

    $$u=\frac{\bar{x}-\mu}{\sqrt{\sigma^2/n}}$$

    ここでは母分散 $\sigma^2$ は未知としているので、代わりに点推定量 $V$ に置き換えると、以下の $t$ は自由度 $\phi=n-1$ の $t$ 分布に従うことが知られています。

    $$t=\frac{\bar{x}-\mu}{\sqrt{V/n}}$$

    以上より、検定統計量 $t_0$ を帰無仮説 $\mu_0$ を用いて計算します。

    $$t_0=\frac{\bar{x}-\mu_0}{\sqrt{V/n}}$$

    有意判定

    有意水準 $\alpha$ は通常 $0.05$ または $0.01$ が選ばれます。対立仮設と棄却域は以下で設定されます。

    対立仮設 棄却域
    $H_1$:$\mu\ne\mu_0$ $|t_0|\gt t(\phi,\alpha)$

    検定統計量 $t_0$ が、自由度 $\phi$ と有意水準 $\alpha$ から得られる分布の値より大きい(棄却域)場合、対立仮設が成り立つ、言い換えると帰無仮説は不成立と判定されます。

    $|t_0|\ne$ 棄却域 帰無仮説 $\mu_0$ を採択(成立) 有意水準 $\alpha$ で有意で”ない”
    $|t_0|=$ 棄却域 帰無仮説 $\mu_0$ を棄却(不成立) 有意水準 $\alpha$ で有意で”ある”

    母分散の検定

    母分散に対する検定の手順は以下になります。

    帰無仮説の設定

    帰無仮説として母分散 $\sigma_0^2$ を仮定します。

    帰無仮説 $H_0$ $\sigma^2=\sigma_0^2$
    対立仮説 $H_1$ $\sigma^2\ne\sigma_0^2$

    検定統計量の計算

    $x_1\sim x_n$ が $N(\mu,\sigma^2)$ に従うとき、以下の $\chi^2$ は自由度 $\phi=n-1$ の $\chi^2$(カイ2乗)分布に従うことが知られています。

    $$\chi^2=\frac{S}{\sigma^2}$$

    以上より、検定統計量 $\chi_0^2$ を帰無仮説 $\sigma_0^2$ を用いて計算します。

    $$\chi_0^2=\frac{S}{\sigma_0^2}$$$$S=\sum_{i=1}^nx_i^2-\frac{1}{2}\Big(\sum_{i=1}^nx_i\Big)^2$$

    有意判定

    有意水準 $\alpha$ は通常 $0.05$ または $0.01$ が選ばれます。対立仮設と棄却域は以下で設定されます。

    対立仮設 棄却域
    $H_1$:$\sigma^2\ne\sigma_0^2$ $\chi_0^2\le \chi^2(\phi,1-\alpha/2)$
    $\chi_0^2\ge \chi^2(\phi,\alpha/2)$

    検定統計量 $\chi_0^2$ が棄却域に含まれる場合、対立仮設が成り立つ、言い換えると帰無仮説は不成立と判定されます。

    $\chi_0^2\ne$ 棄却域 帰無仮説 $\sigma_0^2$ を採択(成立) 有意水準 $\alpha$ で有意で”ない”
    $\chi_0^2=$ 棄却域 帰無仮説 $\sigma_0^2$ を棄却(不成立) 有意水準 $\alpha$ で有意で”ある

    2つの母平均の検定

    2つの母平均 $\mu_1,\mu_2$ の比較(差)についての検定の手順は以下になります。尚、母分散 $\sigma_1,\sigma_2$ は未知と仮定します。

    帰無仮説の設定

    帰無仮説として母平均 $\mu_1=\mu_2$ を仮定します。

    帰無仮説 $H_0$ $\mu_1=\mu_2$
    対立仮説 $H_1$ $\mu_1\ne\mu_2$

    検定統計量の計算

    $x_{11}\sim x_{1n}$ が $N(\mu_1,\sigma_1^2)$ に従い、$x_{21}\sim x_{2n}$ が $N(\mu_2,\sigma_2^2)$ に従うとき、$\bar{x}_1-\bar{x}_2$ は $N\Big(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}\Big)$ に従い、$\bar{x}_1-\bar{x}_2$ を標準化して得られる以下の $u$ は $N(0,1^2)$ に従います。

    $$u=\frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}$$

    ここでは母分散 $\sigma_1^2,\sigma_2^2$ は未知としているので、代わりに点推定量 $V_1,V_2$ に置き換えると、以下の $t$ は自由度 $\phi^*$ の $t$ 分布に近似的に従うことが知られています。

    $$t=\frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}$$

    $$\phi^*=\frac{\Big(\frac{V_1}{n_1}+\frac{V_2}{n_2}\Big)^2}{\frac{1}{\phi_1}\Big(\frac{V_1}{n_1}\Big)^2+\frac{1}{\phi_2}\Big(\frac{V_2}{\phi_2}\Big)^2}$$$$\phi_1=n_1-1 , \phi_2=n_2-1$$

    以上より、検定統計量 $t_0$ を帰無仮説 $\mu_1=\mu_2$ を用いて計算します。

    $$t_0=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}$$

    有意判定

    有意水準 $\alpha$ は通常 $0.05$ または $0.01$ が選ばれます。対立仮設と棄却域は以下で設定されます。

    対立仮設 棄却域
    $H_1$:$\mu_1\ne\mu_2$ $|t_0|\ge t(\phi^*,\alpha)$

    検定統計量 $t_0$ が、自由度 $\phi^*$ と有意水準 $\alpha$ から得られる分布の値より大きい(棄却域)場合、対立仮設が成り立つ、言い換えると帰無仮説は不成立と判定されます。

    $|t_0|\ne$ 棄却域 帰無仮説 $\mu_1=\mu_2$ を採択(成立) 有意水準 $\alpha$ で有意で”ない”
    $|t_0|=$ 棄却域 帰無仮説 $\mu_1=\mu_2$ を棄却(不成立) 有意水準 $\alpha$ で有意で”ある”

    2つの母分散の検定

    2つの母分散 $\sigma_1,\sigma_2$ の比較(比)についての検定の手順は以下になります。

    帰無仮説の設定

    帰無仮説として母分散 $\sigma_1^2=\sigma_2^2$ を仮定します。

    帰無仮説 $H_0$ $\sigma_1^2=\sigma_2^2$
    対立仮説 $H_1$ $\sigma_1^2\ne\sigma_2^2$

    検定統計量の計算

    $x_{11}\sim x_{1n}$ が $N(\mu_1,\sigma_1^2)$ に従い、$x_{21}\sim x_{2n}$ が $N(\mu_2,\sigma_2^2)$ に従うとき、以下の $F$ は自由度 $\phi_1=n_1-1$ 、$\phi_2=n_2-1$ の $F$ 分布に従うことが知られています。

    $$F=\frac{V_1/\sigma_1^2}{V_2/\sigma_2^2}$$

    以上より、検定統計量 $F_0$ を帰無仮説 $\sigma_1^2=\sigma_2^2$ を用いて、$V_1\ge V_2$ と $V_1\lt V_2$ に分けて計算します。

    $$F_0=\frac{V_1}{V_2}  (V_1\ge V_2)$$$$F_0=\frac{V_2}{V_1}  (V_1\lt V_2)$$

    有意判定

    有意水準 $\alpha$ は通常 $0.05$ または $0.01$ が選ばれます。対立仮設と棄却域は以下で設定されます。

    対立仮設 棄却域
    $H_1$:$\sigma_1^2\ne\sigma_2^2$ $V_1\ge V_2$ $F_0\ge F(\phi_1,\phi_2,\alpha/2)$
    $V_1\lt V_2$ $F_0\ge F(\phi_2,\phi_1,\alpha/2)$

    検定統計量 $F_0$ が棄却域に含まれる場合、対立仮設が成り立つ、言い換えると帰無仮説は不成立と判定されます。

    $F_0\ne$ 棄却域 帰無仮説 $\sigma_1^2=\sigma_2^2$ を採択(成立) 有意水準 $\alpha$ で有意で”ない”
    $F_0=$ 棄却域 帰無仮説 $\sigma_1^2=\sigma_2^2$ を棄却(不成立) 有意水準 $\alpha$ で有意で”ある

     

    数学
    解析学、代数学、幾何学、統計学、論理・基礎論、情報・暗号、機械学習、金融・ゲーム理論、高校数学
    散策路TOP
    数学、応用数学、古典物理、量子力学、物性論、電子工学、IT、力学、電磁気学、熱・統計力学、連続体力学、解析学、代数学、幾何学、統計学、論理・基礎論、プラズマ物理、量子コンピュータ、情報・暗号、機械学習、金融・ゲーム理論

     

    タイトルとURLをコピーしました