検定とは、ある仮説に対して、それが正しいか否かを統計学的に検証する手段です。また推定とは、母集団を特徴づける母数を統計学的に統計学的に推測することです。
以下は、母集団の平均(以下、母平均)を例にとり、検定と推定を説明します。尚、母集団の分散(以下、母分散)は既知と仮定します。
検定
検定の基本的な用語について説明します。
帰無仮説
帰無仮説(きむかせつ)とは、検定の対象になる仮説で、ここでは母平均($\mu$)がある値($\mu_0$)であるとする仮説を立てます。そうでないとする反対の仮説を対立仮説と呼びます。
帰無仮説($H_0$) | $\mu=\mu_0$ |
対立仮説($H_1$) | $\mu\ne\mu_0$ |
有意水準
有意水準とは、帰無仮説が成立しているかどうかの判定基準で、帰無仮説が成立していない割合を表します。通常は、5%または1%が使われます。
標準化された正規分布 $N(0,1^2)$ の場合、例えば有意水準が5%であれば、バラつき ±1.960 の範囲内に、全体の95%(100%-5%)が含まれます。有意水準($\alpha$)との関係は以下になります。
$\alpha=0.05$ | $P(|u|\le1.960)=0.95$ |
$\alpha=0.01$ | $P(|u|\le2.576)=0.99$ |
従って、サンプルの平均($\bar{x}$)より標準化された平均 $u$ を計算し、
$$u=\frac{\bar{x}-\mu_0}{\sqrt{\sigma^2/n}} -①$$
それが有意水準から外れているかどうかで判定します。ここで、$n$ はサンプル数で、母分散($\sigma^2$)は既知であるとします。ここで「有意である」とは、偶然とは考えにくい(誤差の範囲から外れている)という意味になります。
$|u|\le1.960$ | 帰無仮説 $H_0$ を採択(成立) | 有意水準5%で有意で”ない” |
$|u|\gt1.960$ | 帰無仮説 $H_0$ を棄却(不成立) | 有意水準5%で有意で”ある” |
過誤
過誤とは、検定で誤った判断を行うことです。統計学的手法は少ないデータから母集団全体を推し量るため、誤った結果が出ることがあります。過誤には以下の2種類があります。
- 第1種の過誤:本当は帰無仮説が成り立っているのに、棄却する誤り
⇒この誤りを犯す確率は有意水準 $\alpha$ に等しい - 第2種の過誤:本当は帰無仮説が成り立っていないのに、棄却しない誤り
⇒この誤りを犯す確率は $\beta$($0\sim1-\alpha$)で表す
推定
推定の手法は、点推定と区間推定の2つがあります。
点推定
点推定とは、未知の母数の値($\theta$)をデータより推測する作業です。このとき、データより求められた値($\hat{\theta}$)を推定量(推定値)と呼びます。尚、不偏推定量とは、その期待値が母数と一致する推定量です。
$$E(\hat{\theta})=\theta$$
確率変数 $x$ が正規分布 $N(\mu,\sigma^2)$ に従う場合、以下になります。
$E(\bar{x})=\mu$ | $\bar{x}$ は $\mu$ の不偏推定量である |
$E(V)=\sigma^2$ | $V$ は $\sigma^2$ の不偏推定量である |
区間推定
区間推定とは、データから未知の母数($\theta$)の値の存在範囲を推定する作業です。例えば、有意水準5%の場合、以下が成り立つため、
$$P(-1.960\le u\le1.960)=0.95$$
これに、 ①で $\mu_0\to\mu$(母平均)として代入し、整理すると以下が得られます。
$$P\Big(\bar{x}-1.960\sqrt{\frac{\sigma^2}{n}}\le\mu\le\bar{x}+1.960\sqrt{\frac{\sigma^2}{n}}\Big)=0.95$$
この式は、「母平均 $\mu$ が区間($\bar{x}-1.960\sqrt{\sigma^2/n}$、$\bar{x}+ 1.960\sqrt{\sigma^2/n}$)に含まれる確率は95%である」ことを意味します。確率95%を信頼率、得られる区間を信頼区間と呼びます。