二項分布
二項分布とは、成功か失敗のいずれかの結果となる試行(ベルヌーイ試行)を複数回行ったときの成功の割合を表す確率分布です。
また二項分布は、製品の不良率が従う分布でもあります。不良率とは、$n$ 個の製品をランダムに選んだとき、その中に存在する不良品の割合です。不良品の数を $r$ 、母不良率を $p$ とすると、二項分布は以下の式で与えられます。
$$f_r={}_nC_rp^r(1-p)^{n-r} -①$$$${}_nC_r\equiv\frac{n!}{r!(n-r)!}$$
$f_r$ は確率分布であるため、総和は1になります。
$$\sum_{r=0}^nf_r=1$$
期待値
二項分布に従う確率変数 $x$ の期待値は以下になります。(導出)
$$E(x)=\sum_{r=0}^nxf_x=np -②$$
分散
二項分布に従う確率変数 $x$ の分散は以下になります。(導出)
$$V(x)=np(1-p) -③$$
統計量
統計量は実際にサンプリングにより得られた値です。$n$ 個の製品中に $x$ 個の不良品があった場合の不良率 $\hat{p}$(統計量)は以下で得られます。
$$\hat{p}=\frac{x}{n}$$
この不良率の期待値と分散は、②と③および分散の関係式により以下で求められます。
$$E(\hat{p})=E\Big(\frac{x}{n}\Big)=\frac{E(x)}{n}=p$$$$V(\hat{p})=V\Big(\frac{x}{n}\Big)=\frac{V(x)}{n^2}=\frac{p(1-p)}{n}$$
正規近似
母数 $n$ が十分大きい場合、二項分布は正規分布に近似されます。
$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp{\Big(-\frac{(x-\mu)^2}{2\sigma^2}\Big)}$$$$=\frac{1}{\sqrt{2\pi np(1-p)}}\exp{\Big(-\frac{(x-np)^2}{2np(1-p)}\Big)}$$
導出
期待値を導く
②の左辺に①を代入すると、
$$\sum_{x=0}^nxf_x=\sum_{x=0}^n\frac{xn!}{x!(n-x)!}p^x(1-p)^{n-x}$$
$r=0$ の項は0になるため、
$$=\sum_{x=1}^n\frac{xn!}{x!(n-x)!}p^x(1-p)^{n-x}$$$$=np\sum_{x=1}^n\frac{(n-1)!}{(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x}$$
ここで $s=x-1$ と置くと、
$$=np\sum_{s=0}^{n-1}\frac{(n-1)!}{s![(n-1)-s]!}p^s(1-p)^{(n-1)-s}$$
ここで和の部分について、二項定理
$$\sum_{s=0}^m\frac{m!}{s!(m-s)!}a^sb^{m-s}=(a+b)^m -④$$
で $m\to n-1$ 、$a\to p$ 、$b\to 1-p$ と置き換えると、
$$\sum_{x=0}^nxf_x=np\Big(p+(1-p)\Big)^{n-1}=np$$
以上より②が得られることが分かります。
分散を導く
分散と期待値の関係式より、
$$V(x)=E(x^2)-E^2(x)$$$$=E\Big(x(x-1)+x\Big)-E^2(x)$$$$=E\Big(x(x-1)\Big)+E(x)-E^2(x)$$
この第2項と第3項は②より得られるため、③を計算します。
$$E\Big(x(x-1)\Big)=\sum_{x=0}^nx(x-1)f_x$$$$=\sum_{x=0}^n\frac{x(x-1)n!}{x!(n-x)!}p^x(1-p)^{n-x}$$
$x=0,1$ の項は0になるため、
$$=\sum_{x=2}^n\frac{x(x-1)n!}{x!(n-x)!}p^x(1-p)^{n-x}$$$$=n(n-1)p^2\sum_{x=2}^n\frac{(n-2)!}{(x-2)!(n-x)!}p^{x-2}(1-p)^{n-x}$$
ここで $s=x-2$ と置くと、
$$=n(n-1)p^2\sum_{s=0}^{n-2}\frac{(n-2)!}{s![(n-2)-s]!}p^s(1-p)^{(n-2)-s}$$
ここで和の部分について、二項定理④で $m\to n-2$ 、$a\to p$ 、$b\to 1-p$ と置き換えると、
$$=n(n-1)p^2\Big(p+(1-p)\Big)^{n-2}=n(n-1)p^2$$
従って、
$$V(x)=E\Big(x(x-1)\Big)+E(x)-E^2(x)$$$$=n(n-1)p^2+np-(np)^2=np(1-p)$$
以上より③が得られることが分かります。