二項分布とは

/統計学

二項分布

二項分布とは、成功か失敗のいずれかの結果となる試行(ベルヌーイ試行)を複数回行ったときの成功の割合を表す確率分布です。

また二項分布は、製品の不良率が従う分布でもあります。不良率とは、$n$ 個の製品をランダムに選んだとき、その中に存在する不良品の割合です。不良品の数を $r$ 、母不良率を $p$ とすると、二項分布は以下の式で与えられます。

$$f_r={}_nC_rp^r(1-p)^{n-r}  -①$$$${}_nC_r\equiv\frac{n!}{r!(n-r)!}$$

$f_r$ は確率分布であるため、総和は1になります。

$$\sum_{r=0}^nf_r=1$$

期待値

二項分布に従う確率変数 $x$ の期待値は以下になります。(導出

$$E(x)=\sum_{r=0}^nxf_x=np  -②$$

分散

二項分布に従う確率変数 $x$ の分散は以下になります。(導出

$$V(x)=np(1-p)  -③$$

統計量

統計量は実際にサンプリングにより得られた値です。$n$ 個の製品中に $x$ 個の不良品があった場合の不良率 $\hat{p}$(統計量)は以下で得られます。

$$\hat{p}=\frac{x}{n}$$

この不良率の期待値と分散は、②と③および分散の関係式により以下で求められます。

$$E(\hat{p})=E\Big(\frac{x}{n}\Big)=\frac{E(x)}{n}=p$$$$V(\hat{p})=V\Big(\frac{x}{n}\Big)=\frac{V(x)}{n^2}=\frac{p(1-p)}{n}$$

正規近似

母数 $n$ が十分大きい場合、二項分布は正規分布に近似されます。

$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp{\Big(-\frac{(x-\mu)^2}{2\sigma^2}\Big)}$$$$=\frac{1}{\sqrt{2\pi np(1-p)}}\exp{\Big(-\frac{(x-np)^2}{2np(1-p)}\Big)}$$

導出

期待値を導く

②の左辺に①を代入すると、

$$\sum_{x=0}^nxf_x=\sum_{x=0}^n\frac{xn!}{x!(n-x)!}p^x(1-p)^{n-x}$$

$r=0$ の項は0になるため、

$$=\sum_{x=1}^n\frac{xn!}{x!(n-x)!}p^x(1-p)^{n-x}$$$$=np\sum_{x=1}^n\frac{(n-1)!}{(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x}$$

ここで $s=x-1$ と置くと、

$$=np\sum_{s=0}^{n-1}\frac{(n-1)!}{s![(n-1)-s]!}p^s(1-p)^{(n-1)-s}$$

ここで和の部分について、二項定理

$$\sum_{s=0}^m\frac{m!}{s!(m-s)!}a^sb^{m-s}=(a+b)^m  -④$$

で $m\to n-1$ 、$a\to p$ 、$b\to 1-p$ と置き換えると、

$$\sum_{x=0}^nxf_x=np\Big(p+(1-p)\Big)^{n-1}=np$$

以上より②が得られることが分かります。

分散を導く

分散と期待値の関係式より、

$$V(x)=E(x^2)-E^2(x)$$$$=E\Big(x(x-1)+x\Big)-E^2(x)$$$$=E\Big(x(x-1)\Big)+E(x)-E^2(x)$$

この第2項と第3項は②より得られるため、③を計算します。

$$E\Big(x(x-1)\Big)=\sum_{x=0}^nx(x-1)f_x$$$$=\sum_{x=0}^n\frac{x(x-1)n!}{x!(n-x)!}p^x(1-p)^{n-x}$$

$x=0,1$ の項は0になるため、

$$=\sum_{x=2}^n\frac{x(x-1)n!}{x!(n-x)!}p^x(1-p)^{n-x}$$$$=n(n-1)p^2\sum_{x=2}^n\frac{(n-2)!}{(x-2)!(n-x)!}p^{x-2}(1-p)^{n-x}$$

ここで $s=x-2$ と置くと、

$$=n(n-1)p^2\sum_{s=0}^{n-2}\frac{(n-2)!}{s![(n-2)-s]!}p^s(1-p)^{(n-2)-s}$$

ここで和の部分について、二項定理④で $m\to n-2$ 、$a\to p$ 、$b\to 1-p$ と置き換えると、

$$=n(n-1)p^2\Big(p+(1-p)\Big)^{n-2}=n(n-1)p^2$$

従って、

$$V(x)=E\Big(x(x-1)\Big)+E(x)-E^2(x)$$$$=n(n-1)p^2+np-(np)^2=np(1-p)$$

以上より③が得られることが分かります。

 

数学
解析学、代数学、幾何学、統計学、論理・基礎論、情報・暗号、機械学習、金融・ゲーム理論、高校数学
散策路TOP
数学、応用数学、古典物理、量子力学、物性論、電子工学、IT、力学、電磁気学、熱・統計力学、連続体力学、解析学、代数学、幾何学、統計学、論理・基礎論、プラズマ物理、量子コンピュータ、情報・暗号、機械学習、金融・ゲーム理論

 

タイトルとURLをコピーしました