まずはじめに期待値と分散についておさらいします。
期待値と分散
確率空間(Ω,F,P)上で定義された確率変数をXとし、次のように定義する。
この記事の定義では、厳密に極限などの範囲を扱っていないので注意してください。
離散型の定義
高々加算個の確率変数X(離散型確率変数)をとるとき、
Xの期待値と分散は
E[X]Var[X]=i=1∑∞xiP(X=xi)=i=1∑∞(xi−E[X])2P(X=xi)
連続型の定義
確率密度関数がf(x)をとるとき、
E[X]Var[X]=∫−∞∞xf(x)dx=∫−∞∞(x−E[X])2f(x)dx
分散の定義
分散は期待値の定義を用いて、以下のように表すこともできる。
Var[X]=E[(X−E[X])2]=E[X2]−(E[X])2
代表的な分布
期待値と分散が与えられたので、代表的な分布の期待値と分散の証明を行う。
それぞれポイントとなる部分があるので、その部分をしっかりと理解しておこう。
今回は確率母関数や特性関数を使用せず、定義から素直に導出する。
ベルヌーイ分布
x1=0で確率p、x2=1で確率q=1−pをとる離散確率分布である。
母数は、
0≤p≤1
確率関数は、
P(X=k)=pk(1−p)1−kk=0,1
ベルヌーイ分布の期待値
E[X]=0P(X=0)+1P(X=1)=0q+1p=p
ベルヌーイ分布の分散
Var[X]=(0−E[X])2P(X=0)+(1−E[X])2P(X=1)=(0−p)2q+(1−p)2p=p2q+pq2=pq(p+q)
P(Ω)=p+q=1であるため、
Var[X]=pq
二項分布
母数は、
n∈{0,1,2,⋯}0≤p≤1
確率関数は、
P(X=k)=(kn)pk(1−p)n−kk=0,1,2,⋯,n
二項分布の期待値
E[X]=k=0∑nkP(X=k)=k=0∑nk(kn)pk(1−p)n−k
k=0の項は0、n−k=(n−1)−(k−1)、(kn)=(n−k)!k!n!より、
=k=1∑nk(n−k)!k!n!pk(1−p)n−k=k=1∑nk((n−1)−(k−1))!k(k−1)!n(n−1)!pk(1−p)n−k=nk=1∑n(k−1n−1)pk(1−p)n−k
i=k−1とすると、
=npi=0∑n−1(in−1)pi(1−p)n−1−i
二項定理(a+b)n=k=0∑n(kn)an−kbkより、
=np(p+(1−p))n−1=np
二項分布の分散
Var[X]=E[X2]−(E[X])2を用いて証明を行う。
k2=k(k−1)+k、k=0,1の項は0より、
E[X2]=k=0∑nk2P(X=k)=k=2∑nk(k−1)(kn)pk(1−p)n−k+E[X]=k=2∑nk(k−1)((n−2)−(k−2))!k(k−1)(k−2)!n(n−1)(n−2)!pk(1−p)n−k+E[X]=n(n−1)k=2∑n(k−2n−2)pk(1−p)n−k+E[X]
i=k−2とすると、
=n(n−1)p2i=0∑n−2(in−2)pi(1−p)n−2−i+E[X]=n(n−1)p2(p+(1−p))n−2+np=n(n−1)p2+np
よって
Var[X]=E[X2]−(E[X])2=n(n−1)p2+np−(np)2=−np2+np=np(−p+1)=npq
ポアソン分布
母数は、
0<λ
確率関数は、
P(X=k)=k!λke−λk=0,1,2,⋯
ポアソン分布の期待値
E[X]=k=0∑∞kP(X=k)=k=1∑∞kk!λke−λ=λe−λk=1∑∞(k−1)!λk−1
exのマクローリン展開i=0∑∞i!xi=1+x+2!x2+⋯、i=k−1より、
=λe−λi=0∑∞i!λi=λeλ−λ=λ
ポアソン分布の分散
Var[X]=E[X2]−(E[X])2を用いて証明を行う。
k2=k(k−1)+k、k=0,1の項は0より、
E[X2]=k=0∑∞k2P(X=k)=k=2∑∞k(k−1)k!λke−λ+E[X]=λ2e−λk=2∑∞(k−2)!λk−2+E[X]=λ2eλ−λ+E[X]=λ2+λ
よって
Var[X]=E[X2]−(E[X])2=λ2+λ−(λ)2=λ
連続一様分布
母数は、
−∞<a<b<∞
確率密度関数は、
f(x)=b−a1a≤x≤b
連続一様分布の期待値
E[X]=∫−∞∞xf(x)dx=∫abxb−a1dx=[21b−a1x2]ab=2(b−a)b2−a2=2a+b
連続一様分布の分散
Var[X]=E[X2]−(E[X])2を用いて証明を行う。
連続一様分布ではf(x)は定数であるため、
E[X2]=∫abx2f(x)dx=f(x)[31x3]ab=3(b−a)b3−a3
a3+b3=(a+b)(a2−ab+b2)より、
=3b2+ab+a2
よって
Var[X]=E[X2]−(E[X])2=3b2+ab+a2−(2a+b)2=124(b2+ab+a2)−3(a2+2ab+b2)=12b2−2ab+a2=12(b−a)2
指数分布
母数は、
0<λ
確率密度関数は、
f(x)=λe−λx0≤x
指数分布の期待値
E[X]=∫−∞∞xf(x)dx=∫0∞xλe−λxdx=[xλ(−λ1)e−λx]0∞−∫0∞−e−λxdx
x→∞limxe−x=0より、(はさみうちの原理を用いて導出できる)
=0−[λ1e−λx]0∞=λ1
指数分布の分散
Var[X]=E[X2]−(E[X])2を用いて証明を行う。
E[X2]=∫−∞∞x2f(x)dx=∫0∞x2λe−λxdx=[x2λ(−λ1)e−λx]0∞−(−λ2)∫0∞λxe−λxdx=[x2λ(−λ1)e−λx]0∞−(−λ2)E[X]=λ22
よって
Var[X]=E[X2]−(E[X])2=λ22−(λ1)2=λ21