指数型分布族の定義
まずは簡単に指数型分布族の定義を確認します。
確率変数Xが1つの未知パラメータθを持つ確率分布に従うとし、Xの確率分布が確率(密度)関数f(x;θ)を持つとしましょう。
この時、確率密度関数が以下の式によって表記できる場合、その分布は指数型分布族に属するといいます。
f(x;θ)=exp[a(x)b(θ)+c(θ)+d(x)]
a(.),b(.),c(.)やd(.)は既知である関数とする。
さらに、a(x)=xを満たす場合、その分布は正準形(canoncial form)であると言います。また、未知パラメータ以外に他のパラメータが存在した場合、そのパラメータを局外パラメータ(nuisance parameter)と見なして扱うものとします。
指数型分布族の性質を利用した期待値と分散の求め方
この求め方は、微分と積分の順序が入れ替えられるという条件の下で、任意の確率密度関数に対して以下の結果が成り立つことを用います。
∫f(x;θ)dx=1
ただし、上式の積分範囲はxのとりうる値の全体である。
確率変数Xが連続型確率変数であるという前提で議論を進めますが、もし離散型確率変数である場合、上式の積分は和に置き換わります。
さて、上式についてθに関して両辺に対して微分を行うと、以下の式となります。
dθd∫f(x;θ)dx=dθd1=0
さらに上式について左辺の積分と微分の順序を入れ替えると、以下のように表せます。
∫dθdf(x;θ)dx=0
上式は指数型分布族の性質を利用した期待値の導出の際に重要となるポイントです。
同様に、∫f(x;θ)dx=1をθに関して2回微分し、積分と微分の順序を入れ替えると、次の結果が得られます。
∫dθ2d2f(x;θ)dx=0
上式は指数型分布族の性質を利用した分散の導出の際に重要となるポイントです。
期待値の求め方
冒頭のとおり、指数型分布族に属する分布に従う確率変数Xの確率密度関数はf(x;θ)=exp[a(x)b(θ)+c(θ)+d(x)]と表すことが出来ます。
ここからはa(X)の期待値を求めることを考えます。
上式のように表せられる f(x;θ)に対してθについて微分を行うと以下のようになります。
dθdf(x;θ)=[a(x)b′(θ)+c′(θ)]f(x;θ)
ここで、∫dθdf(x;θ)dx=0となることを利用すると、次の結果が得られます。
∫[a(x)b′(θ)+c′(θ)]f(x;θ)dx=0
ここで、期待値の定義より、∫a(x)f(x;θ)dx=E[a(X)]であり、
∫c′(θ)f(x;θ)dx=E[c′(θ)]=c′(θ)と表せます。
さらに、期待値の線形性を利用することで次のように式をまとめることができます。
b′(θ)E[a(X)]+c′(θ)=0
ここまでの結果を整理すると以下のように表せます。
a(X)の期待値
E[a(X)]=−b′(θ)c′(θ)
ここに、Xの従う確率分布が指数型分布族であると同時に正準形であった場合、a(X)=Xであることから、a(X)の期待値E[a(X)]を求めることは、Xの期待値E(X)を求めることと等しいです。
E(X)=E[a(X)]=−b′(θ)c′(θ)
分散の求め方
指数型分布族に属する確率密度関数 f(x;θ)に対してθについて2回微分を行うと次の結果を得ることができます。
dθ2d2f(x;θ)=[a(x)b′′(θ)+c′′(θ)]f(x;θ)+[a(x)b′(θ)+c′(θ)]2f(x;θ)
ここで、上式の右辺の第2項は、E[a(X)]を用いて以下のように変形できます。
[a(x)b′(θ)+c′(θ)]2f(x;θ)=[b′(θ)]2{a(x)−E[a(X)]}2f(x;θ)
また、Var[a(X)]は分散の定義より、以下のように表せます。
Var[a(X)]=E[a(X)2]−E[a(X)]2=∫{a(x)−E[a(X)]}2f(x;θ)dx
これまでの結果を∫dθ2d2f(x;θ)dx=0に代入すると、以下の式となります。
∫dθ2d2f(x;θ)=b′′(θ)E[a(X)]+c′′(θ)+[b′′(θ)]2Var[a(X)]=0
上式を整理し、さらにE[a(X)]を代入すること、次の解が得られます。
a(X)の分散
Var[a(X)]=[b′(θ)]3b′′(θ)c′(θ)−c′′(θ)b′(θ)
ここで、Xの従う確率分布が指数型分布族であると同時に正準形であった場合、a(X)=Xであることから、a(X)の分散Var[a(X)]を求めることは、Xの分散Var(X)を求めることと等しいです。
Var(X)=Var[a(X)]=[b′(θ)]3b′′(θ)c′(θ)−c′′(θ)b′(θ)
様々な確率分布の期待値・分散
ここまで説明してきた導出方法によって指数型分布族に属する確率分布の期待値・分散を記載します。
この導出方法は指数型分布族に属する分布であれば利用することができますが、特に正準形である場合はすぐに証明することができます。
正規分布
確率変数Xがパラメータμ,σ2の正規分布に従う時、確率密度関数f(x)は以下の式となります。
パラメータμ,σ2の正規分布の確率密度関数
f(x)=2πσ21exp[−2σ2(x−μ)2]
確率密度関数は次のように変形することが出来ます。
f(x)=exp[−2σ2x2+σ2xμ−2σ2μ2−21log(2πσ2)]
ここでμが未知、σ2が既知である場合を考えます。
θ=μとすると、
a(x)=x,b(μ)=σ2μ,c(μ)=−2σ2μ2−21log2πσ2,d(x)=−2σ2x2
と書けるため、この場合は1パラメータの指数型分布族に属することがわかります。
さて、b(μ), c(μ)に対してμについて1回微分を行うと以下の値を得られます。
b′(μ)=σ21, c′(μ)=−σ2μ
さらにもう1回微分するとこうなります。
b′′(μ)=0, c′′(μ)=−σ21
この時、正規分布は正準形であることから、a(X)=Xが成り立つことを利用します。
よって、Xの期待値と分散は以下の値となります。
正規分布の期待値
E(X)=E[a(X)]=−b′(μ)c′(μ)=−(σ2μ)σ21=μ
正規分布の分散
Var(X)=Var[a(X)]=[b′(θ)]3b′′(θ)c′(θ)−c′′(θ)b′(θ)=[σ21]30⋅(−σ21)−(−σ21)⋅(σ21)=σ2
正規分布の確率密度関数・積率母関数を用いた導出方法については、以下の記事をご確認ください。
積率母関数を用いた正規分布の期待値(平均)と分散の導出
確率密度関数を用いた正規分布の期待値(平均)と分散の導出
二項分布
確率変数Xがパラメータn,pの二項分布に従う時、確率密度関数F(x=k)は以下の式となります。
F(x=k)= (nk)pk(1−p)n−k (k=0,1,2,...)
この時、確率関数は次のように変形することが出来ます。
F(x=k)=exp[klogp−klog(1−p)+nlog(1−p)+log(nk)]
ここでnは既知であり、pが未知である場合を考えます。θ=pとします。この時、
a(k)=k,b(p)=log1−pp,c(p)=nlog(1−p),d(k)=log (nk)
となるので、1パラメータの指数型分布族に属することがわかります。
また、a(k)=kとなるので、正準形であることも示されています。
b(p), c(p)に対してpについて1回微分を行うと以下の結果を得られます。
b′(p)=p(1−p)1, c′(p)=−1−pn
さらにもう1回微分をすると次のようになります。
b′′(p)=[p(1−p)]22p−1, c′′(p)=−(1−p)2n
この時、二項分布は正準形であることから、a(X)=Xが成り立つことを利用します。Xの期待値と分散は以下の値となります。
二項分布の期待値
E(X)=E[a(X)]=−b′(p)c′(p)=−[p(1−p)]22p−1−1−pn=np
二項分布の分散
V(X)=V[a(X)]= [b′(θ)]3b′′(θ)c′(θ)−c′′(θ)b′(θ)=[p(1−p)1]3−p2(1−p)3n(2p−1)+p(1−p)3n=np(1−p)
二項分布の確率質量関数・積率母関数を用いた導出方法については、以下の記事をご確認ください。
確率質量関数を用いた二項分布の期待値・分散の導出
積率母関数を用いた二項分布の期待値・分散の導出
ポアソン分布
確率変数Xがパラメータλのポアソン分布に従う時、確率密度関数F(x)は以下の式となります。
F(x)= x!λxe−λ (x=0,1,2,...)
この時、確率関数は次のように変形することが出来ます。
F(x)=exp(xlogλ−λ−logx!)
θ=λとし、λは未知であるとします。この時
a(x)=x,b(λ)=logλ,c(λ)=−λ,d(x)=−log(x!)
と書けるため、ポアソン分布は1パラメータの指数型分布族に属することがわかります。
また、a(x)=xとなることから、正準形であることも言えます。
b(λ),c(λ)に対してλについて1回微分を行うと以下のようになります。
b′(λ)=λ1, c′(λ)=−1
再び微分を行うと以下の値となります。
b′′(λ)=−λ21, c′′(λ)=0
ここでポアソン分布は正準形であることから、a(X)の期待値を求めることとXの期待値を求めることは同値です。よって、Xの期待値と分散は以下の値となります。
ポアソン分布の期待値
E(X)=E[a(X)]=−b′(λ)c′(λ)=−λ1−1=λ
ポアソン分布の分散
Var(X)=Var[a(X)]= [b′(θ)]3b′′(θ)c′(θ)−c′′(θ)b′(θ)=[λ1]3−λ21⋅(−1)−0⋅λ1=λ
ポアソン分布の確率質量関数・積率母関数を用いた導出方法については、以下の記事をご確認ください。
積率母関数を用いたポアソン分布の期待値と分散の導出
確率質量関数を用いたポアソン分布の期待値と分散の導出
ガンマ分布
確率変数Xがパラメータα,βのガンマ分布に従う時、確率密度関数f(x)は以下の式となります。
f(x)=Γ(α)βαxα−1e−βx (x>0)
ただし、α>0,β>0であり、Γ(α)はガンマ関数
この確率密度関数は次のように変形することが出来ます。
f(x)=exp[αlogβーlogΓ(α)+αlogx−logx−βx]
ここでαを既知とし、βが未知であると考えます。
θ=βとすると、この時
a(x)=x,b(β)=−β,c(β)=αlogβ−logΓ(α),d(x)=αlogx−logx
となるので、1パラメータの指数型分布族に属することがわかります。
また、a(x)=xとなるので、正準形であることも示されています。
さて、b(β), c(β)に対してβについて1回微分を行うと以下の値となります。
b′(β)=−1, c′(β)=βα
さらにもう1回微分を行うと以下のようになります。
b′′(β)=0, c′′(β)=−β2α
この時、ガンマ分布は正準形であることから、a(X)=Xが成り立つことを利用します。よって、Xの期待値と分散は以下の値となります。
ガンマ分布の期待値
E(X)=E[a(X)]=−b′(β)c′(β)=βα
ガンマ分布の分散
V(X)=V[a(X)]=[b′(θ)]3b′′(θ)c′(θ)−c′′(θ)b′(θ)=[−1]30−β2α=β2α
ガンマ分布の確率密度関数・積率母関数を用いた導出方法については、以下の記事をご確認ください。
確率密度関数を用いたガンマ分布の期待値・分散の導出
積率母関数を用いたガンマ分布の期待値・分散の導出
関連記事
指数型分布族とは?定義と性質をわかりやすく解説
期待値とは?定義や性質を解説
分散とは?2種類の公式と計算例を解説