ディリクレ分布とは
ディリクレ分布とは、ベータ分布を多変量に拡張した分布です。
確率変数X1,X2,...,Xn−1が以下のような確率密度関数f(x1,x2,...,xn−1)をもつ時、確率変数X1,X2,...,Xn−1はパラメータα1,α2,...,αnのディリクレ分布に従います。
ディリクレ分布の確率密度関数
ディリクレ分布の確率密度関数は以下のように表されます。
f(x1,x2,...,xn−1)=Γ(α1)...Γ(αn)Γ(∑i=1nαi)x1α1−1x2α2−1...xnαn−1
ただし、∑i=1nxi=1とし、x1,...,xn≥0とする。
ディリクレ分布とベータ分布の関係
冒頭にも述べた通り、ディリクレ分布はベータ分布を多変量に拡張した分布です。
このことを証明するために、ディリクレ分布の確率密度関数についてn=2の場合を考えてみましょう。
n=2の時、ディリクレ分布の確率密度関数は次のように表せます。
f(x1,x2) =Γ(α1)Γ(α2)Γ(∑i=12αi)x1α1−1x2α2−1=Γ(α1)Γ(α2)Γ(α1+α2)x1α1−1x2α2−1
上記は2変量の確率密度関数ですが、但し書きの条件から、∑i=12xi=x1+x2=1を満たしています。
この変形により、2変量である確率密度関数を1変量として書くことが可能となるため、以下の形に書き換えることができます。
f(x1)=Γ(α1)Γ(α2)Γ(α1+α2)x1α1−1(1−x1)α2−1
ここで、定数部分にあるガンマ関数に着目します。ベータ関数とガンマ関数には以下のような関係があります。
ベータ関数とガンマ関数の関係
B(a,b)=Γ(a+b)Γ(a)Γ(b)
ベータ関数B(α1,α2)を用いてB(α1,α2)1=Γ(α1)Γ(α2)Γ(α1+α2)と表せることを利用すると、以下の形が導けます。
f(x1)=B(α1,α2)1x1α1−1(1−x1)α2−1
これは、ベータ分布の確率密度関数の形に一致します。
つまり、1変量の場合のディリクレ分布の確率密度関数はベータ分布の確率密度関数と一致します。
このことから、ディリクレ分布はベータ分布を多変量に拡張した分布と考えることができます。
ベイズ統計におけるディリクレ分布
ディリクレ分布は、ベイズ統計において多項分布の共役事前分布として使用されます。
共役事前分布については、「共役事前分布を分かりやすく解説」をご確認ください。
期待値の導出
ディリクレ分布の期待値は以下のように表されます。
ディリクレ分布の期待値
E(Xi)=∑i=1nαiαi (i=1,...,n−1)
では、ディリクレ分布の期待値を導出していきましょう。
はじめに、確率変数X1の期待値E(X1)を求めることを考えます。
ディリクレ分布は連続型分布なので、連続型確率変数の場合の期待値の定義より、以下のように求められます。
E(X1)=∫0∞x1f(x1,...,xn−1)dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x1x1α1−1...xnαn−1dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x1α1...xnαn−1dx1...dxn−1
ここで、ガンマ関数の積分公式を利用します。
補足:ガンマ関数の積分公式
∫0∞x1α1−1...xnαn−1dx1...dxn−1=Γ(∑i=1nαi )Γ(α1)...Γ(αn)
ただし、xi≥0(1≤i≤n−1),∑i=1n−1xi≤1
これにより、3行目の積分式は以下のように表すことができます。
∫0∞x1α1...xnαn−1dx1...dxn−1= Γ(α1+...+αn+1)Γ(α1+1)...Γ(αn)= Γ(∑i=1nαi+1)Γ(α1+1)...Γ(αn)
ここで、さらにガンマ関数の性質を用います
補足:ガンマ関数の性質
Γ(α+1)=αΓ(α)
Γ(∑i=1nαi+1)Γ(α1+1)...Γ(αn)=(∑i=1nαi)Γ(∑i=1nαi)α1Γ(α1)...Γ(αn)
よって、ディリクレ分布に従う確率変数Xi(i=1,...,n−1)の期待値は
E(X1)=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x1α1...xnαn−1dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )(∑i=1nαi)Γ(∑i=1nαi)α1Γ(α1)...Γ(αn)=∑i=1nαiα1
分散の導出
ディリクレ分布の分散は以下のように表されます。
ディリクレ分布の分散
V(Xi)=(∑i=1nαi)2(∑i=1nαi+1)αi(∑i=1nαi−αi)(i=1,...,n−1)
次にディリクレ分布に従う確率変数の分散を導出します。
はじめに、確率変数X1の分散V(X1)を求めることを考えます。
分散の性質より、
V(X1)=E(X12)−E(X1)2
E(X12)について、
E(X12)=∫0∞x12f(x1,...,xn−1)dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x12x1α1−1...xnαn−1dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x1α1+1...xnαn−1dx1...dxn−1
ここで、ガンマ関数の積分公式を利用すると、3行目の積分式は以下のように表されます。
∫0∞x1α1+1...xnαn−1dx1...dxn−1= Γ(α1+...+αn+2)Γ(α1+2)...Γ(αn)= Γ(∑i=1nαi+2)Γ(α1+2)...Γ(αn)
さらに、ガンマ関数の性質を適用させることで、次のように表されます。
Γ(∑i=1nαi+2)Γ(α1+2)...Γ(αn)=(∑i=1nαi)(∑i=1nαi+1)Γ(∑i=1nαi)α1(α1+1)Γ(α1)...Γ(αn)
以上より、E(X12)は以下の値となります。
E(X12)=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x1α1...xnαn−1dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )(∑i=1nαi)(∑i=1nαi+1)Γ(∑i=1nαi)α1(α1+1)Γ(α1)...Γ(αn)=(∑i=1nαi)(∑i=1nαi+1)α1(α1+1)
先ほどの分散の公式に代入することで、V(X1)は以下のように求まります。
V(X1)=E(X12)−E(X1)2=(∑i=1nαi)(∑i=1nαi+1)α1(α1+1)−(∑i=1nαi)2α12=(∑i=1nαi)2(∑i=1nαi+1)α1(∑i=1nαi−α1)
共分散の導出
ディリクレ分布の共分散は以下のように表されます。
ディリクレ分布の共分散
Cov(Xi,Xj)= −(∑i=1nαi)2(∑i=1nαi+1)αiαj (i=j)
ディリクレ分布に従う確率変数の共分散を導出します。
例として確率変数X1,X2の共分散Cov(X1,X2)を求める場合を考えます。
共分散の公式より次のようになります。
Cov(X1,X2)=E(X1X2)−E(X1)E(X2)
E(X1X2)を求めます。
E(X1X2)=∫0∞x1x2f(x1,...,xn−1)dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x1x2x1α1−1x2α2−1...xnαn−1dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x1α1x2α2...xnαn−1dx1...dxn−1
ガンマ関数の積分公式を利用すると、3行目の積分式は次のようになります。
∫0∞x1α1x2α2...xnαn−1dx1...dxn−1= Γ(α1+α2+...+αn+2)Γ(α1+1)Γ(α2+1)...Γ(αn)= Γ(∑i=1nαi+2)Γ(α1+1)Γ(α2+1)...Γ(αn)
さらに、ガンマ関数の性質を用いることで、次のように変形できます。
Γ(∑i=1nαi+2)Γ(α1+1) Γ(α2+1)...Γ(αn)=(∑i=1nαi) (∑i=1nαi+1)Γ(∑i=1nαi)α1α2Γ(α1)Γ(α2)...Γ(αn)
以上より、E(X1X2)は以下のようになります。
E(X1X2)=Γ(α1)...Γ(αn)Γ(∑i=1nαi )∫0∞x1α1x2α2...xnαn−1dx1...dxn−1=Γ(α1)...Γ(αn)Γ(∑i=1nαi )(∑i=1nαi)(∑i=1nαi+1)Γ(∑i=1nαi)α1α2Γ(α1)...Γ(αn)=(∑i=1nαi)(∑i=1nαi+1)α1α2)
共分散の公式に代入することで、Cov(X1,X2)は次のようになります。
Cov(X1,X2)=E(X1X2)−E(X1)E(X2)=(∑i=1nαi)(∑i=1nαi+1)α1α2−(∑i=1nαi)2α1α2=−(∑i=1nαi)2(∑i=1nαi+1)α1α2
関連記事
ベータ分布とは?期待値と分散の導出も解説