ディリクレ分布とは?期待値・分散・共分散の導出も解説

更新日

ディリクレ分布とは

ディリクレ分布とは、ベータ分布を多変量に拡張した分布です。

確率変数X1,X2,...,Xn1X_{1}, X_{2}, ..., X_{n-1}が以下のような確率密度関数f(x1,x2,...,xn1)f(x_{1}, x_{2}, ..., x_{n-1})をもつ時、確率変数X1,X2,...,Xn1X_{1}, X_{2}, ..., X_{n-1}はパラメータα1,α2,...,αn\alpha_{1}, \alpha_{2}, ..., \alpha_{n} のディリクレ分布に従います。

ディリクレ分布の確率密度関数

ディリクレ分布の確率密度関数は以下のように表されます。

f(x1,x2,...,xn1)=Γ(i=1nαi)Γ(α1)...Γ(αn)x1α11x2α21...xnαn1f(x_{1}, x_{2}, ..., x_{n-1}) = \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})...\Gamma(\alpha_{n})} x_{1}^{\alpha_{1} - 1} x_{2}^{\alpha_{2} - 1} ... x_{n}^{\alpha_{n} - 1}

ただし、i=1nxi=1\sum_{i=1}^{n} x_{i} = 1とし、x1,...,xn0x_{1}, ..., x_{n} \geq 0とする。

ディリクレ分布とベータ分布の関係

冒頭にも述べた通り、ディリクレ分布はベータ分布を多変量に拡張した分布です。

このことを証明するために、ディリクレ分布の確率密度関数についてn=2n = 2の場合を考えてみましょう。

n=2n = 2の時、ディリクレ分布の確率密度関数は次のように表せます。

f(x1,x2)=Γ(i=12αi)Γ(α1)Γ(α2)x1α11x2α21 =Γ(α1+α2)Γ(α1)Γ(α2)x1α11x2α21\begin{equation*}\begin{split} f(x_{1}, x_{2}) &= \displaystyle \frac{\Gamma(\sum_{i=1}^{2} \alpha_{i} )}{\Gamma(\alpha_{1})\Gamma(\alpha_{2})} x_{1}^{\alpha_{1} - 1} x_{2}^{\alpha_{2} - 1} \\  &= \displaystyle \frac{\Gamma(\alpha_{1} + \alpha_{2})}{\Gamma(\alpha_{1})\Gamma(\alpha_{2})} x_{1}^{\alpha_{1} - 1} x_{2}^{\alpha_{2} - 1} \\ \end{split}\end{equation*}

上記は2変量の確率密度関数ですが、但し書きの条件から、i=12xi=x1+x2=1\sum_{i=1}^{2} x_{i} = x_{1} + x_{2} = 1を満たしています。

この変形により、2変量である確率密度関数を1変量として書くことが可能となるため、以下の形に書き換えることができます。

f(x1)=Γ(α1+α2)Γ(α1)Γ(α2)x1α11(1x1)α21\begin{equation*}\begin{split} f(x_{1}) &= \displaystyle \frac{\Gamma(\alpha_{1} + \alpha_{2})}{\Gamma(\alpha_{1})\Gamma(\alpha_{2})} x_{1}^{\alpha_{1} - 1} (1 - x_{1})^{\alpha_{2} - 1} \\ \end{split}\end{equation*}

ここで、定数部分にあるガンマ関数に着目します。ベータ関数とガンマ関数には以下のような関係があります。

ベータ関数とガンマ関数の関係

B(a,b)=Γ(a)Γ(b)Γ(a+b)B(a, b) = \frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)}

ベータ関数B(α1,α2)B(\alpha_{1}, \alpha_{2})を用いて1B(α1,α2)=Γ(α1+α2)Γ(α1)Γ(α2)\frac{1}{B(\alpha_{1}, \alpha_{2})} = \frac{\Gamma(\alpha_{1} + \alpha_{2})}{\Gamma(\alpha_{1})\Gamma(\alpha_{2})}と表せることを利用すると、以下の形が導けます。

f(x1)=1B(α1,α2)x1α11(1x1)α21\begin{equation*}\begin{split} f(x_{1}) &= \displaystyle \frac{1}{B(\alpha_{1}, \alpha_{2})} x_{1}^{\alpha_{1} - 1} (1 - x_{1})^{\alpha_{2} - 1} \\ \end{split}\end{equation*}

これは、ベータ分布の確率密度関数の形に一致します。

つまり、1変量の場合のディリクレ分布の確率密度関数ベータ分布の確率密度関数と一致します。

このことから、ディリクレ分布はベータ分布を多変量に拡張した分布と考えることができます。

ベイズ統計におけるディリクレ分布

ディリクレ分布は、ベイズ統計において多項分布の共役事前分布として使用されます。

共役事前分布については、「共役事前分布を分かりやすく解説」をご確認ください。

期待値の導出

ディリクレ分布の期待値は以下のように表されます。

ディリクレ分布の期待値

E(Xi)=αii=1nαi (i=1,...,n1)E(X_{i}) = \frac{\alpha_{i}}{\sum_{i=1}^{n} \alpha_{i}}  (i = 1, ..., n-1)

では、ディリクレ分布の期待値を導出していきましょう。

はじめに、確率変数X1X_{1}の期待値E(X1)E(X_{1})を求めることを考えます。

ディリクレ分布は連続型分布なので、連続型確率変数の場合の期待値の定義より、以下のように求められます。

E(X1)=0x1f(x1,...,xn1)dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)0x1x1α11...xnαn1dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)0x1α1...xnαn1dx1...dxn1\begin{equation*}\begin{split} E(X_{1}) &= \displaystyle \int_0^\infty x_{1} f(x_{1}, ..., x_{n-1}) dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1} x_{1}^{\alpha_{1} - 1} ... x_{n}^{\alpha_{n} -1} dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1}^{\alpha_{1}} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} \\ \end{split}\end{equation*}

ここで、ガンマ関数の積分公式を利用します。

補足:ガンマ関数の積分公式

0x1α11...xnαn1dx1...dxn1=Γ(α1)...Γ(αn)Γ(i=1nαi )\int_0^\infty x_{1}^{\alpha_{1} - 1} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} =\frac{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})}{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}

ただし、xi0(1in1),i=1n1xi1x_{i} \geq 0 (1 \leq i \leq n-1) , \sum_{i=1}^{n-1} x_{i} \leq 1

これにより、3行目の積分式は以下のように表すことができます。

 0x1α1...xnαn1dx1...dxn1= Γ(α1+1)...Γ(αn)Γ(α1+...+αn+1)= Γ(α1+1)...Γ(αn)Γ(i=1nαi+1)\begin{equation*}\begin{split} \int_0^\infty x_{1}^{\alpha_{1}} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} &= \displaystyle  \frac{\Gamma(\alpha_{1} + 1) ... \Gamma(\alpha_{n})}{\Gamma(\alpha_{1} + ... + \alpha_{n} + 1)} \\ &= \displaystyle \frac{\Gamma(\alpha_{1} + 1) ... \Gamma(\alpha_{n})}{\Gamma(\sum_{i=1}^{n} \alpha_{i}+ 1)} \\ \end{split}\end{equation*}

ここで、さらにガンマ関数の性質を用います

補足:ガンマ関数の性質

Γ(α+1)=αΓ(α)\Gamma(\alpha + 1) = \alpha \Gamma(\alpha)

Γ(α1+1)...Γ(αn)Γ(i=1nαi+1)=α1Γ(α1)...Γ(αn)(i=1nαi)Γ(i=1nαi)\begin{equation*}\begin{split} \frac{\Gamma(\alpha_{1} + 1) ... \Gamma(\alpha_{n})}{\Gamma(\sum_{i=1}^{n} \alpha_{i} + 1)} &= \displaystyle \frac{\alpha_{1} \Gamma(\alpha_{1}) ... \Gamma(\alpha_{n})}{(\sum_{i=1}^{n} \alpha_{i}) \Gamma(\sum_{i=1}^{n} \alpha_{i})} \\ \end{split}\end{equation*}

よって、ディリクレ分布に従う確率変数Xi(i=1,...,n1)X_{i} (i = 1, ..., n-1)の期待値は

E(X1)=Γ(i=1nαi )Γ(α1)...Γ(αn)0x1α1...xnαn1dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)α1Γ(α1)...Γ(αn)(i=1nαi)Γ(i=1nαi)=α1i=1nαi\begin{equation*}\begin{split} E(X_{1}) &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1}^{\alpha_{1}} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \frac{\alpha_{1} \Gamma(\alpha_{1}) ... \Gamma(\alpha_{n})}{(\sum_{i=1}^{n} \alpha_{i}) \Gamma(\sum_{i=1}^{n} \alpha_{i})} \\ &= \displaystyle \frac{\alpha_{1}}{\sum_{i=1}^{n} \alpha_{i}} \\ \end{split}\end{equation*}

分散の導出

ディリクレ分布の分散は以下のように表されます。

ディリクレ分布の分散

V(Xi)=αi(i=1nαiαi)(i=1nαi)2(i=1nαi+1)(i=1,...,n1)V(X_{i}) = \frac{\alpha_{i}(\sum_{i=1}^{n} \alpha_{i} - \alpha_{i})}{(\sum_{i=1}^{n} \alpha_{i})^2 (\sum_{i=1}^{n} \alpha_{i} + 1)} (i = 1, ..., n-1)

次にディリクレ分布に従う確率変数の分散を導出します。

はじめに、確率変数X1X_{1}の分散V(X1)V(X_{1})を求めることを考えます。

分散の性質より、

V(X1)=E(X12)E(X1)2V(X_{1}) = E(X_{1}^2) - E(X_{1})^2

E(X12)E(X_{1}^2)について、

E(X12)=0x12f(x1,...,xn1)dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)0x12x1α11...xnαn1dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)0x1α1+1...xnαn1dx1...dxn1\begin{equation*}\begin{split} E(X_{1}^2) &= \displaystyle \int_0^\infty x_{1}^2 f(x_{1}, ..., x_{n-1}) dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1}^2 x_{1}^{\alpha_{1} - 1} ... x_{n}^{\alpha_{n} -1} dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1}^{\alpha_{1} + 1} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} \\ \end{split}\end{equation*}

ここで、ガンマ関数の積分公式を利用すると、3行目の積分式は以下のように表されます。

 0x1α1+1...xnαn1dx1...dxn1= Γ(α1+2)...Γ(αn)Γ(α1+...+αn+2)= Γ(α1+2)...Γ(αn)Γ(i=1nαi+2)\begin{equation*}\begin{split} \int_0^\infty x_{1}^{\alpha_{1} + 1} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} &= \displaystyle  \frac{\Gamma(\alpha_{1} + 2) ... \Gamma(\alpha_{n})}{\Gamma(\alpha_{1} + ... + \alpha_{n} + 2)} \\ &= \displaystyle \frac{\Gamma(\alpha_{1} + 2) ... \Gamma(\alpha_{n})}{\Gamma(\sum_{i=1}^{n} \alpha_{i}+ 2)} \\ \end{split}\end{equation*}

さらに、ガンマ関数の性質を適用させることで、次のように表されます。

Γ(α1+2)...Γ(αn)Γ(i=1nαi+2)=α1(α1+1)Γ(α1)...Γ(αn)(i=1nαi)(i=1nαi+1)Γ(i=1nαi)\begin{equation*}\begin{split} \frac{\Gamma(\alpha_{1} + 2) ... \Gamma(\alpha_{n})}{\Gamma(\sum_{i=1}^{n} \alpha_{i} + 2)} &= \displaystyle \frac{\alpha_{1} (\alpha_{1} + 1) \Gamma(\alpha_{1}) ... \Gamma(\alpha_{n})}{(\sum_{i=1}^{n} \alpha_{i})(\sum_{i=1}^{n} \alpha_{i} + 1) \Gamma(\sum_{i=1}^{n} \alpha_{i})} \\ \end{split}\end{equation*}

以上より、E(X12)E(X_{1}^2)は以下の値となります。

E(X12)=Γ(i=1nαi )Γ(α1)...Γ(αn)0x1α1...xnαn1dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)α1(α1+1)Γ(α1)...Γ(αn)(i=1nαi)(i=1nαi+1)Γ(i=1nαi)=α1(α1+1)(i=1nαi)(i=1nαi+1)\begin{equation*}\begin{split} E(X_{1}^2) &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1}^{\alpha_{1}} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \frac{\alpha_{1} (\alpha_{1} + 1) \Gamma(\alpha_{1}) ... \Gamma(\alpha_{n})}{(\sum_{i=1}^{n} \alpha_{i}) (\sum_{i=1}^{n} \alpha_{i} + 1) \Gamma(\sum_{i=1}^{n} \alpha_{i})} \\ &= \displaystyle \frac{\alpha_{1} (\alpha_{1} + 1)}{(\sum_{i=1}^{n} \alpha_{i})(\sum_{i=1}^{n} \alpha_{i} + 1)} \\ \end{split}\end{equation*}

先ほどの分散の公式に代入することで、V(X1)V(X_{1})は以下のように求まります。

V(X1)=E(X12)E(X1)2=α1(α1+1)(i=1nαi)(i=1nαi+1)α12(i=1nαi)2=α1(i=1nαiα1)(i=1nαi)2(i=1nαi+1)\begin{equation*}\begin{split} V(X_{1}) &= \displaystyle E(X_{1}^2) - E(X_{1})^2 \\ &= \displaystyle \frac{\alpha_{1} (\alpha_{1} + 1)}{(\sum_{i=1}^{n} \alpha_{i})(\sum_{i=1}^{n} \alpha_{i} + 1)} - \frac{\alpha_{1}^2}{(\sum_{i=1}^{n} \alpha_{i})^2} \\ &= \displaystyle \frac{\alpha_{1} (\sum_{i=1}^{n} \alpha_{i} - \alpha_{1})}{(\sum_{i=1}^{n} \alpha_{i})^2 (\sum_{i=1}^{n} \alpha_{i} + 1)} \\ \end{split}\end{equation*}

共分散の導出

ディリクレ分布の共分散は以下のように表されます。

ディリクレ分布の共分散

Cov(Xi,Xj)= αiαj(i=1nαi)2(i=1nαi+1)  (ij)\begin{equation*}\begin{split} Cov(X_{i}, X_{j}) &= \displaystyle -\frac{\alpha_{i} \alpha_{j}}{(\sum_{i=1}^{n} \alpha_{i})^2 (\sum_{i=1}^{n} \alpha_{i} + 1)}   (i \neq j) \\ \end{split}\end{equation*}

ディリクレ分布に従う確率変数の共分散を導出します。

例として確率変数X1,X2X_{1}, X_{2}の共分散Cov(X1,X2)Cov(X_{1}, X_{2})を求める場合を考えます。

共分散の公式より次のようになります。

Cov(X1,X2)=E(X1X2)E(X1)E(X2)\begin{equation*}\begin{split} Cov(X_{1}, X_{2}) &= \displaystyle E(X_{1}X_{2}) - E(X_{1})E(X_{2}) \\ \end{split}\end{equation*}

E(X1X2)E(X_{1}X_{2})を求めます。

E(X1X2)=0x1x2f(x1,...,xn1)dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)0x1x2x1α11x2α21...xnαn1dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)0x1α1x2α2...xnαn1dx1...dxn1\begin{equation*}\begin{split} E(X_{1}X_{2}) &= \displaystyle \int_0^\infty x_{1} x_{2} f(x_{1}, ..., x_{n-1}) dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1} x_{2} x_{1}^{\alpha_{1} - 1} x_{2}^{\alpha_{2} - 1} ... x_{n}^{\alpha_{n} -1} dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1}^{\alpha_{1}} x_{2}^{\alpha_{2}} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} \\ \end{split}\end{equation*}

ガンマ関数の積分公式を利用すると、3行目の積分式は次のようになります。

 0x1α1x2α2...xnαn1dx1...dxn1= Γ(α1+1)Γ(α2+1)...Γ(αn)Γ(α1+α2+...+αn+2)= Γ(α1+1)Γ(α2+1)...Γ(αn)Γ(i=1nαi+2)\begin{equation*}\begin{split} \int_0^\infty x_{1}^{\alpha_{1}} x_{2}^{\alpha_{2}} ... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} &= \displaystyle  \frac{\Gamma(\alpha_{1} + 1) \Gamma(\alpha_{2} + 1) ... \Gamma(\alpha_{n})}{\Gamma(\alpha_{1} + \alpha_{2} + ... + \alpha_{n} + 2)} \\ &= \displaystyle \frac{\Gamma(\alpha_{1} + 1) \Gamma(\alpha_{2} + 1) ... \Gamma(\alpha_{n})}{\Gamma(\sum_{i=1}^{n} \alpha_{i}+ 2)} \\ \end{split}\end{equation*}

さらに、ガンマ関数の性質を用いることで、次のように変形できます。

Γ(α1+1) Γ(α2+1)...Γ(αn)Γ(i=1nαi+2)=α1α2Γ(α1)Γ(α2)...Γ(αn)(i=1nαi) (i=1nαi+1)Γ(i=1nαi)\begin{equation*}\begin{split} \frac{\Gamma(\alpha_{1} + 1) \Gamma(\alpha_{2} + 1) ... \Gamma(\alpha_{n})}{\Gamma(\sum_{i=1}^{n} \alpha_{i} + 2)} &= \displaystyle \frac{\alpha_{1} \alpha_{2} \Gamma(\alpha_{1}) \Gamma(\alpha_{2}) ... \Gamma(\alpha_{n})}{(\sum_{i=1}^{n} \alpha_{i}) (\sum_{i=1}^{n} \alpha_{i} + 1) \Gamma(\sum_{i=1}^{n} \alpha_{i})} \\ \end{split}\end{equation*}

以上より、E(X1X2)E(X_{1}X_{2})は以下のようになります。

E(X1X2)=Γ(i=1nαi )Γ(α1)...Γ(αn)0x1α1x2α2...xnαn1dx1...dxn1=Γ(i=1nαi )Γ(α1)...Γ(αn)α1α2Γ(α1)...Γ(αn)(i=1nαi)(i=1nαi+1)Γ(i=1nαi)=α1α2)(i=1nαi)(i=1nαi+1)\begin{equation*}\begin{split} E(X_{1}X_{2}) &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \int_0^\infty x_{1}^{\alpha_{1}} x_{2}^{\alpha_{2}}... x_{n}^{\alpha_{n} - 1} dx_{1} ... dx_{n-1} \\ &= \displaystyle \frac{\Gamma(\sum_{i=1}^{n} \alpha_{i} )}{\Gamma(\alpha_{1})... \Gamma(\alpha_{n})} \frac{\alpha_{1} \alpha_{2} \Gamma(\alpha_{1}) ... \Gamma(\alpha_{n})}{(\sum_{i=1}^{n} \alpha_{i}) (\sum_{i=1}^{n} \alpha_{i} + 1) \Gamma(\sum_{i=1}^{n} \alpha_{i})} \\ &= \displaystyle \frac{\alpha_{1} \alpha_{2})}{(\sum_{i=1}^{n} \alpha_{i})(\sum_{i=1}^{n} \alpha_{i} + 1)} \\ \end{split}\end{equation*}

 共分散の公式に代入することで、Cov(X1,X2)Cov(X_{1}, X_{2})は次のようになります。

Cov(X1,X2)=E(X1X2)E(X1)E(X2)=α1α2(i=1nαi)(i=1nαi+1)α1α2(i=1nαi)2=α1α2(i=1nαi)2(i=1nαi+1)\begin{equation*}\begin{split} Cov(X_{1}, X_{2}) &= \displaystyle E(X_{1}X_{2}) - E(X_{1})E(X_{2}) \\ &= \displaystyle \frac{\alpha_{1} \alpha_{2}}{(\sum_{i=1}^{n} \alpha_{i})(\sum_{i=1}^{n} \alpha_{i} + 1)} - \frac{\alpha_{1} \alpha_{2}}{(\sum_{i=1}^{n} \alpha_{i})^2} \\ &= \displaystyle -\frac{\alpha_{1} \alpha_{2}}{(\sum_{i=1}^{n} \alpha_{i})^2 (\sum_{i=1}^{n} \alpha_{i} + 1)} \\ \end{split}\end{equation*}

関連記事

ベータ分布とは?期待値と分散の導出も解説

カテゴリ: ディリクレ分布

関連サービス

講座一覧ページ

記事一覧はこちら

無料で統計学を学ぶ