多項分布とは(Multinomial Distribution)
多項分布とは、二項分布を一般化した確率分布です。
確率変数(ベクトル)X=(X1,X2,...,Xk)が以下の結合関数を持つ時に従う確率分布を、パラメータn,P=(p1,p2,...,pk)の多項分布(Multinomial Distribution)といいます。
多項分布の確率密度関数
f(x1,x2,...,xk)=x1!x2!...xk!n!p1x1 p2x2... pkxk (xi≥0,x1+...+xk=n)
ただし、nは整数であり、pi>0(i=1,2,...,k),p1+p2+...+pk=1
ここに、k=2の時、確率関数は以下のように表せます。
f(x1,x2)=x1!x2!n!p1x1 p2x2
この時、p1+p2=1を満たしますので、p2=1−p1と表せます。
また、x1+x2=nも満たすため、x2=n−x1と表せます。
このことからk=2の場合も1変量として扱うことができます。
以上のことをふまえて書くと次の形になります。
f(x1)=x1!(1−x1)!n!p1x1(1−p1)n−x1
k=2の時の多項分布の確率関数は二項分布と一致します。
また、k=2かつn=1である時、ベルヌーイ分布の確率密度関数となります。
二項分布と多項分布
前節でも述べましたが、k=2の時の多項分布は二項分布となります。ここでは、その関係性を見ていきましょう。
二項分布とは、互いに独立したベルヌーイ試行をn回行ったときに、ある事象が何回起こるかの確率分布です。
具体例としては、「コインを5回投げた時に表2回出る確率」「対戦ゲームで90%の確率で当たる技を10回中8回当てる確率」といった確率を表す分布です。
ここでベルヌーイ試行というのは、「成功か失敗か」「表か裏か」といった2種類だけの結果しか得られないような試行・実験を意味しています。つまり二項分布というのは、結果が2つだけの試行において用いられる確率分布です。
多項分布とは、結果がたくさんある試行において用いられる確率分布です
具体例としてはサイコロ投げが挙げられます。「6面サイコロを10回投げた時にそれぞれの面が出る確率」とした場合は、パラメータn=10, P=(p1,p2,...,p6)の多項分布に従います。nは試行回数であり、p1,p2,...,p6はサイコロのそれぞれの目が出る確率を指します。
多項分布の期待値の導出
X1の期待値を求めることを考えます。ここに、離散型変数の場合の期待値の定義より、
E(X1)=∑i=1kx1 f(x1,x2,...,xk)
と表せます。
さらにx1,p1について操作することで、以下のように表せます。
E(X1) =i=1∑kx1 x1!x2!...xk!n!p1x1 p2x2... pkxk =i=1∑k (x1−1)!x2!...xk!n(n−1)!p1p1(x1−1)p2x2... pkxk =np1i=1∑kx1(x1−1)!x2!...xk!(n−1)!p1(x1−1)p2x2... pkxk=np1⋅1=np1
3行目から4行目の変形は、総和の中の式がパラメータが異なる多項分布の確率関数であること、また多項分布のみならず離散型確率分布の確率関数について、確率変数のとりうる値の総和をとると1となることを利用しています。これは、ある事象における全ての確率を足すと1になることと同じ意味を持っています。
以上より、多項分布に従う確率変数Xi (i=1,2,...,k)の期待値は以下の形となります。
E(Xi)=npi (i=1,...,k)
このように、多項分布の期待値は二項分布の期待値の形と一致していることがわかります。
また、n=1の時はベルヌーイ分布の期待値の形と一致します。
各確率分布の期待値は、「代表的な確率分布の確率関数・期待値・分散のまとめ」をご確認ください。
多項分布の分散の導出
X1の分散を考えます。まずは、E(X1(X1−1))を求めましょう。
E(X1(X1−1)) =i=1∑kx1(x1−1)x1!x2!...xk!n!p1x1 p2x2... pkxk =i=1∑k(x1−2)!x2!...xk!n(n−1)(n−2)!p12p1x1−2p2x2...pkxk=n(n−1)p12i=1∑k(x1−2)!x2!...xk!(n−2)!p1x1−2p2x2...pkxk=np1(1−p1)
ここで分散の定義より、Var(X1)は以下のように表せることにより、解を得ることができます。
Var(X1)=E(X12)−(E(X1)2=E(X1(X1−1))+E(X1)−(E(X1))2=n(n−1)p12+np1−n2p12=np1(1−p1)
以上より、多項分布に従う確率変数Xi (i=1,2,...,k)の分散は以下の形となります。
V(Xi)=npi(1−pi) (i=1,...,k)
多項分布の分散も二項分布の分散の形と一致し、n=1の時はベルヌーイ分布の分散の形と一致します。
各確率分布の分散は、「代表的な確率分布の確率関数・期待値・分散のまとめ」をご確認ください。
多項分布の共分散の導出
最後に、多項分布に従う確率変数の共分散を導出します。
X1とX2の共分散を求める場合を考えます。まず、E(X1X2)を導出します。
E(X1X2) =i=1∑kx1x2x1!x2!...xk!n!p1x1 p2x2... pkxk =i=1∑k(x1−1)!(x2−1)!...xk!n(n−1)(n−2)!p1p2p1x1−1p2x2−1...pkxk=n(n−1)p1p2i=1∑k(x1−1)!(x2−1)!...xk!(n−2)!p1x1−1p2x2−1...pkxk=n(n−1)p1p2
ここで、共分散も分散の定義と同様に、Cov(X1,X2)=E(X1X2)−E(X1)E(X2)と表せますから、上記の計算結果と期待値を代入することで求めることができます。。
Cov(X1,X2)=E(X1X2)−E(X1)E(X2)=n(n−1)p1p2−n2p1p2=−np1p2
よって、多項分布に従う確率変数Xi,Xj (i<j)の共分散は以下の形となります。
Cov(Xi,Xj)=−npipj (i<j)
多項分布の共役事前分布
共役事前分布とは、ベイズ統計を扱う際に、複雑な計算を回避するために考えられた事前分布です。
共役事前分布を用いて事後分布を求めると、事後分布が事前分布と同じ分布になるという特性があります。
多項分布は指数型分布族に属するため、ディリクレ分布を共役事前分布に持ちます。
データを取ってくる母集団の確率分布が多項分布であるとき、事前分布にディリクレ分布を設定すれば、事後分布もディリクレ分布となります。
関連記事
ベルヌーイ分布の分かりやすいまとめ
ベルヌーイ試行の定義をわかりやすく解説
二項分布のわかりやすいまとめ
共役事前分布を分かりやすく解説