ベルヌーイ分布の事後分布
ベルヌーイ分布からデータを取得する場合、共役事前分布がベータ分布、その事後分布もベータ分となります。
よって、ベルヌーイ分布の事後分布の平均・分散について、以下のようなことが言えます。
成功確率pの試行を1回行い、x回成功したとする(xはBi(1,p)に従う)。この試行をn回行った。
パラメータpの事前分布としてBeta(α,β)のベータ分布をとるとき、pの事後分布は、
平均:α+β+nα+γ
分散:(α+β+n)2(α+β+n+1)(α+γ)(β+n−γ)
のベータ分布Beta(α+γ,β+(n−γ))に従う。
ただし、γは成功回数である。
ベルヌーイ分布の事後分布の平均・分散の導出
事後分布の密度関数は以下となります。
π(p)=Γ(α)Γ(β)Γ(α+β)pα−1(1−p)β−1
0≤p≤1,α>0,β>0
次にベルヌーイ分布の確率密度関数は以下です。
f(x)=px(1−p)1−x
データx={x1,x2,...,xn}を得たとき、データがi.i.dである下では、尤度は以下となります。
f(x∣p)=f(x1∣p)f(x2∣p)...f(xn∣p)
=px1(1−p)1−x1px2(1−p)1−x2...pxn(1−p)1−xn
=∏i=1npxi(1−p)1−xi
=p∑i=1nxi(1−p)n−∑i=1nxi
事後分布は比例の記号∝を使って、
π(p∣x)∝π(p)f(x∣p)
Γ(α)Γ(β)Γ(α+β)はpに対して定数とみなせるので、
∝pα−1(1−p)β−1p∑i=1nxi(1−p)n−∑i=1nxi
∝pα+∑i=1nxi−1(1−p)β+n−∑i=1nxi−1
∝pα+γ−1(1−p)β+(n−γ)−1
成功回数:γ, 失敗回数:(n−γ)
この式は、ベータ分布Beta(α+γ,β+(n−γ))に従っていることがわかります。
ベータ分布Beta(α,β)の平均、分散
平均:α+βα
分散:(α+β)2(α+β+1)αβ
αにα+γ、βにβ+(n−γ)をそれぞれ代入すると、以下のようになります。
平均:α+β+nα+γ
分散:(α+β+n)2(α+β+n+1)(α+γ)(β+n−γ)
二項分布との関係
データの母集団の分布がベルヌーイ分布ではなく、二項分布の場合はどうなるでしょう。
二項分布Bi(n,p)に従う確率分布は、
f(x)=nCxpx(1−p)n−x
であるから、データxを得たとき、尤度は以下となります。
f(x∣p)=nCxpx(1−p)n−x
ここで、nCxはpに対しては定数となります。
さらに、xが成功回数であることを考えると、xは上記のγと等しいので、事後分布は上記と同様の手順で、
π(p∣x)∝π(p)f(x∣p)
∝pα+γ−1(1−p)β+(n−γ)−1
よって、事前分布がベータ分布で、取ってくるデータの母集団分布が二項分布のとき、事後分布はベルヌーイ分布と一致します。
ベルヌーイ分布の事後分布の平均の性質
ベルヌーイ分布の事後分布の平均は
α+β+nα+γ=α+β+nαα+β+nγ=α+β+nα+βα+βα+α+β+nnnγ
と表すことができます。
ここで、事前分布の期待値は、
E(p)=α+βα
であり、観測値の平均(pの最尤推定量)は、
であるので、
α+β+nα+βE(p)+α+β+nnx
と表せられます。
ここで、α+β+nα+βをwとおくと、α+β+nnは1−wとなるので、
wE(p)+(1−w)xと書き換えることができます。
これは、事前平均と標本平均の重みづけをしていると解釈できます。
この性質は、正規分布の事後分布の平均についても同様です。
事後分布の平均・分散の導出の例題
箱の中にたくさんの赤球と黒球が入っている。これをランダムに1個取り出し、箱の中に戻す。この操作を5回行ったところ、赤が4回、黒が1回であった。
赤球が取り出される確率をpとし、pの事前分布π(p)はベータ分布Be(21,21)に従うものとする。
このときの事後分布の従う分布と、平均、分散を求めよ。
この試行の赤球を取り出す回数をxとすると、xは二項分布に従います。
事前分布がBeta(α,β)に従うとき、事後分布はBeta(α+γ,β+(n−γ))に従うので、
αとβに21、γに4をそれぞれ代入すると、以下の事後分布が得られます。
Be(29,23)
事後分布の平均、分散はそれぞれ
α+β+nα+γ、(α+β+n)2(α+β+n+1)(α+γ)(β+n−γ)であるから、
同様に代入して、
平均:43
分散:0.006
関連記事
ベルヌーイ分布の分かりやすいまとめ
共役事前分布を分かりやすく解説
正規分布の事後分布の平均と分散