ベータ分布とは(Beta distribution)
ベータ分布は、αとβの2つのパラメータによって特徴づけられる分布で、二項分布やディリクレ分布と関係があります。
ベータ分布の確率密度関数
ベータ分布の確率密度関数は以下のように表されます。
f(x)=B(α,β)xα−1(1−x)β−1
B(α,β)は、ベータ関数と呼ばれる正規化定数で、以下のような性質があります。
B(α,β)=∫01tα−1(1−t)β−1dt
B(α+1,β)=(α+β)αB(α,β)
ベータ分布の期待値
ベータ分布の期待値は以下のように表されます。
E(X)=α+βα
以下で期待値を導出します。
E(X)=∫01xf(x)dx=∫01xB(α,β)xα−1(1−x)β−1dx=∫01B(α,β)xα(1−x)β−1dx
α=α′−1と置換して、
=∫01B(α′−1,β)xα′−1(1−x)β−1dx
補足
ベータ関数の性質B(α+1,β)=(α+β)αB(α,β)を利用すると次のようになる
B(α′−1,β)=α′−1α′+β−1B(α′,β)
=α′+β−1α′−1∫01B(α′,β)xα′−1(1−x)β−1dx
補足
B(α′,β)xα′−1(1−x)β−1
これはパラメータがα′,βのガンマ分布の確率密度関数である。
そのため、
∫01B(α′,β)xα′−1(1−x)β−1dx=1
は確率密度関数を確率変数がとりうる値において全て足しあわせた値であるため1である。
α′=α+1に再度置換して、
=α+βα
ベータ分布の分散
ベータ分布の分散は以下のように表されます。
V(X)=(α+β)2(α+β+1)αβ
以下で分散をを導出します。
E(X2)=∫01x2f(x)dx=∫01x2B(α,β)xα−1(1−x)β−1dx=∫01B(α,β)xα+1(1−x)β−1dx
α+1=α′−1に置換する。
=∫01B(α′−2,β)xα′−1(1−x)β−1dx
補足
上記のベータ関数の性質B(α+1,β)=(α+β)αB(α,β)を使うと、次のようになる。
B(α′−2,β)=α′−2α′+β−2B(α′−1,β)=α′−2α′+β−2α′−1α′+β−1B(α′,β)
=α′+β−2α′−2α′+β−1α′−1∫01B(α′,β)xα′−1(1−x)β−1dx
補足
B(α′,β)xα′−1(1−x)β−1
これはパラメータがα′,βのガンマ分布の確率密度関数である。そのため、
∫01B(α′,β)xα′−1(1−x)β−1dx=1
は確率密度関数を確率変数がとりうる値において全て足しあわせた値であるため1である。
α′=α+2に置換して、
V(X)=(α+β)(α+β+1)α(α+1)=E(X2)−(E(X))2=(α+β)(α+β+1)α(α+1)−(α+βα)2=(α+β)2(α+β+1)αβ
ベータ分布と他の分布との関係
ベルヌーイ分布、二項分布との関係
ベータ分布は、ベルヌーイ分布、二項分布の共役事前分布です。
共役事前分布については、「共役事前分布を分かりやすく解説」をご確認ください。
ディリクレ分布との関係
ディリクレ分布は、ベータ分布を多変量に拡張した分布です。ディリクレ分布を一変量で表現した場合、ベータ分布に一致します。
関連記事
共役事前分布を分かりやすく解説
ディリクレ分布とは?期待値・分散・共分散の導出も解説