事象の準備
ベイズの定理を考える舞台として、まず全事象Ωを考えます。
これは目的の変数が取りうる全ての離散値(整数・自然数などの飛び飛びの値)の集合となります。
さらに、全事象をいくつかの既知情報A1,...,Anに分割します。(ここではn=5とします)
A1,...,A5は互いに交わらず、かつ全て足し合わせると全事象Ωになるように構成します。
これらの事象が成り立つ確率P(A1),...,P(An)を事前確率と呼びます。
事前確率は予め分かっているものとします。
次に、新規情報Bが発生したとします。
すると、Bは必ずA1,...,A5のどれかと交わります。
このとき、「新規情報Bが発生した状況で、それまで既知情報だったAiが発生する確率」を求めたい場合がしばしばあります。
この確率P(Ai∣B)が事後確率と呼ばれるもので、事後確率を求めるための定理が「ベイズの定理」です。
ベイズの定理(離散型)
離散型のベイズの定理は以下のように定義されます。
P(Ai∣B)=∑i=1nP(B∣Ai)P(Ai)P(B∣Ai)P(Ai)
事前確率 | P(Ai) |
事後確率 | P(Ai∣B) |
尤度 | P(B∣Ai) |
周辺尤度 | ∑i=1nP(B∣Ai)P(Ai) |
ベイズの定理を使うと、新しい情報(B)が得られたときに、既存の事象(Ai)の確率を更新することができます。
ベイズの定理(連続型)
ベイズの定理を連続型に拡張すると以下のような定義式になります。
π(θ∣x)=∫θf(x∣θ)π(θ)dθf(x∣θ)π(θ)
事前分布 | π(θ) |
事後分布 | π(θ∣x) |
尤度 | f(x∣θ) |
周辺尤度 | ∫θf(x∣θ)π(θ)dθ |
連続型のベイズの定理は「新しいデータxが与えられた状況で、それまで既知だったパラメータθが取り得る値の分布」を求めていることになります。
ベイズの定理の導出
離散型のベイズの定理の導出を以下に示します。
条件付き確率の定義式
P(A∣B)=P(B)P(A∩B)
P(B∣A)=P(A)P(A∩B)
この2つの定義式より、
P(A∩B)=P(A∣B)P(B)=P(B∣A)P(A)
であるから、以下が得られる。
P(A∣B)=P(B)P(B∣A)P(A)…(1)
次に、Aの取りうる値が複数あるとすると、Ai(i=1,2,...,n)が互いに独立であるという条件の下では、
P(B)=∑i=1nP(Ai∩B)=∑i=1nP(B∣Ai)P(Ai)...(2)
(1)に(2)を代入して、離散型のベイズの定理が得られる。
P(Ai∣B)=P(B)P(B∣Ai)P(Ai)=∑i=1nP(Ai)P(B∣Ai)P(B∣Ai)P(Ai)
連続型のベイズの定理についても、上記の手順で求めることができます。