ベイズ統計における仮説検定の問題点
ベイズ統計における仮説検定には「事後オッズ比が事前分布の設定によって左右される」という問題があります。
事後分布が事前分布によって得られることはベイズの定理から証明することができます。
例えば、以下のような仮説検定を考えます。
H0:θ≤θ0
H1:θ>θ0
また、事前分布を以下の図のように設定します。
上記の分布だと、有意水準pが5%の場合、すでに帰無仮説が棄却されてしまう状態です。
このようにベイズ統計の仮説検定には、事前に設定する確率によって、帰無仮説を棄却する可能性に差が生じるという弱点があります。
ベイズファクターとは
上記のようなベイズ統計の仮説検定の弱点を補うために、ベイズファクターを使います。
ベイズファクターとは、仮説検定の証拠の強さを表します。
例えば、以下のような仮説検定を考えます。
H0:θ∈Θ0
H1:θ∈Θ1
π0と1−π0をそれぞれΘ0とΘ1の事前確率とします。これを図で表すと、以下のようになります。
gi(θ)をΘiのもとでのθの事前分布の密度関数とすると、
gi(θ)=∫θ∈Θiπ(θ)dθπ(θ)
であるから、
g0(θ)=∫θ∈Θ0π(θ)dθπ(θ)=π0π(θ)
g1(θ)=∫θ∈Θ1π(θ)dθπ(θ)=1−π0π(θ)
と与えられます。
よって、事前分布は以下のように分解することができます。
π(θ)=π0g0(θ)I(θ∈Θ0)+(1−π0)g1(θ)I(θ∈Θ1)
I(・)は指示関数
これを利用して事後オッズ比を導出していきます。
事前分布π(θ)のもとでのXの周辺尤度をmπ(x)とすると、事後分布π(θ∣x)はベイズの定理より、以下のように与えられます。
π(θ∣x)=mπ(x)f(x∣θ)π(θ)
この式は、θ∈Θ0のとき
mπ(x)π0g0(θ)f(x∣θ)
であり、θ∈Θ1のとき
mπ(x)(1−π0)g1(θ)f(x∣θ)
となります。
よって、データが与えられた上での仮説を満たす確率P(Hi∣X)は、その積分値
P(H0∣X)=∫Θ0mπ(x)π0g0(θ)f(x∣θ)dθ
P(H1∣X)=∫Θ1mπ(x)(1−π0)g1(θ)f(x∣θ)dθ
で与えられます。
従って、事後オッズ比は、
P(H1∣X)P(H0∣X)=∫Θ1mπ(x)(1−π0)g1(θ)f(x∣θ)dθ∫Θ0mπ(x)π0g0(θ)f(x∣θ)dθ
=mπ(x)1−π0∫Θ1g1(θ)f(x∣θ)dθmπ(x)π0∫Θ0g0(θ)f(x∣θ)dθ
=1−π0∫Θ1g1(θ)f(x∣θ)dθπ0∫Θ0g0(θ)f(x∣θ)dθ
と計算できます。
ここで、π0によらない部分、つまり
∫Θ1g1(θ)f(x∣θ)dθ∫Θ0g0(θ)f(x∣θ)dθ
をベイズファクターBF01と定義します。
よって事後オッズ比は、
P(H1∣X)P(H0∣X)=1−π0π0BF01
と表すことができます。
事後分布によって決められる事後オッズ比に対して、1−π0π0の部分は事前分布によって決められる事前オッズ比ということができます。
よって、この式は以下のように簡単に表すことができます。
事後オッズ比=事前オッズ比×ベイズファクター
検定の証拠の強さを表すとは
ベイズファクターは、仮説検定における証拠の強さを表すことができます。
Jeffreysはベイズファクターの証拠価値を次のように表現しています。
ベイズファクター | 証拠の強さ |
---|
1>BF01≥3.21 | 帰無仮説を支持することに反対する証拠がほとんどない |
3.21>BF01≥101 | 帰無仮説を支持することに反対する証拠があまりない |
101>BF01≥321 | 帰無仮説を支持することに反対する証拠が十分にある |
321>BF01≥1001 | 帰無仮説を支持することに反対する強い証拠がある |
1001>BF01 | 帰無仮説を支持することに反対する決定的証拠がある |
上記の表から、BF01が0に近づけば近づくほど、帰無仮説を棄却するための証拠が強くなると言えます。
例えば、以下のような仮説検定を考えます。
H0:θ≤θ0
H1:θ>θ0
事前オッズ比を14とするように事前分布を設定します。
これは、事前分布において帰無仮説を満たす確率が80%であるので、帰無仮説が非常に棄却されにくい状態で設定したということになります。
例えばベイズファクターが以下の場合を考えてみます。
⑴BF01=301の場合
事後オッズ比は14×301=7.51>191
⑵BF01=1001の場合
事後オッズ比は14×1001=251<191
BF01の値が1001もあれば、帰無仮説が非常に棄却されにくい状態で設定したとしても、帰無仮説を棄却することができます。
したがって、BF01が0に近づけば近づくほど、帰無仮説を満たす確率を小さくするための割合が大きくなるので、棄却するための証拠が強くなっていると言えます。
例題
ベイズ統計と仮説検定【3】でも扱った例題で、ベイズファクターを用いて計算してみましょう。
例題
成人男性の平均身長が170cmより大きいかどうかを調べます。成人男性の身長はN(μ,102)に従うとします。
ある男性のデータを確認したところ177cmでした。このとき成人男性の平均身長が170cm以下であるといえるでしょうか。
ただし、μは事前にN(172,202)に従うとし、しきい値を191とします。
ベイズ統計と仮説検定【3】より事後オッズ比は0.335であると算出しました。
事前オッズ比を算出します。
π0=P(μ≤170)=Φ(20170−172)=Φ(−0.1)=0.460
1−π0=1−0.460=0.540
上記より、事前オッズ比は次のようになります。
1−π0π0=0.5400.460=0.852
よってベイズファクターは次のようになります。
BF01=0.8520.335=0.393
表から、帰無仮説を支持することに反対する証拠がほとんどない、という結果が得られます。
関連記事
第1回:ベイズ統計と仮説検定【1】~頻度論との違い~
第2回:ベイズ統計と仮説検定【2】~ベイズ統計の基本的な仮説検定~
第3回:ベイズ統計と仮説検定【3】~頻度論の考え方に基づくベイズ統計の仮説検定~
第4回:ベイズ統計と仮説検定【4】~ベイズファクター~
第5回:ベイズ統計と仮説検定【5】~点帰無仮説におけるベイズ流の仮説検定~
第6回:ベイズ統計と仮説検定【6】~ベイズ流仮説検定の問題点~