点帰無仮説におけるベイズ流仮説検定の問題点
以下のような仮説検定を考えます。
H0:θ=θ0
H1:θ=θ0
連続型の事前分布をπ(θ)とすると、点帰無仮説を満たす事前確率は以下の図のようになります。
点帰無仮説は幅がないため、帰無仮説を満たす確率π0が0になってしまいます。
もちろん事後分布における事後確率も0になり、検定ができなくなってしまうのが点帰無仮説におけるベイズ流仮説検定の問題点です。
そこで、点帰無仮説におけるベイズ流仮説検定では、帰無仮説を満たす事前確率π0を自分で割り当てて検定を行います。
例えば、日本人の成人男性の平均身長において、以下のような仮説検定を考えます。
H0:μ=170
H1:μ=170
理論上はμ=170を満たす確率は0ですが、例えばこれを50%とおきます。
つまり、μ=170である確率が50%、μ=170である確率が50%と仮定して仮説検定を行います。
事後オッズ比とベイズファクターの計算
点帰無仮説の場合、ベイズ統計と仮説検定【4】で扱った事前分布
π(θ)=π0g0(θ)I(θ∈Θ0)+(1−π0)g1(θ)I(θ∈Θ1)
は、次のように書き換えられます。
π(θ)=π0(θ)I(θ=θ0)+(1−π0)g1(θ)I(θ=θ0)
周辺尤度は次のように計算できます。
m(x)=π0f(x∣θ0)+(1−π0)m1(x)
m1(x)=∫θ=θ0f(x∣θ)g1(θ)dθ
よって事後確率は
π(θ0∣x)=m(x)f(x∣θ0)π0
=π0f(x∣θ0)+(1−π0)m1(x)π0f(x∣θ0)
=[π0f(x∣θ0)π0f(x∣θ0)+(1−π0)m1(x)]−1
=[1+π01−π0f(x∣θ0)m1(x)]−1
1−π(θ0∣x)=1−π0f(x∣θ0)+(1−π0)m1(x)f(x∣θ0)π0
π0f(x∣θ0)+(1−π0)m1(x)(1−π0)m1(x)
したがって事後分布は、以下のようになります。
1−π(θ0∣x)π(θ0∣x)=π0f(x∣θ0)+(1−π0)m1(x)(1−π0)m1(x)π0f(x∣θ0)+(1−π0)m1(x)π0f(x∣θ0)
=1−π0π0m1(x)f(x∣θ0)
ここでπ0によらない部分
BF01=m1(x)f(x∣θ0)
をベイズファクターとして定義するので、事後確率π(θ0∣x)は次のようになります。
π(θ0∣x)=[1+π01−π0BF01−1]−1
例題:二項分布の場合のベイズファクター
例として、二項分布の場合のベイズファクターを計算してみましょう。
例題
H0:p=p0
H1:p=p0
という検定を考える。データはX〜B(n,p)であるとする。このとき、事前分布はp〜Beta(α,β)に従うとする。
上記の理論におけるm1(x)は
m1(x)=(xn)Γ(α)Γ(β)Γ(α+β)Γ(α+β+n)Γ(α+x)Γ(β+n−x)
であるから、ベイズファクターは
BF01=(xn)Γ(α)Γ(β)Γ(α+β)Γ(α+β+n)Γ(α+x)Γ(β+n−x)(xn)θ0x(1−θ0)n−x
=Γ(α+β)Γ(α)Γ(β)Γ(α+x)Γ(β+n−x)Γ(α+β+n)θ0x(1−θ0)n−x
と計算できます。
よって、事後確率は
π(θ0∣x)=[1+π01−π0BF01−1]−1
=[1+π01−π0θ0x(1−θ0)n−xΓ(α)Γ(β)Γ(α+β)Γ(α+β+n)Γ(α+x)Γ(β+n−x)]−1
例題:点帰無仮説の場合の仮説検定
例題を用いて、点帰無仮説の場合の仮説検定を考えてみましょう。
例題
コインを5回投げたところ4回表が出ました。このコインはイカサマコインと言えるでしょうか。
ただし表の出る確率の分布は事前にBeta(1,1)に従っているとし、しきい値を191とします。
表の出る確率をpとし、以下の仮説検定を考えます。
H0:p=21
H1:p=21
先ほどの例題「二項分布の場合のベイズファクター」で扱った式に代入すると、ベイズファクターは次のように表せます。
BF01=Γ(1+1)Γ(1)Γ(1)Γ(1+4)Γ(1+5−4)Γ(1+1+5)(21)4(1−21)5−4
=4!1!6!(21)5
=1615=0.9375
よってπ0=21と割り当てると、事後オッズ比は次のようになります。
P(H1∣X)P(H0∣X)=1−π0π0BF01=1−2121×0.9375=0.9375<191
よって、帰無仮説を受容し、イカサマコインではないと判断します。また、ベイズファクターの値から帰無仮説に反対する根拠があまりないという結果が得られます。
補足
事後オッズ比の値から、θ0を満たす確率は1+0.93750.9375=0.484=48.4%となっています。
これは、はじめ表の出る確率を50%と設定したが、「5回中4回表が出た」というデータから、表の出る確率が48.4%に落ちた、と解釈することができます。
関連記事
第1回:ベイズ統計と仮説検定【1】~頻度論との違い~
第2回:ベイズ統計と仮説検定【2】~ベイズ統計の基本的な仮説検定~
第3回:ベイズ統計と仮説検定【3】~頻度論の考え方に基づくベイズ統計の仮説検定~
第4回:ベイズ統計と仮説検定【4】~ベイズファクター~
第5回:ベイズ統計と仮説検定【5】~点帰無仮説におけるベイズ流の仮説検定~
第6回:ベイズ統計と仮説検定【6】~ベイズ流仮説検定の問題点~