仮説検定とは?初心者にもわかりやすく解説
このページでは、仮説検定について、分かりやすい例を交えつつ解説していきます。
目次
仮説検定(hypothesis testing)とは
仮説検定とは「とある仮説に対して、それが正しいのか否かを統計学的に検証する」という推計統計学の手法の一つです。
統計的仮説検定もしくは省略して検定と呼ぶこともあります。
仮説検定を利用する場面
仮説検定がどのような場面で使えるのか、その具体例を見ていきましょう。
例
”自称”予知能力のある占い師がいます。その能力が本物かを検証すべく、野球の試合の勝ち負け予想をさせたところ、5試合連続で予想を的中させました。
さて、ここで占い師の予知能力は本物であると言えるでしょうか?
(※なお試合の勝率は常にとします)
これを統計学を用いて客観的に判断するのが、仮説検定と呼ばれる手法です。
まずは前提条件として、仮説と、の逆のを以下のように置いてみます。
:この占い師には予知能力がない。
:この占い師には予知能力がある。
ここから仮説検定でが正しいかを検証していきましょう。
5連続で試合に勝つチームを当てる確率は次のようになります。
もし、この占い師に予知能力がない場合、約3%という非常に低い確率を引き当てたことになります。
ここで「とても低い確率だから仮説は間違ってるだろう」と考えた場合、が正しい(この占い師には予知能力がある)ことになり、占い師の予知能力を認めることになります。
しかし、統計的には「とても低い確率だ」という主観で仮説を間違っていると判断してはいけないので、仮説検定を用いて判断をしていくことになります。
帰無仮説と対立仮説
具体例で、2つの仮説、を設定しましたが、それぞれ以下のように呼ばれます。
帰無仮説 | 仮説検定で検証したい仮説 | この占い師には予知能力がない |
対立仮説 | 帰無仮説の逆の仮説 | この占い師には予知能力がある |
また、「帰無仮説を間違っている」と判断することを、「帰無仮説を棄却する」といいます。
具体例の3.125%など、帰無仮説が正しい場合にその結果が得られる確率のことをp値といいます。
p値
帰無仮説が正しいとしたときに、観測データの実現値が得られる確率、またはそれ以上に極端なデータが得られる確率。
帰無仮説を棄却する条件は、「p値が有意水準より小さいこと」になります。
また、帰無仮説を棄却する判断基準を有意水準、有意水準以下の確率を取る領域を棄却域といいます。
仮説検定には、片側検定と両側検定があり、同一の有意水準を使った場合でも、どちらの検定を用いるかで棄却域が変わってきます。
詳細は、「片側検定と両側検定の違いをわかりやすく解説」でご確認ください。
第一種の過誤と第二種の過誤
誤って仮説を棄却した場合、間違い方によって以下のように呼び方が分かれます。
第一種の過誤
帰無仮説を棄却したが、実はが正しかった場合
第二種の過誤
対立仮説が正しいにもかかわらず、帰無仮説を棄却しなかった場合
帰無仮説の決め方
具体例では、以下のように仮説を置きました。
帰無仮説:この占い師には予知能力がない。
対立仮説:この占い師には予知能力がある。
これを逆に設定してはいけません。
仮説検定では、主張したい仮説ではない方の仮説を帰無仮説とします。
具体例では、「予知能力がある」と主張したいので、帰無仮説には「予知能力がない」ことを設定する必要があります。
仮説検定では、帰無仮説を棄却して主張したいことの正しさを証明します。
仮説検定の手順
仮説検定の大まかな手順を整理します。
手順①
検証したいことについて2つの仮説、帰無仮説と対立仮説を立てます。このとき、主張したい説の方を対立仮説とします。
手順②
帰無仮説が正しいとしたときに、その観測データの実現値が得られる、もしくはそれよりもさらに極端なデータが得られる確率(p値)を求めます。
手順③
手順②で計算したp値が有意水準以下の場合、帰無仮説を棄却し、対立仮説を採択します。そうでない場合、帰無仮説は棄却出来ず、検定は失敗に終わります。
実務での応用例
仮説検定が実務で使われている場面として、新薬の開発が挙げられます。
例えば、新しく開発中の風邪薬の効力を検証したい場合、以下のように仮説を設定して仮説検定を実施します。
帰無仮説:新しい風邪薬には効き目がない。
対立仮説:新しい風邪薬には効き目がある。
この仮説検定で一定の有意水準を満たした薬のみが新薬として世に出回るといった形です。
仮説検定の種類
代表的な仮説検定の種類を紹介します。詳細はそれぞれの解説ページをご確認ください。
t検定
t検定は、母分散が未知の正規分布に従う場合に利用する仮説検定です。
詳細は「t検定とは?種類と手順を解説」をご確認ください。
Z検定
Z検定とは、母分散が既知の正規分布の場合に実施する仮説検定です。
詳細は「Z検定とは?正規分布の母平均の検定手順を解説」をご確認ください。
カイ二乗検定
カイ二乗検定とは帰無仮説が正しいとしたもとで、検定統計量が(近似的に)カイ二乗分布に従うような仮説検定手法の総称です。
詳細は「カイ二乗検定のわかりやすいまとめ」をご確認ください。
適合度検定
適合度検定とは、帰無仮説における期待度数に対して実際の観測データの当てはまりの良さを検定するための手法です。
詳細は「適合度の検定をカイ二乗検定で実施する手順を例題でわかりやすく解説」をご確認ください。
関連記事
カテゴリ: 仮説検定
関連するサービス
記事の筆者
AVILEN編集部
株式会社AVILEN