ベイズ統計学の考え方〜ベイズ論と頻度論の違い〜
この記事では、ベイズ統計の基本的な考え方について説明します。
ベイズ統計について知らない方は、まず以下の記事をご覧ください。
ベイズ統計学とは?初心者にもわかりやすく解説
頻度論の考え方
ベイズ統計を考えるために、まずは頻度論について理解しておきましょう。
頻度論とは、「得られたデータが母集団からどのくらいの頻度(確率)で発生するのか」を基本として考える理論です。
例えば、頻度論における仮説検定では、「パラメータに関する帰無仮説を立て、得られたデータが稀に発生したのかどうかを判断」します。
これは、帰無仮説のもとで母集団を固定したときに、得られたデータが発生した確率が妥当かどうかを判断するということです。
ここで重要なのは、「パラメータを固定し、データを動かす」ということです。
数学的に言い換えると「パラメータが定数、データが変数(確率変数)」ということになります。
このような統計学を頻度論と呼びます。
ベイズ論の考え方
ベイズ論の考え方は「手元にあるデータがどのようなパラメータに基づく母集団から得られたのか」を考えます。
頻度論とは逆に「パラメータが変数(確率変数)、データが定数」となります。
頻度論とベイズ論の考え方の違い
変数と定数に対する前提条件については以下のように整理できます。
定数 | 変数 | |
---|---|---|
頻度論 | パラメータ | データ |
ベイズ論 | データ | パラメータ |
具体例を用いて、頻度論とベイズ論の違いを解説します。
例)男性の身長について、平均、分散の正規分布に従う母集団から、30人調査して、標本平均177cmを得たとします。
頻度論の考え方
母平均が(未知だが、実際に存在する値=定数)である母集団に対し、得られたデータ(標本平均177cm)がどのくらいの確率で得られるか、さらには得られたデータから母平均を推測、検定・・・ということを考えます。
ベイズ論の考え方
177cmというデータが、どのような(母平均がである)母集団から得られる確率が高いか、ということを考えます。
例えば、母平均が177cmである母集団からデータ177cmが得られる確率は高いですが、母平均が165cmである母集団からデータ177cmが得られる確率は低くなります。
このように、母平均を動かして考える、つまり、パラメータを変数として考えるのがベイズ論の考え方です。
ベイズ統計ではパラメータは確率変数ですから、分布を持ちます。
上記の例でいうと、パラメータが177cmであるとき、標本平均177cmというデータを得られる確率が最も高いので、平均をとし、分散の正規分布に従うとすると、と表記することができます。
(補足)
上記の例では177cmは頻度論における最尤推定量になります。ベイズ統計では上記の例に事前情報を考慮するので、実際にはの平均は最尤推定量と一致しないことがほとんどです。
関連記事
カテゴリ: ベイズ統計
関連するサービス
記事の筆者
AVILEN編集部
株式会社AVILEN