ベイズ統計学の考え方〜ベイズ論と頻度論の違い〜

2024.2.14

2024.5.17

ベイズ統計

この記事では、ベイズ統計の基本的な考え方について説明します。

ベイズ統計について知らない方は、まず以下の記事をご覧ください。
ベイズ統計学とは？初心者にもわかりやすく解説

頻度論の考え方
ベイズ論の考え方
頻度論とベイズ論の考え方の違い
関連記事

頻度論の考え方

ベイズ統計を考えるために、まずは頻度論について理解しておきましょう。

頻度論とは、「得られたデータが母集団からどのくらいの頻度（確率）で発生するのか」を基本として考える理論です。

例えば、頻度論における仮説検定では、「パラメータに関する帰無仮説を立て、得られたデータが稀に発生したのかどうかを判断」します。

これは、帰無仮説のもとで母集団を固定したときに、得られたデータが発生した確率が妥当かどうかを判断するということです。

ここで重要なのは、「パラメータを固定し、データを動かす」ということです。
数学的に言い換えると「パラメータが定数、データが変数（確率変数）」ということになります。

このような統計学を頻度論と呼びます。

ベイズ論の考え方

ベイズ論の考え方は「手元にあるデータがどのようなパラメータに基づく母集団から得られたのか」を考えます。

頻度論とは逆に「パラメータが変数（確率変数）、データが定数」となります。

頻度論とベイズ論の考え方の違い

変数と定数に対する前提条件については以下のように整理できます。

	定数	変数
頻度論	パラメータ	データ
ベイズ論	データ	パラメータ

具体例を用いて、頻度論とベイズ論の違いを解説します。

例）男性の身長について、平均 $\mu$ 、分散 $10^2$ の正規分布に従う母集団から、30人調査して、標本平均177cmを得たとします。

頻度論の考え方

母平均が $\mu$ （未知だが、実際に存在する値＝定数）である母集団に対し、得られたデータ（標本平均177cm）がどのくらいの確率で得られるか、さらには得られたデータから母平均を推測、検定・・・ということを考えます。

ベイズ論の考え方

177cmというデータが、どのような（母平均が $\mu$ である）母集団から得られる確率が高いか、ということを考えます。

例えば、母平均が177cmである母集団からデータ177cmが得られる確率は高いですが、母平均が165cmである母集団からデータ177cmが得られる確率は低くなります。

このように、母平均 $\mu$ を動かして考える、つまり、パラメータ $\mu$ を変数として考えるのがベイズ論の考え方です。

ベイズ統計ではパラメータ $\mu$ は確率変数ですから、分布を持ちます。

上記の例でいうと、パラメータ $\mu$ が177cmであるとき、標本平均177cmというデータを得られる確率が最も高いので、平均を $177$ とし、分散 $\sigma^2$ の正規分布に従うとすると、 $\mu 〜N(177,\sigma^2)$ と表記することができます。

（補足）
上記の例では177cmは頻度論における最尤推定量になります。ベイズ統計では上記の例に事前情報を考慮するので、実際には $\mu$ の平均は最尤推定量と一致しないことがほとんどです。

ベイズ統計学とは？初心者にもわかりやすく解説

最尤推定量とは？初めての人にも分かりやすく解説

仮説検定とは？初心者にもわかりやすく解説

カテゴリ: ベイズ統計

ベイズ統計学の考え方〜ベイズ論と頻度論の違い〜

頻度論の考え方

ベイズ論の考え方

頻度論とベイズ論の考え方の違い

関連記事