最尤推定量とは?
最尤推定量とは、文字の如く、最も尤もらしい推定量のことです。
最尤推定量の定義
最尤推定量の定義は以下のようになります。
パラメータθに従う分布の密度関数をf(x;θ)とする。尤度関数をL(θ;x)=f(x;θ)とすると、L(θ;x)を最大にするような推定量θ=θ^をθの最尤推定量という。
コイン投げの例で最尤推定量を考える
では「尤もらしい」というのはどういう意味なのでしょうか?例に沿って考えてみましょう。
【例題】
コインが1枚ある。このコインは"イカサマコイン"らしく、表の出る確率が21ではないらしい。ここで表の出る確率を調べるために、このコインを10回投げたところ、8回表が出た。さて、このコインの表が出る確率はいくつだろうか?
コインの表が出る真の確率は分からないので、この値を推定しなければなりません。
10回中8回表が出ているという結果から、なんとなく108=54と推定することが可能です。まさにこの値が最尤推定量になります。
しかし「なんとなく」では数学的、統計的に好ましくありません。統計学的には、54とした根拠を提示する必要があります。
最尤推定量とは、手元のデータが、どの母パラメータに従う分布から得られる確率が最も高いかに基づいて考えられる推定量です。上の例の場合ですと、「10回中8回出た」というデータが、表が出る(真の)確率がいくつのときに最も得られる確率が高いか、ということです。
具体的に、表が出る確率を変えていきながら今回のように10回中8回表が出る確率を確率を考えてみましょう。
(ⅰ) コインの表が出る真の確率が21のとき、10回中8回表が出る確率
10C8(21)8(21)2≈0.0439=4.39%
(ⅱ) コインの表が出る真の確率が32のとき、10回中8回表が出る確率
10C8(32)8(31)2≈0.195=19.5%
(ⅲ) コインの表が出る真の確率が43のとき、10回中8回表が出る確率
10C8(43)8(41)2≈0.282=28.2%
(ⅳ)コインの表が出る真の確率が54のとき、10回中8回表が出る確率
10C8(54)8(51)2≈0.302=30.2%
(ⅴ) コインの表が出る真の確率が65のとき、10回中8回表が出る確率
10C8(65)8(61)2≈0.291=29.1%
このように、母パラメータの取りうる範囲で全て計算を行ったとき、「10回中8回表が出る」というデータが得られる確率が最も高くなるのが54のときなのです。
こういった意味で、「尤もらしい=いかにも道理にかなっている」推定である54が最尤推定量になります。
しかし、母パラメータの取りうる範囲で全て計算を行うのは事実上不可能です。そこで最尤推定量を計算で導出していくことにしましょう。
最尤推定量の導出
例題の数字の部分を文字式に置き換えて考えて見ましょう。これによって、二項分布の最尤推定量を一般化して導出できます。
【例題 - 文字式バージョン】
コインが1枚ある。このコインの表の出る真の確率をp(未知)とする。このコインをn回投げたところ、x回表が出た。このとき、pの最尤推定量を求めよ。
さて、このxは二項分布Bi(n,p)に従います。
二項分布の密度関数は
f(x;θ)=nCxθx(1−θ)n−x
であるから、尤度関数は
L(θ;x)=nCxθx(1−θ)n−x
となり、このL(θ;x)が最大になるようなθを考えます。
通常、最大値(極大値)を求めるときには微分します。
しかし、この関数を微分するのは少々面倒なので、対数尤度関数l(θ)=logL(θ;x)を微分し、最大値を考えます。
これは、対数関数が(0,∞)の範囲で単調に増加するため、L(θ;x)が最大になるようなθとl(θ)が最大になるようなθが一致することを利用しています。また、尤度関数ではなく対数尤度関数を微分する理由は、logをとることで積の形から和の形にできるため、微分計算が楽になるからです。
対数尤度関数は
l(θ)=logL(θ;x)=log[nCxθx(1−θ)n−x]
=log[x!(n−x)!n!θx(1−θ)n−x]
=log(n!)−log(x!)−log(n−x)!+logθx+log(1−θ)n−x
=log(n!)−log(x!)−log(n−x)!+xlogθ+(n−x)log(1−θ)
となるので、θで微分すると、
l′(θ)=θx−1−θn−x
=θ(1−θ)x(1−θ)−(n−x)θ
=θ(1−θ)x−nθ
が得られます。これが0となるとき最大になるので、
θ(1−θ)x−nθ=0
⇔x−nθ=0
⇔x=nθ
⇔θ=nx
となります。
以上より、二項分布の場合、θ^=nxがθの最尤推定量となります。
これで、「10回中8回表が出る」という例でいうならば、n=10、x=8となるため、最尤推定量が54であるという根拠が示せました。