指数型分布族とは
確率変数Xが1つの未知パラメータθを持つ確率分布に従い、その確率分布が確率(密度)関数f(x;θ)を持つとき、確率関数が以下の式によって表記できる場合、その分布は指数型分布族(exponential family of distribution)に属するといいます。
f(x;θ)=exp[a(x)b(θ)+c(θ)+d(x)]
a(.),b(.),c(.)やd(.)は既知である関数とする。
さらに、a(x)=xを満たす場合、その分布は正準形(canoncial form)であると言います。また、θは分布の自然パラメータ(natural parameter)と呼ばれます。
もし関数に興味のある未知パラメータθ以外に他のパラメータが存在した場合、関数a(.),b(.),s(.)やt(.)を構成する局外パラメータ(nuisance parameter)と見なして扱うものとします。
指数型分布族に分類される確率分布は、一般化線形モデルを適用することが可能であったり、ベイズ統計において共役事前分布をもつことが示されています。
複数のパラメータをもつ確率分布は、どのパラメータが未知であるかによって、場合によっては指数型分布族には属さないというケースがあります。
以下では、パラメータの既知・未知を場合分けして、証明を進めます。
正規分布が指数分布族に属することの証明
確率変数Xが平均μ、分散σ2の正規分布に従うとき、確率密度関数f(x)は以下の式となります。
f(x)=2πσ21exp[−2σ2(x−μ)2]
このとき、確率密度関数を次のように変形します。
f(x)=exp[−2σ2x2+σ2xμ−2σ2μ2−21log(2πσ2)]
パラメータが複数存在するため、3つの場合に分けて確認していきましょう。
mu 未知 、σ2 既知のとき
θ=μとします。このとき、
a(x)=x,b(μ)=σ2μ,c(μ)=−2σ2μ2−21log2πσ2,d(x)=−2σ2x2
と書けるため、1パラメータの指数型分布族に属します。
また、a(x)=xと表せることから正準形です。
mu 既知、 σ2 未知のとき
θ=σ2とします。このとき、
a(x)=(x−μ)2,b(σ2)=−2σ2μ,c(σ2)=−21log2πσ2,d(x)=0
と書けるため、1パラメータの指数型分布族に属します。
また、a(x)=xと表せることから正準形です。
mu、σ2ともに未知のとき
θ=(μ, σ2)とします。このとき、
{a1(x)=xb1(θ)=σ2μ{a2(x)=x2b2(θ)=−2σ21c(θ)=−2σ2μ2−21log2πσ2,d(x)=0
と書けるため、2パラメータの指数型分布族に属します。
関連記事
指数型分布族とは?定義と性質をわかりやすく解説
共役事前分布を分かりやすく解説
指数型分布族の性質を利用した期待値と分散の求め方