危険関数(リスク関数)とは
危険関数(リスク関数)とは、ある行動δとったときに起こる損失について評価した関数です。損失関数の期待値によって表されます。
危険関数の定義
変数を次のように定義します。
・ランダム変数:X〜Pθ
・行動(決定):d
・決定の関数:δ(x)
・決定dによる損失:L(θ,d)
ここで、決定δによる損失の期待値R(θ,δ)は、
R(θ,δ)=εθL[(θ,δ(x))]
です。このRを危険関数といいます。
ここで、損失Lの評価方法は色々あり、一種類ではりません。例えば、一変量の場合であれば、二乗誤差や差の絶対値の形で、次のように表すことがあります。
L(θ,d)=(θ−d)2L(θ,d)=∣θ−d∣
危険関数の例題
危険関数の使いどころを例題を通して確認しましょう。
例題
Bさんの手の中に何枚のコインが入っているかをAさんが当てるゲームをします。コインは1〜5枚で握る枚数の確率は全て51とし、実際の枚数に近い枚数を言えば、何もなし。実際の枚数と離れた数字を言ってしまうほど、重い罰ゲームを受けるとします。ここでAさんは何枚と答えるのが一番良い選択でしょうか?
Aさんの決定をd枚とし、損失を絶対値で評価する形式を取ります。
この場合、損失の期待値はそれぞれのdにおいて次のような計算になります。
d=5⟶εθL[(θ,d)]=51(4+3+2+1+0)=2
d=4⟶ εθL[(θ,d)]=51(3+2+1+0+1)=1.4
d=3⟶ εθL[(θ,d)]=51(2+1+0+1+2)=1.2
d=2⟶ εθL[(θ,d)]=51(1+0+1+2+3)=1.4
d=1⟶ εθL[(θ,d)]=51(0+1+2+3+4)=2
以上の結果から、d=3のときに損失の期待値が最小になるので、今回のゲームでは3枚と答えるのが最も安全だと言えます。
このように、行動を決定するとき、危険関数R(θ,δ)が小さくなるような行動δを最善とする決定理論があります。
危険関数と事前分布
危険関数に対してρ(θ)という事前分布を与えると、危険関数の期待値を取ることによって、行動による平均損失r(ρ,δ)を求めることができます。それが次の式です。
r(ρ,δ)=ερR(θ,δ)=ερεθL[(θ,δ(x))]
このように、事前分布ρ(θ)を与えて、rが最小化された行動(手順)をベイズ手順といい、その時のrをベイズリスクという言い方をします。
この事前分布を考えて行動を決定するという考え方です。
この危険関数の期待値の形は、積分記号を用いて、以下のように表記されることが多いです。
r(ρ,δ)=∫Θ∫XL[(θ,δ(x))]f(x∣θ)ρ(θ) dxdθ
上式は、xとθの同時密度関数gについて、g(x,y)=f(x∣θ)ρ(θ)が成り立つことを利用しています。
ここで、xの周辺密度関数f(x)と、xを与えた時のθの分布が
f(x)=∫f(x∣θ)ρ(θ)dθg(θ∣x)=f(x)f(x∣θ)ρ(θ)
になることを使うと、
r(ρ,δ)=∫X[∫ΘL[(θ,δ(x))]g(θ∣x)dθ]f(x)dx
となります。