F分布とカイ二乗分布の関係
F分布とカイ二乗分布とは以下のような関係があります。
XとYが互いに独立である確率変数X,Yについて、Xが自由度nのカイ二乗分布、確率変数Yが自由度mのカイ二乗分布に従うと仮定します。
このとき、
F=mYnX
と表されるFが従う分布を、F分布という。
F分布とカイ二乗分布の確率密度関数
F分布とカイ二乗分布の確率密度関数の形を確認しておきましょう。
カイ二乗分布の確率密度関数(自由度k) | f(x)=22kΓ(2k)x2k−1e−2x |
F分布の確率密度関数 | f(z)=B(2n,2m)(mn)2n(1+mnz)−2n+mz2n−1 |
ガンマ関数・ベータ関数の性質
F分布の確率密度関数の導出には、ガンマ関数とベータ関数の性質も利用するので、ここで確認しておきます。
ガンマ関数
任意の正の実数kを用いて、以下のようにに表すことができる。
Γ(k)=∫0∞tk−1e−tdt
ベータ関数
ベータ関数はガンマ関数を用いて、以下のように表すことができる。
B(x,y)=Γ(x+y)Γ(x)Γ(y)
F分布の確率密度関数の導出
それぞれ自由度n,mのカイ二乗分布に従う確率変数X,Yが互いに独立であるとします。
ここでXとYの同時確率密度関数f(x,y)を考えます。
XとYが互いに独立であると仮定したので、f(x,y)は次のように表すことができます。
f(x,y)=Γ(2n)22n1x2n−1e−2xΓ(2m)22m1y2m−1e−2y=f(x) ⋅f(y)
XとYの同時確率密度関数は、Xの密度関数f(x)とYの密度関数f(y)の積で表すことができます。
f(x)は自由度nのカイ二乗分布の確率密度関数であり、f(y)は自由度mのカイ二乗分布の確率密度関数です。
次に、xとyについて、zとwを用いて、次のような変数変換を行います。
z=mynx
w=y
上記の式をxとyについて解くと、
x=mnzw
y=w
この変換のヤコビアンを考えると、以下のような値となります。
∂(z,w)∂(x,y)=∂z∂x∂z∂y∂w∂x∂w∂y=mnw0mnz1 = mnw
補足:ヤコビアンとは
ヤコビアン(Jacobian)は、多変数関数の微分に関する重要な概念です。特に、多変数関数が複数の変数に依存する場合に、その変数間の関係を理解するのに役立ちます。
具体的には、多変数関数が与えられたとき、その関数が各変数にどの程度の速さで変化するかを表す行列です。これは、関数の微分をベクトルや行列の形で表現する際に使われます。
ヤコビアンの要素は、各変数の偏微分によって得られます。
したがって、z=mynxの確率密度関数f(z)を考えると次のように表せます。
g(z,w)というのは、zとwの同時確率密度関数を表しています。
f(z)=∫0∞g(z,w)dw =∫0∞f(x,w)∂(z,w)∂(x,y)dw= ∫0∞f(mnzw,w)mnwdzdw=∫0∞Γ(2n)Γ(2m)2−2n+m(mnzw)2n−1e−2mnzww2m−1e−2wmnwdwdz=22n+mΓ(2n)Γ(2m)(mn)2nz2n−1∫0∞w2n+me−2mw(nz+m)dw
同時確率密度関数g(z,w)をwについて積分して、zの周辺確率密度関数を求めるという計算を行っています。
ここで、t=−2mw(nz+m)と変数変換を行うと、wとdwについて、以下のように表すことができます
w=nz+m2mt
dw=nz+m2mdt
これを利用すると、f(z)の5行目の式におけるwの積分式について、次のように表すことができます。
∫0∞w2n+me−2mw(nz+m)dw=∫0∞(nz+m2mt)2n+m−1e−tnz+m2mdt=(nz+m2m)2n+m∫0∞t2n+me−tdt=(nz+m2m)2n+mΓ(2n+m)
補足
ガンマ関数の性質を用いて、Γ(2n+m)=∫0∞t2n+me−tdtとなることを利用。
上式を代入することで、f(z)は最終的に以下の形に求まります。
f(z)=n2nm2mΓ(2n)Γ(2m)Γ(2n+m)(nz+m)2n+mz2n−1=B(2n,2m)(mn)2n(1+mnz)−2n+mz2n−1
補足
B(⋅,⋅)はベータ関数といい、上式ではガンマ関数Γ(⋅)を用いて、ベータ関数の性質の1つであるB(2n,2m)=Γ(2n+2m)Γ(2n)Γ(2m)を利用。
関連記事
カイ二乗分布のわかりやすいまとめ
F分布とは
カイ二乗分布を用いたF分布の期待値と分散の導出
確率密度関数を用いたF分布の期待値と分散の導出