t検定とは?種類と手順を解説

更新日

このページでは統計的仮説検定の中で特に利用頻度の高い「t検定」について解説します。

t検定とは

t検定は、母分散が未知の正規分布に従う場合に利用する検定手法です。

Z検定は、母分散が既知の正規分布に従う場合に利用する検定手法なので、t検定とZ検定の違いは母分散が未知であるか既知であるかという点になります。

現実では母分散が未知である場合が大多数なので、t検定のほうが有用な検定手法として利用されます。

母分散が未知の正規分布の性質

正規分布に従うと仮定したデータに対して仮説検定を行う場合、帰無仮説の下で標準化する必要があります。

標準化の計算過程に母分散が必要になりますが、母分散が未知の場合、代わりに標本分散による推定値「標本不偏分散」を使います。

標本不偏分散を使って標準化した場合、正規分布は標準正規分布ではなくt分布に従うことが知られています。

また、この操作によって得られた値をt値といい、t値とt分布表によって得られる値をp値(有意確率)といいます。

p値が有意水準より小さい場合、帰無仮説を棄却します。

t検定の種類

t検定は大きく分けて次の3種類に分けられます。

  1. 「正規分布に従う一つの母集団の母平均が、特定の値と等しいか」に関するt検定(1標本問題)
  2. 「正規分布に従う二つの母集団の母平均の差に有意差が認められるか」に関するt検定(2標本問題)
  3. 「回帰分析における回帰直線の回帰係数が0であるか」に関するt検定

以降で、それぞれについて解説します。

1標本問題のt検定

1標本問題のt検定とは、「正規分布に従う一つの母集団の母平均が、特定の値と等しいか」に関するt検定です。

サンプルサイズnnの標本データ、x1,....,xnx_1,....,x_nが独立に同じ正規分布N(μ,σ2)N(μ,σ^2)(ただしσ2σ^2は未知)に従うと仮定します。

また、仮説を次のようにおきます。

帰無仮説H0:μ=μ0H_0:μ = μ_0
対立仮説H1:μμ0H_1:μ ≠ μ_0

母分散が未知であるとき、σ2σ^2の推定値として、不偏分散σ^2=Σ(xixˉ)2(n1)\hat{σ}^2=\frac{Σ(x_i-\bar{x})^2}{(n-1)}を使います。

標本の平均値xˉ\bar{x}を用いて、帰無仮説のもとで、

t=xˉμ0σ^nt = \frac{\bar{x}-μ_0}{\frac{\hat{σ}}{\sqrt{n}}}

とすると、tは自由度n1n-1t分布に従います。また検定で得られた値をt値といい、、t値とt分布表でp値を求め、あらかじめ定めた有意水準以下であれば帰無仮説を棄却します。

t検定の標準化の形は、正規分布の形と比べると覚えやすいです。

z=xˉμ0σnN(0,1)t=xˉμ0σ^nt(n1)z= \frac{\bar{x}-μ_0}{\frac{σ}{\sqrt{n}}}~N(0,1)\longleftrightarrow t = \frac{\bar{x}-μ_0}{\frac{\hat{σ}}{\sqrt{n}}} ~t(n-1)

2標本問題のt検定

2標本問題のt検定とは、「正規分布に従う二つの母集団の母平均の差に有意差が認められるか」に関するt検定です。

サンプルサイズn,mn,mの2つの標本、x1,....,xmx_1,....,x_my1,....,yny_1,....,y_nが正規分布N(μ1,σ12)N(μ_1,σ_1^2)N(μ2,σ22)N(μ_2,σ_2^2)(ただしσ1,σ2σ_1,σ_2は未知)に従うと仮定します。このときの、2標本の母平均の差、δδに関する検定を行い、仮説を次のようにおきます。

帰無仮説H0:δ=μ0H_0:δ = μ_0
対立仮説H1:δμ0H_1:δ ≠ μ_0

ここで、2つの標本の平均値xˉN(μ1,σ12m)\bar{x}~N(μ_1,\frac{σ_1^2}{m})yˉN(μ2,σ22n)\bar{y}~N(μ_2,\frac{σ_2^2}{n})の差d=xˉyˉd = \bar{x} - \bar{y}も正規分布N((μ1μ2),σ2(1m+1n))N((μ_1 - μ_2),σ^2(\frac{1}{m}+\frac{1}{n}))に従うことを利用します。

2標本問題のt検定の場合、さらに3つのパターンに分けられれます。

母分散が等しいと仮定したt検定

2つに標本の母分散が等しいと仮定した上で行うt検定です。

母分散が等しいと仮定すると、σ12=σ22=σ2σ_1^2 = σ_2^2 = σ^2と表せます。その推定量をσ^2\hat{σ}^2とすると、xxyyの不偏分散を自由度の重みをとした加重平均を用いて、

σ^2=Σ(xixˉ)2+Σ(yjyˉ)2m+n2\hat{σ}^2 = \frac{Σ(x_i-\bar{x})^2+Σ(y_j-\bar{y})^2}{m + n -2}

と推定できます。

よって、帰無仮説のもとでd=xˉyˉd = \bar{x} - \bar{y}を標準化すると次のようになります

t=xˉyˉ1m+1nσ^ ~t(m+n2)t = \frac{\bar{x} - \bar{y}}{\sqrt{\frac{1}{m}+\frac{1}{n}}\hat{σ}}  ~t(m + n - 2)

これがt値であり、t分布表と合わせて求めたp値(有意確率)が有意水準以下の場合、二つの母集団の平均には有意)が認められると言えます。

母分散が違うと仮定したt検定(ウェルチの検定)

2つの標本の母分散が等しいと仮定できない場合に行うt検定で、ウェルチの検定と呼ばれます。

σ1σ2σ_1 ≠ σ_2なので、その推定値σ1^2,σ2^2\hat{σ_1}^2,\hat{σ_2}^2を別々に考えます。

dを標準化したtt

t=xˉyˉσ1^2m+σ2^2nt = \frac{\bar{x} - \bar{y}}{\sqrt{\frac{\hat{σ_1}^2}{m} + \frac{\hat{σ_2}^2}{n}}}

となり、これは近似的にt分布に従うことが分かっているので、t値、p値を求められます。

自由度ffとすると、次のようになります。(ただし、ffは整数とは限りません)

f=(g1+g2)2g12m1+g22n1f = \frac{(g_1+g_2)^2}{\frac{g_1^2}{m-1} + \frac{g_2^2}{n-1}}

g1=σ1^2m ,  g2=σ2^2ng_1 = \frac{\hat{σ_1}^2}{m}   ,\  g_2 = \frac{\hat{σ_2}^2}{n}

対応のある2標本のt検定

検定の対象となる2つの標本において、標本の一つ一つが対になっている、もしくは何らかの関係が認められるときに行うt検定です。

2標本に対応がある場合とは、例えば以下のようなケースです。

同じ人に対して血圧を下げる薬を処方し、x1,....,xmx_1,....,x_mが薬を処方する前の血圧、y1,....,yny_1,....,y_nが薬を服用し始めてから2週間後の血圧として検定する。

このように2つの標本の各データが1対1で対応したデータであるとき、普通に検定するよりも、対応を考慮に入れて対を作って検定をするのが好ましいとされます。

また、このような標本を、対標本(paired sample)と呼びます。

対を作ることの有効性は、個体の観測値、(x,y)(x,y)が正の相関を持つとすると、その差d=xyd = x-yの分散は、σd2=σx2+σy22σxyσ_d^2 = σ_x^2 + σ_y^2 - 2σ_xyとなり、(x,y)(x,y)が独立の場合よりも分散が小さくなる点です。

帰無仮説H0:μx=μyH_0:μ_x = μ_y
対立仮説H1:μxμyH_1:μ_x ≠ μ_y

の検定を行うとすると、対応のある標本であるので、

di=xiyid_i = x_i -y_i

となる{di,i=1,...,n}\lbrace d_i,i=1,...,n\rbraceについて考えます。

よって、問題はddの母平均μdμ_dについての帰無仮説H0:μd=0H_0:μ_d = 01標本の検定と同じになります。

この帰無仮説のもとで、ddを標準化すると、

t=dˉσ^dn ~t(n1)t = \frac{\bar{d}}{\frac{\hat{σ}_d}{\sqrt{n}}} ~t(n-1)

となり、t値を求められます。

回帰分析の回帰係数に関するt検定

回帰分析を行うと、目的変数yyを、説明変数x1,...,xpx_1,...,x_pと回帰係数β0,...,βpβ_0,...,β_pと誤差項εεを用いて以下の式で表せます。

y=β0+β1x1+β2x2+,...,+βpxp+εy=β_0 + β_1x_1 + β_2x_2 +,...,+ β_px_p + ε

そして、yyの期待値E(y)E(y)は以下の式で表せます。

E(y)=β0+β1x1+β2x2+,...,+βpxpE(y) = β_0 + β_1x_1 + β_2x_2 +,...,+ β_px_p

このとき、それぞれの説明変数が目的変数を予測(説明)する上で役に立っているか、否かということについて強い関心が持たれます。

つまり、βi=0β_i = 0であるかによって、その説明変数が目的変数を予測するのに有効であるかの判断をすることになります。

帰無仮説H0:βi=0(i=1,...,p)H_0:β_i = 0 (i = 1,...,p)

の仮説検定を行い、帰無仮説が棄却されなかったβiβ_iを係数とするxix_iyyを予測する上で役に立たない、という判断をします。

このとき、回帰係数ββが正規分布に従うと仮定すると、t検定が行われることになります。

関連記事

仮説検定とは?初心者にもわかりやすく解説

Z検定とは?正規分布の母平均の検定手順を解説

t分布とは

片側t分布表と見方

カテゴリ: 仮説検定

関連サービス

講座一覧ページ

記事一覧はこちら

無料で統計学を学ぶ