ときわ台学/統計学/t分布とF分布の導出

	12　t分布とF分布
f-denshi.com 最終更新日：11/10/8 　現状，個人的なメモ程度なのでそのうち噛み砕いて書き直すつもり
サイト検索

１．ｔ分布の導出

［１］　確率変数　X₁，･･･，X_n　が独立に正規分布N(μ,σ)に従うとき，標本平均，

X~＝ X₁＋･･･＋X_n

n

は正規分布N(μ,σ²/n)に従い，変数変換によって，

Y~＝ X~－μ 　　　　・・・・[*]

σ/ n

は標準正規分布N(0,1)に従うことはすでに述べた[#]。

［２］　一方，標本平均と不偏分散，

X~＝ X_i

n

s²＝ (X_i－X~)²

n－1

は互いに独立であり，統計量 (n-1)s²/σ²　を考えると，これは自由度(n－1)のカイ二乗分布に従うのであった[#]。すなわち，

s² ～ χ²(n-1)

σ² n－1

である。

［３］　標本統計分析の分野では，Y~ が標準正規分布に従うことを利用して，母平均値μの推定を行うことが可能である[#]。しかし，実際の問題では[*]の分母にある母分散σの値も不明である場合が一般的である。そのような場合は標準正規分布を用いた推定を行うことはできない。その代わり，次のようにσを標本から計算可能な不偏分散sで代用することが行われる。

X~－μ ⇒ X~－μ ＝

X~－μ

σ/ n

＝ Y~ ←N(0,1)に従う

σ/ n

s/ n

s

σ

s²

σ²

←中身はχ²(n-1)/(n－1)に従う

この右辺の確率変数に従う分布を(ステューデントの) t分布と呼ぶ。この確率変数の分子はN(0,1)，分母は自由度(n-1)のカイ二乗分布をn-1で除したものであり，ｔ分布は一意的に定まることがわかる。

記号をn-1→nと改めて定義をもう一度書くと，

定義

標準正規分布N(0,1)に従う確率変数Yと自由度nのカイ二乗分布に従う確率変数Zから作られる確率変数Tを

　T＝Ｙ

Z/n

で定義する。ここで，YとZは互いに独立で，この確率変数Tの従う分布をt分布と呼ぶ。

この用語を用いれば，

統計量　 X~－μ₀ 　は自由度n-1のt分布に従う

s/√n

と述べることができる。

［３］　次にこのt-分布の確率密度関数を標準正規分布，カイ二乗分布の確率密度関数と関連付けよう。

そのためには，２重積分の変数変換(y,z)→(t,u) として[#]，

y＝t

u/n

　，　z＝u　　　　････[**]

を考えれば良い。変換前の確率変数T,すなわち，Y/(Z/n)^1/2 の従う確率密度関数をf_YZ(y,z))；-∞≦y≦∞，0≦z≦∞，変換後の確率密度関数を　f_TU(u,t)；-∞≦t≦∞，0≦u≦∞，とすると，各確率密度関数を対応する積分範囲で積分すると，それらは相等しい確率を与えなければならない。すなわち，

f_YZ(y,z)dydz＝ f_TU(t,u)dtdu

　　　　　　　＝ f_YZ(y(t,u),z(t,u))|J(y,z/t,u)|dtdu

を満足する。ここで，ｔ分布を考えるときに，確率変数Uについては制限がないので，uの全範囲についてf_TU(t,u)を積分してTの周辺確率密度関数，

f_T(t)＝ f_TU(t,u)du

を計算すれば，これが確率変数Tの従う確率密度関数となる。

［４］　そこで，ヤコビアンを計算すると，

｜J(y,z/t,u)｜＝

∂y

∂t

∂y

∂u

＝

u/n

t nu

2

＝

u/n

∂z

∂t

∂z

∂u

0 1

また，確率変数YとZが独立であることから，

f_YZ(y(t,u)z(t,u))＝f_Y(y(u,t))･f_Z(z(u,t))

との計算が許される[#]。ただし，f_Y(y)，f_Z(z)はそれぞれ標準正規分布とカイ二乗分布[#]の確率密度関数，

f_Y(y)≡ 1 exp －y²

2π

2

f_Z(z)＝ 1 z^n/2-1e^－z/2

2^n/2Γ(n/2)

である。[**]をこれに代入して，

f_TU(t,u)＝f_YZ(y(t,u),z(t,u))|J(y,z/t,u)|

　　　　＝ 1 ･ u^n/2-1e^-(t²/n^+1)u/2

u

2π 2^n/2Γ(n/2)

n

を得る。

［５］　次に周辺分布を求めるためにuについて，0≦u≦∞の範囲で積分を行うが，その際，変数の置き換え，

(t²/n＋1)u/2＝w　と　(t²/n＋1)du＝2dw　　を利用する。すなわち，

u^n/2-1

u

du ＝ 2w ^(n-1)/2 2 dw

(t²/n＋1) t²/n＋1

　　　　　　　　　　　　　＝2^(n+1)/2・ w^(n+1)/2－1 dw

(t²/n＋1)^(n+1)/2

であることに注意して計算する。すなわち，f_T(t)≡f(t)　は，

f(t)＝ f_TU(t,u)du

　＝ 2^(n+1)/2 w^(n+1)/2－1e^-wdw

2πn 2^n/2Γ(n/2)(t²/n＋1)^(n+1)/2

　＝ 1 w^(n+1)/2－1e^-wdw

nπ Γ(n/2)(t²/n＋1)^(n+1)/2

　＝ 1 ・Γ((n＋1)/2)

nπ Γ(n/2)(t²/n＋1)^(n+1)/2

で与えられる。最後のところでガンマ関数の定義[#]を用いた。さらに，ベータ関数，

B(p,q)＝ Γ(p)Γ(q) 　　　　　[ベータ関数]

Γ((p＋q)

Γ(1/2)＝ π

を用いると，

自由度ｎのｔ分布の確率密度関数

f(t)＝ Γ((n＋1)/2) t² ＋1 ^-(n+1)/2

nπ Γ(n/2)

n

　　＝ 1 t² ＋1 ^-(n+1)/2

n B(n/2,1/2)

n

とまとめることができる。

［６］

t分布の確率密度関数と標準正規分布N(0,1)との比較　↓

自由度１のとき，コーシー分布という。ｔ分布は，ｎ→∞でN(1,0)に一致する。

２．　F-分布の導出

［１］　確率変数 Z₁，Z₂ がそれぞれ自由度n₁，n₂のカイ二乗分布に従うとき，確率変数，

Y＝ Z₁/n₁

Z₂/n₂

の従う分布を自由度(n₁,n₂)のF分布という。これは，

s² ～ χ²(n-1)

σ² n－1

の関係を思い出せば，２つの標本値から推定される分散(または標準偏差)どおしの比較に有用となることがわかるであろう。詳しいことは「第２部：統計分析」で説明する。ここでは具体的な分布関数の導出だけ行う。

［２］　t分布で行ったように確率変数の変換，(Z₁,Z₂)→(Z,Y)を考える。ここで，確率変数Z₁，Z₂の従う確率密度分布を

f₁(z₁)，f₂(z₂)，　0≦z₁≦∞，0≦z₂≦∞

とする。Yの従う確率密度関数を

f₁₂(z₁,z₂)

として，確率密度関数の積分変数の変換 (z₁,z₂)→(z,y)，

z₁＝yz/n₂　　　
z₂＝z/n₁　　　←後々の都合を考えてこのようにおく。

を考える。t分布の導出と同様に考えて，変数変換後の確率密度関数をf_ZY(z,y)とすると，

f₁₂(z₁,z₂)dz₁dz₂＝ f_ZY(z,y)dzdy

　　　　　　　＝ f₁₂(z₁(z,y),z₂(z,y))|J(z₁,z₂/z,y)|dzdy

ヤコビアンを計算すると，

　｜J((z₁,z₂/z,y)｜＝

∂z₁

∂z

∂z₁

∂y

＝ y/n₂ z/n₂ ＝

z

n₁n₂

∂z₂

∂z

∂z₂

∂y

1/n₁ 0

［３］　したがって，Z₁とZ₂が独立な確率変数であることに注意して，

f_ZY(z,y)＝f₁(z₁(z,y))･f₂(z₂(z,y))･|J|

＝	1	z₁^n₁/2-1e^－z₁/2　×	1	z₂^n₂/2-1e^－z₂/2 ×	z

	2^n₁/2Γ(n₁/2)		2^n₂/2Γ(n₂/2)		n₁n₂

＝	y^n₁/2-1	･ z^(n₁^+n₂)/2-1e^{－(1/n₁+y/n₂)z/2}

	2^{(n₁+n₂)/2} n₁^n₂/2 n₂^n₁/2 Γ(n₁/2)Γ(n₂/2)

周辺分布関数として，

f(y)＝		f_ZY(z,y)dz

＝	y^n₁/2-1	z^{(n₁+n₂)/2-1}e^{－(1/n₁+y/n₂)z/2}dz

	2^{(n₁+n₂)/2} n₁^n₂/2 n₂^n₁/2 Γ(n₁/2)Γ(n₂/2)

　　　　　　↓　(1/n₁+y/n₂)z/2＝w　と積分変数を置き換えて，

＝	y^n₁/2-1	･	2^{(n₁+n₂)/2}	･	w^{(n₁+n₂)/2-1}e^－wdw

	2^{(n₁+n₂)/2} n₁^n₂/2 n₂^n₁/2 Γ(n₁/2)Γ(n₂/2)		(1/n₁+y/n₂)^{(n₁+n₂)/2}

＝	n₁^n₁/2 n₂^n₂/2	･	y^n₁/2-1	Γ((n₁＋n₂)/2)

	Γ(n₁/2)Γ(n₂/2)		(n₂+yn₁)^{(n₁+n₂)/2}

　　

変数記号y→xと代えて，

F分布の確率密度関数

f(x)＝ n₁^n₁/2 n₂^n₂/2Γ((n₁＋n₂)/2) ･ x^n₁/2-1

Γ(n₁/2)Γ(n₂/2) (xn₁＋n₂)^{(n₁+n₂)/2}

　　　＝ n₁^n₁/2 n₂^n₂/2 ･ x^(n₁-2)/2

B(n₁/2,n₂/2) (n₁x＋n₂)^{(n₁+n₂)/2}

F分布はフィッシャー(Fisher)分布とも呼ばれる。

F分布の確率密度関数

［目次］

＝2^(n+1)/2・	w^(n+1)/2－1	dw

	(t²/n＋1)^(n+1)/2

B(p,q)＝	Γ(p)Γ(q)	[ベータ関数]

	Γ((p＋q)

１．ｔ分布の導出

２． F-分布の導出

２．　F-分布の導出