適合度の検定 (ピアソンの 𝜒^2 適合度検定)
投稿日2016.11.4
更新日2017.7.21
理論上の確率分布から得られる期待度数 ( Expected frequency ) を求めることが前提となります.その期待度数を利用して観測値の度数 ( Observed frequency ) が適合するかどうか(当てはまりの良さ)を検定します.
帰無仮説の表現いろいろ
- 観測度数の割合は期待度数の割合に適合している.
- 各階級の発生確率は母集団の確率に適合する.
- データは想定した確率分布に従う.
k.ピアソンの適合度基準
𝜒^2 = Σ ( ( ( 観測度数 - 期待度数 )^2 ) / 期待度数 )
= sum ( ( Ok - Ek )^2 / Ek )
例)次のデータはメンデルの法則 1:2:1 の確率に適合しているか?
AA Aa aa n(合計)
観測度数 52 102 46 200
メンデルの法則(理論確率) 1/4 1/2 1/4
観測度数 <-c( 52 , 102 , 46 )
理論確率 <- c ( 1/4 , 1/2 , 1/4 )
期待度数 <- 期待確率 * sum ( 観測度数 )
50 100 50
AA Aa aa n(合計)
観測度数 52 102 46
期待度数 50 100 50
k.ピアソンの適合度基準
𝜒^2 = Σ ( ( ( 観測度数 - 期待度数 )^2 ) / 期待度数 )
=((52-50)^2/50)+((102-100)^2/100)+((46-50)^2/50)
=0.44
自由度
3-1=2
p値
pchisq ( 𝜒^2 , 自由度 , lower.tail = FALSE ) # r-de-r様からの助言により修正!
pchisq ( 0.44 , 2 , lower.tail = FALSE )
=0.8025188
lower.tail
logical; if TRUE (default), probabilities are P[X ≤ x] otherwise, P[X > x].
結果
p値=0.8025188となり帰無仮説は棄却されない
したがって、1:2:1の確率に適合していると言える
Rの関数で確認します
Ok< -c( 52 , 102 , 46 ) #観測度数
Pk < - c ( 1/4 , 1/2 , 1/4 ) #理論確率
chisq.test(Ok, p=Pk)
Chi-squared test for given probabilities
data: Ok
X-squared = 0.44, df = 2, p-value = 0.8025