理学療法士がまとめたノート

読者です 読者をやめる 読者になる 読者になる

統計学備忘録 since2016

Rを使用した統計学

Rで簡単(独立性の検定)

赤文字のみをRで実行

次のクロス表を検定してみます
問)男性と女性で、yesの解答者数とnoの解答者数の比率に違いはあるか?

   Yes N0
男性 n1 n2
女性 n3 n4

帰無仮説:男性と女性では解答者数の比率に違いがない

例)仮想データ

n1<-15
n2<-11
n3<-4
n4<-16

観測度数を行列で作成して解いてみます
(x<-matrix(c(n1,n2,n3,n4),nrow=2,ncol=2, byrow=T))

カイ二乗検定
chisq.test(x, correct=F)

Pearson's Chi-squared test

data: x
X-squared = 6.6244, df = 1, p-value = 0.01006

結果:帰無仮説は有意水準5%で棄却され、男女間での解答の比率に違いが認められた。

全セル数の20%以上で期待値が5未満の場合には次のいずれかの補正を実施
Yates(イェ-ツ)補正
chisq.test(x)
フィッシャーの正確確率検定
fisher.test(x)


カイ二乗検定の結果を代入する
RES <- chisq.test(x)

期待値
RES$expected

[,1] [,2]
[1,] 10.73913 15.26087
[2,] 8.26087 11.73913

標準化残差(残差÷√期待値)
RES$residuals

[,1] [,2]
[1,] 1.300211 -1.090708
[2,] -1.482468 1.243599

調整済み(標準化)残差
RES$stdres

[,1] [,2]
[1,] 2.573799 -2.573799
[2,] -2.573799 2.573799

ファイ係数
(φ<-(n1*n4-n2*n3)/sqrt(sum(x[1,])*sum(x[2,]) *sum(x[,1])*sum(x[,2])))

 0.379486

結果:男性はYES、女性はNOと解答するという正の連関を認めた。

連関係数<|0.2| 連関はほとんどない
|0.2|≦連関係数<|0.4| やや連関がある
|0.4|≦連関係数<|0.7| 強い連関がある
|0.7|≦連関係数 かなり強い連関がある
   対馬栄輝; よくわかる医療統計 -「なぜ?」にこたえる道しるべ, 東京図書, 2015