イェーツの補正
イェーツの補正 / イェーツの連続修正(Yate's continuity correction)
離散型分布を連続型分布に近似させて統計的検定を行う際に使用する修正です.2×2分割表のデータに対して行われ、より正確な検定が可能になります.「連続的なカイ二乗分布(自由度1のχ二乗分布)」に近似するために、2×2分割表の中で観察される「二項分布型度数の離散型の確率」を補正します.各々の観測値と期待度数の差の絶対値より0.5を差し引くことによりカイ二乗検定の式を調整します.計算の結果得られるカイ二乗値を減らすことになりp値が増加することになります.
例)
x<-c(116,244)
y<-c(76,44)
xy<-data.frame(x,y)
期待度数
sum(x) * sum(116+76) / sum(xy)
sum(y) * sum(116+76) / sum(xy)
sum(x) * sum(244+44) / sum(xy)
sum(y) * sum(244+44) / sum(xy)
xe<- c( sum(x) * sum(116+76) / sum(xy) , sum(x) * sum(244+44) / sum(xy) )
ye<- c( sum(y) * sum(116+76) / sum(xy) , sum(y) * sum(244+44) / sum(xy) )
xye<-data.frame(xe,ye)
カイ二乗値
( 116 - xye[1,1] ) ^2 / xye [1,1] +
( 76 - xye [1,2] ) ^2 / xye [1,2] +
( 244 - xye [2,1] ) ^2 / xye [2,1] +
( 44 - xye [2,2] ) ^2 / xye [2,2]
= 35.01157
イエーツの補正 を実施したカイ二乗値
( abs ( 116 - xye[1,1] ) - 1 / 2 ) ^2 / xye[1,1] +
( abs ( 76 - xye[1,2] ) - 1 / 2 ) ^2 / xye[1,2] +
( abs ( 244 - xye[2,1] ) - 1/2 ) ^2 / xye[2,1] +
( abs ( 44 - xye[2,2] ) - 1/2 ) ^2 / xye[2,2]
= 35.01157
Rの関数で確認します
chisq.test(xy)
Pearson's Chi-squared test with Yates' continuity correction
data: xy
X-squared = 35.012, df = 1, p-value = 3.278e-09
サンプルは日本統計学会 (編集); 日本統計学会公式認定 統計検定2級対応 統計学基礎, 東京図書, 2012,p156の例7