理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

1標本t検定のまとめ

t検定のまとめ
投稿日2017.1.27
最終更新日2017.9.1

t検定のまとめを復習していきます
Rでは次のような関数を使用してt検定を実行します.

t.test(x, alternative = c("two.sided", "less", "greater"),mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95)

引数
alternative:両側検定("two.sided")か片側検定("less","greater")か
mu=0:母平均が0であるかどうかを検定する
paired=TRUE:対応のあるt検定
var.equa=TRUE:等分散を仮定する
conf.level:信頼区間

統計量
t=( 標本平均 - 母平均 )/ √( 不偏分散 / n ) 
=( 標本平均 - 母平均 )/ 標準誤差  
自由度n-1のt分布t(n-1)に従う

1標本問題(1つの母集団の母数に関する検定)
確率変数Xからのn個の標本x, μは母平均、S^2は不偏分散

例)次のデータを図で概観し,帰無仮説:母平均=160.0を有意水準5%で検定せよ

x <- c(153.0, 148.0, 161.0, 166.0, 160.0, 173.0, 173.0, 165.0, 153.0, 168.0, 171.0)
boxplot(x) #箱ひげ図
plot(x)    #散布図
#縦に散布
y <- c(rep("1", length(x)))
plot(x~y, ylim = c(145, 180), xlab = "", xaxt= "n")  #xaxt_x軸目盛り消去
#各図を横一列に並べて表示
par(mfrow = c(1, 3))
boxplot(x);plot(x);plot(x~y, ylim = c(145, 180), xlab = "", xaxt = "n") 
#作業終了後に
dev.off()

f:id:yoshida931:20170901124139j:plain:w550
t検定を実行

t.test(x)

One Sample t-test
data: x
t = 62.79, df = 10, p-value = 2.554e-14
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
157.0405 168.5959
sample estimates:
mean of x
162.8182

標本xの平均は162.82.95%信頼区間[157.04, 168.60]で「160.0」が含まれています.したがって帰無仮説は棄却できません.つまり、検定結果には5%の危険性(この結論が間違える危険性)があるのですが、標本xの母集団の平均が160であることが言えます.

対応のある2標本の場合
1標本問題と同じ原理です.治療前後の比較を考えてみましょう.
治療前のデータpre, 治療後のデータposとして治療の前後差を有意水準5%で検定せよ.

pre <- c(25, 27, 32, 37, 38, 39, 44, 45, 47, 48, 52, 54, 59, 60, 65, 65, 67, 68, 68)
pos <- c(41, 28, 32, 45, 40, 48, 44, 50, 53, 48, 60, 59, 60, 68, 66, 70, 66, 60, 65)

対応あるt検定は「前後差 = 0」つまり「 posの母平均 - preの母平均 = 0 」を帰無仮説とした1標本問題として分析します.2群の差の母平均が0になる確率が高ければ、2群の母平均には「差がない」という結論を得ます.

def <- pre - pos
t.test(def)

One Sample t-test

data: def
t = -2.7097, df = 18, p-value = 0.01435
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-5.8866381 -0.7449409
sample estimates:
mean of x -3.315789

95%信頼区間に「0」が含まれていません.また差の平均は-3.31となっています.有意水準0.05のt検定の結果は「有意差あり」ということになります.しかし、この平均-3.31(95%CI:-5.88~-0.74)という数値は検査内容により実質的な意味合いが異なります.最終的な判断は研究目的に応じてそれぞれの研究者が判断することになります.有意水準0.01のt検定を実行してみます.

def <- pre - pos
t.test(def, conf.level = 0.99)

One Sample t-test
data: def
t = -2.7097, df = 18, p-value = 0.01435
alternative hypothesis: true mean is not equal to 0
99 percent confidence interval:
-6.8380690 0.2064901
sample estimates:
mean of x -3.315789

有意差のみで結果を述べると、今度は「有意差あり」ということになります.αの設定は重要ですね.