理学療法士がまとめたノート

読者です 読者をやめる 読者になる 読者になる

統計学備忘録 since2016

Rを使用した統計学

なぜt検定を繰り返してはいけないのか?

sample は「石村卓夫;分散分析のはなし,東京図書,1992,p137」

A<-c(12,14,16)
B<-c(13,15,17)
C<-c(15,17,19)
D<-c(17,19,21)

x<-c(rep("A",3),rep("B",3),rep("C",3),rep("D",3))
y<-c(A,B,C,D)
stripchart(y~x,vertical=T)

f:id:yoshida931:20170224165734p:plain

視覚的にはAD間、BD間には差があるように見えます

 

重要な前提です
Aの母平均をμa
Bの母平均をμb
Cの母平均をμc
Dの母平均をμd とします
「μa=μb=μc=μd」を検定する場合にt検定を繰り返してはいけないのです.
ある特別なペアの違いなどを確認したい場合にはt検定を使用します.研究内容により異なるので間違いないように.

 

参考 http://www.gen-info.osaka-u.ac.jp/MEPHAS/ave.html
2種類の既存薬AとBを組み合わせた配合薬Cの配合効果を評価する場合.この場合、既存薬A,Bのそれぞれの効果と配合薬Cの効果を比較します.ここで いいたいのはCが既存薬A、Bの両方よりも効果があるということです.「CがAよ りも優れている、かつCがBよりも優れている」ということを 示します.つまり帰無仮説はC=AかつC=Bとなり、A=B=Cとは異なります.このような場合には2標本t検定を繰り返して用いるほうが適切だと考えられます.

 

一元配置分散分析
oneway.test(y~x,var.equal = T)
#F = 3.6875, num df = 3, denom df = 8, p-value = 0.06214
#有意水準5%で差が「ない」という結果になりました

 

#全ての群の母分散は等しいと仮定してt検定を繰り返してみます
AB<-t.test(A,B,paired=FALSE, var.equal=T, conf.level=0.95)
AC<-t.test(A,C,paired=FALSE, var.equal=T, conf.level=0.95)
AD<-t.test(A,D,paired=FALSE, var.equal=T, conf.level=0.95)
BC<-t.test(B,C,paired=FALSE, var.equal=T, conf.level=0.95)
BD<-t.test(B,D,paired=FALSE, var.equal=T, conf.level=0.95)
CD<-t.test(C,D,paired=FALSE, var.equal=T, conf.level=0.95)

 

#それぞれの検定結果のP値のみを取り出してみます
str(AB3);str(AC3);str(AD3);str(BC3);str(BD3);str(CD3)
AB 0.573
AC 0.14
AD 0.0376
BC 0.288
BD 0.0705
CD 0.288

 やはりAD間には有意水準5%で「差がある」という結果になりました.しかし分散分析では差がないという結果でした.

 

分散分析の帰無仮説
有意水準0.5において「μa=μb=μc=μd」と仮定する

t検定の帰無仮説
有意水準0.5において「μa=μb」、
かつ有意水準0.5において「μa =μc」、
かつ有意水準0.5において「μa =μd」、
かつ有意水準0.5において「μb=μc」、
かつ有意水準0.5において「μb=μd」、
かつ有意水準0.5において「μc¬=μd」と仮定した検定になります.

したがってt検定を使った「μa=μb=μc=μd」の確率は(1-0.05)^6となります.少なくとも一組には差がある確率は1-(1-0.05)^6=0.2649081となり、有意水準26.5%の検定になってしまいます。つまりαエラーの危険性が高くなるのです.このような矛盾を解消するための手法が多重比較です(しかし、本当にt検定は繰り返して使ってはいけないのだろうか? 本当に有意水準の高い検定になっているのだろうか? 2群間比較にはt検定しかないのだが…疑問が残ります)

多重比較(Tukey)を行ってみます

TukeyHSD(aov(y ~ x),ordered = TRUE)
Tukey multiple comparisons of means
95% family-wise confidence level
factor levels have been ordered

Fit: aov(formula = y ~ x)

$x
  diff  lwr    upr   p adj
B-A 1 -4.2294189 6.229419 0.9252929
C-A 3 -2.2294189 8.229419 0.3245304
D-A 5 -0.2294189 10.229419 0.0609499
C-B 2 -3.2294189 7.229419 0.6297636
D-B 4 -1.2294189 9.229419 0.1441838
D-C 2 -3.2294189 7.229419 0.6297636

有意水準0.05ではどのペアにも差はありませんでした.