対応のないｔ検定の検定力分析（事後の分析） - 統計学備忘録（R言語のメモ）

検定力(1-β)：帰無仮説が「偽」であるとき（母集団に差があるとき）にサンプルから有意差を得る確率
効果量(effect size)：標準化された平均値差(検定により色々あります...d family, r family)
標本数：研究者が決定しなければならない
α(有意水準)：慣例的に5％、1％で固定されている

検定力分析を実行する場合に、効果量の問題を解決しなければなりません．効果量を表す指標は数多く存在するので、まずどれを使うかが問題となります．今回はt検定の検定力分析に利用されている、次の二つの効果量について勉強していきます．

効果量＝効果の大きさ
実験的操作の効果、変数間の関係性の強さを表す指標(大　中　小)

Cohoen's d : グループごとの平均値の差を標準化したd family
r : 変数間の関係の強さを示すr family

効果量の目安
小中大
d 0.2 0.5 0.8
r 0.1 0.3 0.5

まずは記号の定義・・・これ大事
母平均μx, 標本x, サイズm, 標本平均xa, 不偏分散 $Sx^2$
母平均μy, 標本y, サイズn, 標本平均ya, 不偏分散 $Sy^2$

標本効果量(cohensのd効果量)の求め方
d ＝ｘの平均値とｙの平均値の差の絶対値÷2群の共通の標準偏差
プールした分散
$S^2=\frac{\sum(x-xa)^2+\sum(y-ya)^2}{m+n-2}=\frac{(m-1)Sx^2+(n-1)Sy^2}{m+n-2}$

例
x <- c(39, 47, 48, 59, 65, 68, 74, 79, 80, 82, 87, 88, 89, 94, 99)
y <- c(25, 27, 32, 37, 38, 44, 45, 52, 54, 60, 65, 67, 68, 69, 71)
pool <- ((length(x) - 1) * var(x) + (length(y) - 1) * var(y)) / (length(x) + length(y) - 2)
t <- (mean(x) - mean(y)) / sqrt((pool / length(x)) + (pool / length(y)))
= 3.6449

d <- (abs(mean(x) - mean(y)))/pool
=1.33 (dは1を超える場合もある)

2標本平均の差の検定 - 統計学備忘録 since2016

Rを使ってt値から算出してみます

t.test(x,t,var.equal = T)
d = t*sqrt((length(x)+length(y))/length(x)*length(y))
  = 3.6449*sqrt(30/(15*15))
  = 1.33

Rを使って検定力を算出します

library(pwr)
pwr.t2n.test(n1=15,n2=15, d =1.33 , sig.level =0.05 , power = NULL,alternative = "greater")

t test power calculation
n1 = 15
n2 = 15
d = 1.33
sig.level = 0.05
power = 0.971769
alternative = greater

power = 0.97より、帰無仮説が偽の場合に有意差が検出される確率は97％です．高い検定力であると言えます．

標本効果量(r)の求め方
$r= \sqrt{\frac{t^2}{t^2+自由度}}$

t.test(x,y,var.equal = T)
t = 3.6449
r <- sqrt(t^2/(t^2+18))
=0.6516516

効果量は「大」でした

参考）水本篤; 竹内理. 研究論文における効果量の報告のために―基本的概念と注意点―. 2008.