理学療法士がまとめたノート

統計学備忘録(R言語のメモ)

since2016 ときどきTEXのメモ

分散分析(繰り返し vs 反復)

登校日:2017.11.06, 更新日:2020.08.12

「繰り返し」と「反復」は区別なく混同して使用される場合もあります.要点のみ記載しておきます。

繰り返し

実験内容としては「水準の設定を最初から施して既定のサンプル数を繰り返してとる」ことになります. 「繰り返し」とは、同じ実験を繰り返すことを意味しています.実験Aを被験5名 に実施する場合、5回「繰り返す」ことになります。

一元配置分散分析の例
検査A、検査B、検査Cに被験者4名を無作為に割り当て、3回(検査A, 検査B, 検査C)の検査結果に差があるかを検定する。 この例では、N=12、繰り返し数=4回(3回ではないことに注意)。

No <- c(1:4)
検査A <- c(44.8, 55.3, 55.4, 38.4)
検査B <- c(50.8, 52.1, 62.2, 65.1)
検査C <- c(35.7, 31.8, 43.0, 31.2)
x <- data.frame(No, 検査A, 検査B, 検査C)

x <- read.table("clipboard", header=T)
#long形式に変換
library(tidyr)
df <- x %>% gather(test, data, -No) 
stripchart(data~test, data=df, vertical = T, method="jitter", pch=16, xlim=c(0.5,3.5))

f:id:yoshida931:20200812175921p:plain:w350

反復

反復繰り返しが混同されて使われている場合も多いので注意が必要です。ここでは対応のある測定方法を反復と呼びます。

例)1症例における漸増運動負荷試験による血圧の変化

data <- c(126, 147, 159, 165)
plot(data, type="b", xaxt="n", xlim=c(0.5,4.5), ylim=c(120, 170), xlab="", ylab="")
name<-c("運動前","20W","40W","60W")
axis(side=1,at=c(1:4),labels=name) 

f:id:yoshida931:20200812182256p:plain:w400

二元配置分散分析 vs 反復測定分散分析(repeated ANOVA)

例)4名の学生を対象とした実験。実習1ヶ月前、実習直前、実習直後の唾液アミラーゼ値に差があるか調べました。この場合、要因を「個人差」と「実験時期」の2つとして考えて二元配置分散分析を適応するのは不適切です。分散分析は無作為独立標本が大前提となっています。この例ではデータ同士が対応して関連性があるため、球面性の検定結果が有意であれば分散共分散構造を考慮した反復測定分散分析で解析すべきです。 この例ではN=3、反復回数5回となります。球面性検定でp値<0.05のときにはイプシロン修正で対応し、p値<0.0001の場合には分散分析を多変量に拡張した多変量分散分析(MANOVA:multivariate analysis of variance)で対応します(統計学入門−第18章)。

No <- c(1:4)
実習1ヶ月前 <- c(44.8, 58.4, 55.3, 38.4)
実習直前 <- c(50.8, 52.1, 62.2, 65.1)
実習直後 <- c(9.7, 31.8, 43.0, 22.2)
x <- data.frame(No, 実習1ヶ月前, 実習直前, 実習直後)

df <- x %>% gather(time, outcome, -No)
with(df,{ x1  = factor(time, levels=c("実習1ヶ月前", "実習直前", "実習直後")) #並び替え
interaction.plot( x1, No, outcome, col=1:3, xlab="", ylab="", legend=F, lwd=2.5)})

f:id:yoshida931:20200812173039p:plain

おまけ(乱塊法 Random Block method
Fisherの3原則を満たす実験方法

# 無作為抽出した繰り返し数3回(検査α、β、γ)の例
# 1日目=被験者1,2,3、2日目=被験者4,5,6、3日目=被験者7,8,9

検査α 被験者6→被験者8→被験者9
検査β 被験者4→被験者1→被験者2
検査γ 被験者5→被験者3→被験者7

# 次のように書き換えると偏りが見えてきます
# 次に1日に3名実施して場合、1日を1ブロック(同じ条件で実験できる1領域)としたら・・・
# 偏りのある採取方法になっています

検査順序
1日目(β → β → γ)
2日目(β → γ → α)
3日目(γ → α → α)

# 検査日による偏りを解消
1日目 (α → β → γ)
2日目 (β → γ → α)
3日目 (β → α → γ)

     1日目 2日目 3日目
      α   β   β
検査要因  β   γ   α
      γ   α   γ
#「時期」をブロックとした分散分析(繰り返しなし)・・・方法は二元配置分散分析

無作為に抽出されたサンプルに対して、制御因子(再現性あり)ブロック因子(再現性なし)の2因子を用いる特殊な分散分析が乱塊法と呼ばれています.検査項目が制御因子、時期(1日目、2日目、3日目)がブロック因子となります.

対応のある、対応のない

繰り返しがある場合には、別々の被験者からのデータ収集になるため「対応がない」と表現されています.また繰り返しがない場合には、上述の例のように被験者AのA1、A2、A3、A4は同一被験者のデータになるので、「対応がある」という表現が使用されているようです.

まとめ

結局色々な表現方法があるので、データ間の独立性やブロックなどを理解した上で、研究目的と実験方法に適応した解析をしなければなりません。