シンプソンのパラドクス
最近、統計学の学習が進んでおりません
ちょっとお仕事が忙しくて…
今日は少しだけ勉強しておきます.
観察研究には重要な概念です.
x <- c(110,70,90,120) x <- matrix(x,2,2) rownames(x)<-c("治療A","治療B") colnames(x)<-c("改善","変化なし") addmargins(x) 改善 変化なし Sum 治療A 110 90 200 治療B 70 120 190 Sum 180 210 390
これだけ見て、「治療Aが良い!」と結論付けるのは早いのです.
患者さんの症状別にみた次の表を見てみましょう!
y <- c(3,10,40,93,17,31,42,20,90,29,8,7) dat <- array(y, dim = c(2,2,3)) name <- list("治療"=c("A","B"),"変化"=c("改善","変化なし"),"患者"=c("重度","中等度","軽度")) dimnames(dat)<-name dat , , 患者 = 重度 変化 治療 改善 変化なし A 3 40 B 10 93 , , 患者 = 中等度 変化 治療 改善 変化なし A 17 42 B 31 20 , , 患者 = 軽度 変化 治療 改善 変化なし A 90 8 B 29 7 #患者の重症度によって分類してみたら・・・必ずしも治療Aが良いとは言えません. #症状が重度、または中等度の患者さんには治療Aはあまり効果がないようです. #症状が中等度の患者さんには治療Bが効果的のようです. #観察研究では交絡因子の影響をブロックすることが重要になります.
今日は、久しぶりにRを操作しました.
上記のようなクロス表が作れたら、色々勉強できますよ!
医療関係者には最適な医療を提供してもらいたいですね!