理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

リスク比の信頼区間

ポイント:比の対数をとり、正規近似する

リスク比は疫学における指標の1つです.一般的には相対危険度(相対リスク,relative risk,RR)として利用されています.

xm <- matrix(c("a","b","c","d"), nrow=2, byrow=T)
name <- list("暴露"=c("あり(A群)","なし(B群)"),"疾病"=c("あり","なし"))
dimnames(xm)<-name
xm

            疾病
暴露         あり なし
  あり(A群)  "a"  "b" 
  なし(B群)  "c"  "d" 

前提
比は分母が小さくなると、数値が大きくなりすぎて正規近似の精度が悪くなります.比の対数であれば高い精度で正規近似することが可能になります. したがって、比の対数を考えていくことになります.

定義と言葉の整理

標本比率 \frac{a}{a+b}=p'A の母比率をPA

標本比率 \frac{c}{c+d}=p'B の母比率をPB

log\frac{a}{a+b}=log(p'A), log\frac{c}{c+d}=log(p'B)


リスク差(過剰絶対リスク) = p'A-p'B

リスク比 RR = \frac{p'A}{p'B} A群のB群における疾病の頻度の比

過剰リスク(過剰相対リスク) = \frac{p'A-p'B}{p'B} 

オッズ比=\frac{\frac{a}{b}}{\frac{c}{d}}


リスク比の信頼区間

比の対数を考えていきます.
標本のリスク比=標本リスク比( \frac{p'A}{p'B} =rr)、母集団のリスク比を母リスク比(\frac{PA}{PB} =RR)とします.

標本リスク比rrの対数 log\ rr、 母リスク比RRの対数 log RR

正規近似で信頼区間を求めていくためには、以下の式が必要になります.

Z = \frac{ log\ rr - logRR}{ log\ rr の標準誤差}

したがって、以下の式が95%信頼区間を求める式になります

log\ rr - 1.96(log\ rrの標準誤差) \leqq logRR \leqq  log\ rr + 1.96(log\ rrの標準誤差)

以下、log\ rrの標準誤差 = SE とします

log\ rr - 1.96SE \leqq logRR \leqq  log\ rr + 1.96SE

rr\times exp(-1.96\times SE) \leqq RR \leqq  rr\times exp(1.96\times SE)


log\ rrの分散

log\ rr=log\ a - log(a+b) - log\ c + log(c+d) より

V(log\ rr)=\frac{1}{a} - \frac{1}{a+b} + \frac{1}{c} - \frac{1}{c+d}  デルタ法(delta method)によって近似的に求めたもの

以下のページにしっかり記載があります。 www.yuzashiki.tokyo
(管理者よりお礼:ご指摘いただきありがとうございました。)

#Rで95%信頼区間を求めてみます
rr <- a*(c+d)/(a+b)/c      #  = (a/(a+b))/(c/(c+d)) 
exp(log(rr)+c(1, -1)*qnorm ( c(0.025,0.975) )*sqrt(b/a/(a+b)+d/c/(c+d)))

例)
クロス表イメージ
matrix(c(76, 399, 129, 332),2,byrow=T)
     [,1] [,2]
[1,]   76  399
[2,]  129  332

a<-76; b<-399; c<-129; d<-332 #参考web2より
( rr <-  a*(c+d)/(a+b)/c )    #リスク比
[1] 0.5717829
rr*exp(qnorm ( c(0.025,0.975) )*sqrt(b/a/(a+b)+d/c/(c+d)))
[1] 0.4440632 0.7362370


参考web1 R -- 相対危険度(対応のない場合)
参考web2 R による統計処理
参考文献)柳川 堯 ; 観察データの多変量解析―疫学データの因果分析,近代科学社 ,2016