理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

回帰係数の区間推定

赤文字をRで実行

 

サンプル)統計学入門(基礎統計学),東京大学出版会,1991,p258

次のデータをコピーしてください
東京 福岡
1019.4 1018.4
1005.7 1007.6
1002 1006.2
1006.7 1009.9
1005.1 1010.8
1010.1 1013.2
1016.7 1016.2
1011 1009.1
999.5 1003.1
1006.9 1012.5
1001.9 1006.4
1007.5 1006.3
1014.4 1012.2
1014.3 1015
1014.6 1017.4
1009 1016.5
1006.7 1012.1
1009.4 1008.7
1011.8 1009.2
1009.4 1009.2

x<-read.table("clipboard",header=T)

 

回帰分析
lm(x$東京~x$福岡)

 

Call:
lm(formula = x$東京 ~ x$福岡)

Coefficients:
(Intercept)       x$福岡 
    16.0876       0.9822 

標本回帰方程式
Y=16.09+0.98X

 

 

定義
yi   実測値   x$東京
xi   実測値   x$福岡
B 回帰係数(最小二乗法より) この信頼区間を求める
β 回帰係数の不偏推定量 
ei 誤差項
Ei   (回帰)残差
Txx    xの偏差平方和      ∑(xi-xi平均値)^2
Txy xyの偏差平方和    ∑(yi-yi平均値)(xi-xi平均値)
Tyy    yの偏差平方和      ∑(yi-yi平均値)^2
σ二乗 誤差の分散
s二乗    誤差の分散の不偏推定量

 


回帰残差
母回帰方程式 yi=α+βxi+Ei  Ei~(0,σ二乗)  (i=1,2,...,n)
回帰残差Ei=yi-α-βxi
Ei<-(x$東京-16.09-0.9822*x$福岡)

 

誤差の分散の不偏推定量
回帰残差の平方和を(n-2)で割ることで回帰方程式の当てはまりの良さがわかります
s二乗<-(sum(Ei^2))/(n-2)
s二乗<-(sum(Ei^2))/18

 

推定値の標準誤差
s<-sqrt(s二乗)

 

ほとんどのeiは0±2sの中に入入ります
残差の散布図で確認(言訳;グラフは初心者です)
plot(ei,type="p",ylim=c(-6,6))
abline(h=s, col='black' ,lty="twodash")
abline(h=-s, col='black' ,lty="twodash")
abline(h=2*s, col='black' ,lty="dashed")
abline(h=-2*s, col='black',lty="dashed")


graphics.off()

偏回帰係数の標本分布
σは未知なのでsに置き換えます
Z=(β-B)÷σ/√Txx ~N(0,σ二乗)
t=(β-B)÷s/√Txx ~t(n-2)

 

Bの信頼区間
β-t×s/√Txx ≦ B ≦ β+t×s/√Txx
Txx<-sum( (x$福岡-mean(x$福岡) )^2)
0.98-2.101*s/sqrt(Txx)
0.6189584
0.98+2.101*s/sqrt(Txx)
1.341042
     0.62 ≦ B ≦ 1.34

 

 

Rの関数で確認します
confint(lm(x$東京~x$福岡),level=0.95)

              
(Intercept) -348.9125481 381.087689
x$福岡         0.6211872   1.343239