理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

平均と分散

標本例
x<-c(1,2,3,4)

 

標本平均(次の2式は同じ解になります)
sum(x)/length(x)
mean(x)

 

二乗平均
sum(x^2)/length(x)

 

標本分散(3式とも同じ解になります)
var(x)*(length(x)-1)/length(x)
sum( (x-mean(x))^2)/length(x)
sum(x^2)/length(x)-(mean(x))^2

 

標準誤差 = sqrt(標本分散÷サンプル数)
上記の公式に従い関数varianceを定義します
variance <- function(x){
var(x)*(length(x)-1)/length(x)}
標準誤差を求めます
sqrt( (variance(x))/length(x))

 

標本平均の分散(母分散σ^2の場合)
mean(x)=(1/n)Σ(X)
V[mean(x)]=(1/n)^2・ΣV(X) =(1/n)^2・n・σ^2 =σ^2 /n))

 

標本標準偏差
sqrt(variance(x)) 

 

不偏分散(2式は同じ解)
sum( (x-sum(x)/length(x))^2)/(length(x)-1)  # ÷(n-1)
var(x)  

 

証明:高校数学より
分散={(1-平均)^2+(2-平均)^2+(3-平均)^2+(4-平均)}/4
これを地道に分解したら
=(1^2+2^2+3^2+4^2)/4 - 平均^2 になる!

 

#標本が確率変数の場合には

# たとえば正確なサイコロの場合

x<-c(1,2,3,4,5,6)

# その期待値は…E[X]

(1/6)*sum(x)

# 分散は・・・E[X^2]-(E[X])^2

(1/6)*sum(x^2)-( (1/6)*sum(x))^2

 

#次のようなサイコロがあったら

#1の目が3つ、2の目が2つ、3の目が1つ

x<-c(1,1,2,2,2,3)

平均=E(x)=1*(1/1)+2*(1/3)+3*(1/6)=5/3

分散=V(X)=1^2*(1/1)+2^2*(1/3)+3^2*(1/6)-(5/3)^2=5/9