理学療法士がまとめたノート

読者です 読者をやめる 読者になる 読者になる

統計学備忘録 since2016

Rを使用した統計学

異なる周期の三角関数の合成いろいろ

フーリエ変換の予備知識として色々な三角関数の合成を可視化しておきますあくまで準備段階ですので…弧度法を度数法に変換しますx<-pi/180y<-0:360x<-x*y sin(x)、sin(2x) の合成plot(sin(x)+sin(2*x),type="l",ylim = c(-2,2),ann = F)lines(sin(x),type="l"…

cos(nx)とsin(nx)の合成

グラフでイメージするa*cos(x)とb*sin(x)の合成ベクトル(振幅)は√(a^2+b^2)sun(nx)、cos(nx)を合成すると位相が変化するが、周期は変化なし 振幅 √(2^2+2^2)=2.828427 #sqrt(8)1周期plot(2*cos(y*x)+2*sin(y*x),type="l",ylim = c(-3,3),ann = F)lines(2*c…

三角関数のグラフ

角度の概念を復習します 弧度法ラジアン(弧度)とは、「弧の長さ=半径」となる角度を「1」とする角度の単位のこと。単位記号は「rad」R言語ではこの「弧度法」を使用しています. 度数法円周を360等分したものを1とする角度の単位のこと。単位記号は「°」 つ…

RでBland Altman Plotを描く

データ国際医療福祉大学 下井研究室信頼性の検討方法:相対信頼性と絶対信頼性例1(http://shimoi.iuhw.ac.jp/reliability_3_systematicbias.html)を使用させていただきましたx125.1 23.3 33.2 20.9 22.8 34.9 26.5 26.1 29.4 29.8 29.2 26.5 14.3 14.6 17.…

1標本t検定のスクリプト

只今練習中~2標本xとyについてsumxy <- function(x,y,sxy) { xs<-summary(x) ys<-summary(y) xt<-t.test(x) yt<-t.test(y) print(xs);print(ys);print(xt);print(yt)}sumxy (x,y,sxy)より x<-c( );y<-c( )にデータを入れると、各標本の要約・t値・p値・95%C…

繰り返し for

いつも忘れるので書いておこう#x=3に2を3回足す式#3+2+2+2=9 myf<-function(){ x<-3 for(i in 1:3){ x<-x+2} return(x)}myf() #Xに2を3回加える式#x+2+2+2#xに5を代入すると5+2+2+2=11 myf<-function(x){ a<-x for(i in 1:3){ a<-a+2} return(a)}myf(5) #Xに…

級内相関係数 ICC(1,1), ICC(1,k)

1人の検者により検査結果のばらつきを求める ICC(1,1) = ( (被験者間の平均平方-被験者内の平均平方)÷繰り返し数 ) ÷ ( ( (被験者間の平均平方-被験者内の平均平方)÷繰り返し数) - 被験者内の平均平方) 被験者=水準 被験者間の平均平方 =∑(被験者平…

二元配置分散分析 分散分析表の理解

データは仮想です 繰り返し数がすべて等しい場合 (=5) 因子B B1 B2 B3 因子A A1 7 9 21 11 11 22 8 10 19 10 9 18 9 11 22 A2 23 12 9 21 16 8 26 16 11 27 17 10 22 15 9 エクセルにペーストして、青文字のみをコピー Data<-c(x$B1,x$B2,x$B3)x<-read.table…

相関係数の区間推定

サンプル:日本統計学会 (編集); 日本統計学会公式認定 統計検定2級対応 統計学基礎, 東京図書, 2012,p125 身長のデータ大学生x<-c(172,167,184,175,176,175,170,180,170,179,167,175,174,162,165,163,170,169,165,175)父親y<-c(165,165,178,176,150,171,17…

なぜt検定を繰り返してはいけないのか?

sample は「石村卓夫;分散分析のはなし,東京図書,1992,p137」 A<-c(12,14,16)B<-c(13,15,17)C<-c(15,17,19)D<-c(17,19,21)x<-c(rep("A",3),rep("B",3),rep("C",3),rep("D",3))y<-c(A,B,C,D)stripchart(y~x,vertical=T) 視覚的にはAD間、BD間には差があるよう…

等分散性の検定

準備としてカイ二乗分布とF分布が必要になります カイ二乗分布確率変数Z1,Z2,…Znが互いに独立で標準正規分布にしたがうときW=Z1^2+Z2^2+…+Zn^2の従う分布を自由度nのカイ二乗分布とよび、χ^2(n)で表します.期待値E[W]=n, 分散V[E]=2n カイ二乗分布の性質① 二つの確…

一元配置分散分析 (対応なし) F値の算出方法

(2017.3.13更新) 赤文字の部分だけRにペーストして実行 一元配置分散分析とは、一つの因子に基づく“3つ以上の母平均の差の検定”です因子Factor:実験結果に影響を与えると考えられる要因水準Lebel:因子をいくつかに分ける基準 (水準=群) 例題)治療因子…

正規分布のグラフ

グラフ初歩の初歩 手探り状態でやってます 赤文字のみRで実行 正規分布#1正規分布の乱数を100個生成x<-rnorm(100)#ヒストグラム,freq=Fで確率密度,ylimでy軸範囲hist(x,freq=F,ylim=c(0,0.6))#枠の処理、lty線種は実践、btyで左と下のみbox(lty=1,bty = "l")…

回帰係数の区間推定

赤文字をRで実行 サンプル)統計学入門(基礎統計学),東京大学出版会,1991,p258 次のデータをコピーしてください東京 福岡1019.4 1018.41005.7 1007.61002 1006.21006.7 1009.91005.1 1010.81010.1 1013.21016.7 1016.21011 1009.1999.5 1003.11006.9 1012.51…

単回帰分析

赤文字のみRで実行 線形回帰分析説明変数と目的変数を直線関係で傾向を示す。説明変数と目的変数との関係を直線でモデル化する回帰分析。 非線形回帰分析非線形関係でモデル化する回帰分析。説明変数と目的変数を非直線的関係で傾向を示す。 ここでは単回帰…

t検定のまとめ

Rでは次の式を使用しますt.test(x, alternative=c("two.sided","less","greater"), mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95) 引数alternative:両側検定("two.sided")か片側検定("less","greater")かmu=0:母平均が0であるかどうかを検定…

Rで簡単(適合度検定)

例1)次のデータはメンデルの法則 1:2:1 の確率に適合しているか?AA Aa aa n52 102 46 200帰無仮説:標本はメンデルの法則に適合している 観測度数<-c(52,102,46)確率<-c(1/4,1/2,1/4) chisq.test(観測度数, p=確率) Chi-squared test for given probabilit…

Rで簡単(独立性の検定)

赤文字のみをRで実行 次のクロス表を検定してみます問)男性と女性で、yesの解答者数とnoの解答者数の比率に違いはあるか? Yes N0男性 n1 n2女性 n3 n4 帰無仮説:男性と女性では解答者数の比率に違いがない例)仮想データ n1<-15n2<-11n3<-4n4<-16 観測度…

二項分布のグラフ

村上 正康,安田 正実; 統計学演習, 培風館,1989,p51のグラフをRで作ってみますB(10,0.2),B(10,0.5),B(10,0.8)を重ねたグラフです赤文字のみRで実行してください (foo.bar@baz.com様よりコメントいただき修正しております。簡単で理解しやすい方法です。) t…

グラフに色をつける

library(RColorBrewer)#RColorBrewerパッケージのサンプルdisplay.brewer.all() ヒストグラムを塗ってみるどの色セットを使用するかを指定するcols <- brewer.pal(8,"Pastel1") # brewer.pal(何色、パレット名) y<-c(1,2,3,4,5,6,7)p<-c(2,3,4,5,4,3,2)q<-…

棒グラフの中央に散布図をプロットする方法 (pos.x)

y<-c(1,2,3,4,5,6,7)p<-c(2,3,4,5,4,3,2)q<-c(2,3,4,5,4,3,2)par(mar = c(5, 4, 1, 4)) #余白 底辺、左、上、右の順 pos.x <- barplot(q,ylim=c(0,6))points(pos.x, p)

Rことはじめ

1、Rのインストール方法と使い方 2、以下のデータの母平均の95%信頼区間を求めてみます 73.0 75.8 74.0 72.3 76.9 82.5 69.1 80.9 74.9 71.6 73.5 84.6 81.3 82.578.1 71.3 76.3 74.9 74.8 72.5 78.5 71.5 70.0 81.1 76.6 77.9 75.5 70.881.9 75.1 85.4 8…

級内相関係数 ICC(2,1), ICC(2,k)

(2017.3.2に更新) ICC (Intraclass correlation coefficients)ICCは信頼性の指標の一つとして利用されています.ICCには3つの分類があり、6Caseに分類されています. Shrout&Fleiss(1979) Bartko(1966) Case1 ICC(1,1) ICC(1,k) one-way classification Ca…

Rで簡単(t検定の検定力分析)

パッケージpwrを使用しますlibrary(pwr) pwr.t.test(n = , d = , sig.level = , power = , type = c("two.sample", "one.sample", "paired"))n=標本数d=効果量()sig.level=有意水準power=検定力type=t検定の形("two.sample=対応なし", "one.sample=1標本"…

Rで簡単(t検定:対応あり)

例えばn=14の前後比較・・・ 下のデータをコピーして 前 後 90 98 90 95 92 77 91 84 83 75 93 88 89 89 81 88 80 86 77 86 78 79 77 90 76 88 79 99 Rに貼り付け x<-read.table("clipboard",header=T) 対応のあるデータなので「差」を検定することになる …

時系列データの可視化01

下のデータをコピーして時系列グラフを作ってみます 心拍変動を三次元加速度を同時測定した結果です 被験者は私です RRI TEM X Y Z HF LFHF LF activity HR793 21.5 0.16 -1.09 -0.12 75.531 4.247 80.941 0.11 76800 21.5 0.16 -1.09 -0.12 75.436 4.078 80…

Rで簡単(二元配置分散分析:対応なし)

サンプルをコピペで2式を実行 方法は Rで簡単(一元配置分散分析:対応なし)を参照 検定は帰無仮説が大切です! 商品のの主効果:帰無仮説=カップ麺でもインスタント麺でも評価の母平均は等しい スープの主効果:帰無仮説=スープが違っても評価の母平均は…

Rで簡単(一元配置分散分析:対応あり)

方法は「Rで簡単(一元配置分散分析:対応なし)」と同じです 最下部の式が少し違うだけです サンプル 人 種類 得点野原 A 12野原 B 8野原 C 9風間 A 8風間 B 5風間 C 8桜田 A 12桜田 B 10桜田 C 10佐藤 A 6佐藤 B 2佐藤 C 3東溝 A 8東溝 B 5東溝 C 6 x<-rea…

Rで簡単(一元配置分散分析:対応なし)

サンプルをコピーして(エクセルからでもOK)、下の2式を実行するのみ サンプル 治療方法 点数A 15A 9A 18A 14A 18B 13B 8B 8B 12B 7C 10C 6C 11C 7C 12D 10D 7D 3D 5D 7 x<-read.table("clipboard",header=T) summary(aov(x$点数~x$治療方法)) 実際の方法を…

Rで簡単(重回帰分析)

Rのデータセットtrees を使用して説明します Girth=y , Height=x1 , Volume=x2 次のようにエクセルに準備します x<-read.table("clipboard",header=T) をコピーしてR Consoleにペーストします 分析したい一覧表をコピー(上記の表など) x<-read.table("clip…

Rで簡単(t検定:対応なし)

RをPCにインストール https://cran.ism.ac.jp/ 次のような操作を行うだけ簡単にt検定ができますので、是非挑戦してみてください。 難しいことはさておき、とにかくやってみることが大切です R Consoleに直接入力する方法を試しましょう! 例)結果1と結果2…

確率とパーセント点

正規分布の累積分布(確率) pnorm(1.959964,lower=F) #Z≧1.959964となる上側確率=0.025 pnorm(-1.959964) #Z≦-1.959964となる上側確率=0.025 正規分布の確率点(パーセント点) qnorm(0.025,lower=F) #上側確率が0.025となるZ値=1.959964 qnorm(0.025) #…

平均と分散

標本例x<-c(1,2,3,4) 標本平均(次の2式は同じ解になります)sum(x)/length(x)mean(x) 二乗平均sum(x^2)/length(x) 標本分散(3式とも同じ解になります)var(x)*(length(x)-1)/length(x)sum( (x-mean(x))^2)/length(x)sum(x^2)/length(x)-(mean(x))^2 標準誤差 …

適合度の検定

k.ピアソンの適合度基準χ2乗値=Σ(観測度数-期待度数)^2)/期待度数)帰無仮説:各階級の発生確率は母集団の確率に適合する 例)次のデータはメンデルの法則 1:2:1 の確率に適合しているか? AA Aa aa n観測度数 52 102 46 200期待度数 50 100 50 200 観測度数<…

独立性の検定

赤文字のみRで実行 =======================================次のクロス表を検定してみます問)男性と女性で、yesの解答者数とnoの解答者数の比率に違いはあるか? Yes N0男性 n1 n2女性 n3 n4============================================================…

一元配置分散分析

平方和の分解から分散分析を理解する よくみかける一元配置のデータを分解してみます 赤文字の部分だけRにペーストして実行 例)繰り返し数が5の場合治療後の満足度調査20名を無作為に分けて治療A,B,C,D後にVASで調査した治療=要因、A,B,C,D=水準(群) A …

効果判定せねば・・・

中心極限定理をグラフで理解する

#母集団の分布がどのような分布であっても、無作為抽出した標本における和の分布は、標本の大きさnが大きいときに正規分布に収束する。 #母集団の分布がどのような分布であっても、無作為抽出した標本における標本平均の分布は、標本の大きさnが大きいとき…

幹葉図、箱ひげ

# 箱ひげ、パーセンタイル説明のために偏ったデータを作成 x<-c( 5, 8, 11, 23, 33, 35, 41, 44, 44, 44, 44, 46, 47, 49, 50, 51, 52, 52, 52, 53, 55, 55, 55, 56, 56, 56, 58, 58, 58, 59, 59, 59, 60, 60, 60, 61, 61, 62, 63, 63, 64, 65, 65, 65, 65, …

このブログの参考・引用文献

文献:著者五十音順 巨人の肩に乗らねば・・・ 石田 基広 ;改訂3版 R言語逆引きハンドブック ,シーアンドアール研究所; 改訂3版,2016石田 基広 ;Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―,共立出版 ,2012石村卓夫;すぐわかる多変量解析,東京図書,…