理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

CSVファイルの取り込み

職場と自宅の2台のPCを使用していると仮定します MY_DIR <- "C:\\Users\\職場\\Documents\\職場のフォルダ" MY_DIR <- "C:\\Users\\自宅\\Documents\\自宅のフォルダ" それぞれのPCのパスを記載して、いつでもどこでも書けるように、 USBやクラウドなどに保…

subset関数で層別化したデータセット

以下のようなデータセットを男女で層別したセットに変更します id 年齢 性 身長 1 39 女 162.6 2 39 女 161.4 3 41 男 174.1 4 41 女 154.7 5 42 男 184.7 6 43 男 169.3 7 43 男 163.2 8 43 男 164.4 9 44 男 167.8 10 44 男 168.5 11 44 女 154.8 12 45 男…

データフレームの列を入れ替えて、欠損値のある行を除外する

忘れないうちに書いときます 欠損値のあるデータセットを用意します x <- LETTERS[1:10] y <- c(1,2,NA,2,4,NA,5,1,2,5) z <- c(1,2,2,1,1,2,2,1,1,1) xyz <- data.frame(x,y,z) x y z 1 A 1 1 2 B 2 2 3 C NA 2 4 D 2 1 5 E 4 1 6 F NA 2 7 G 5 2 8 H 1 1 9…

コピーした1行のデータをベクトルに変換

以下のようなデータをコピーしてRのベクトルに変換する方法です 10 12 14 15 18 まず以下のように入力します x = scan() するとコンソールに次のように表示されます > x = scan() 1: この1: の横に10 12 14 15 18をペーストして、enterを2回 > x = scan()…

対応のある一元配置分散分析、多重比較

ID 1回目 2回目 3回目 1 93 109 124 2 119 136 132 3 115 121 118 4 113 161 122 5 123 125 111 6 116 102 115 7 104 115 127 8 113 126 113 9 111 124 132 10 115 93 138 11 89 105 123 12 100 146 137 13 126 110 127 14 138 100 132 15 92 134 124 16 104…

ダミー変数の作成 makedummies

下のようなカテゴリカルデータをダミー変数に変更します treat outcome NO NO NO YES YES NO NO YES YES YES YES YES NO YES YES NO NO NO NO YES NO NO NO NO YES YES YES YES YES NO YES NO NO NO NO NO YES YES NO NO YES NO YES NO YES YES NO YES NO YE…

正規分布の色塗り

plot(dnorm, -4, 4, xaxt="n") xvals <- seq(-4, -1.96, length=10) # -4以上-1.33以下 領域をx軸方向に10個の多角形(台形)に等分割 dvals <- dnorm(xvals) # 対応するグラフの高さ polygon(c(xvals,rev(xvals)), c(rep(0,10),rev(dvals)),col=5) # 塗りつぶ…

ヒストグラムのビン調整

head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa 変数Speciesがsetosa…

ノンパラメトリック 相関係数

[,1] [,2] [,3] [1,] 27 14 5 [2,] 10 17 26 [3,] 5 12 50 上記の分割表から行の順序スコアと列の順序スコアを算出してデータセットを作成します #RANK xr1 <- c(rep(23.5,46),rep(73,53),rep(133,67)) xc1 <- c(rep(21.5,27),rep(64,14),rep(125,5),rep(21.…

Rで作る分割表

次のデータを分割表にして解析してみます まずはコピーして 筋トレ 歩行練習 効果 あり あり 有効 あり あり 有効 あり あり 有効 あり あり 有効 あり あり 有効 あり あり 有効 あり あり 有効 あり あり 有効 あり あり 有効 あり なし 有効 あり なし 有…

Rstudioの小ネタ (パッケージやファイルの保存方法)

Rstudioを閉じても、PC再起動してもファイルの読み込みやインストールしたパッケージは残せます (ただしパッケージは休んでいますので、起動するときにはlibraryで起こしましょう) データ処理する前に必ず行う作業は以下の通りです まずRstudioを起動さ…

Rで簡単 多重ロジスティック回帰分析

サンプルはRのmtcarsを使用します.車に詳しくないので回帰分析に相応しいサンプルか分かりませんが、学習のため数値のみ使用させていただきます. サンプルから直接取り込み dat <- mtcars[,c(8,2,5,6)] #ここがポイント8列目を応答変数として、2列目・5列目…

ロジスティック回帰分析(説明変数が単一かつ連続の場合)

投稿日:2018.2.13 最終更新日:2018.5.17 ロジット関数とロジスティック関数 準備として関数の特徴を押さえておきます ロジット関数 (標準)ロジスティック関数ロジット関数の逆関数= mathwords.net サンプルirisより 品種"virginica=1"、"別の品種=0"という…

相関係数のイメージ

パッケージmvtnormを使用して相関係数0.0, 0.2, 0.5, 0.7, 0.8, 0.9のグラフを作成してみます install.packages("mvtnorm") library(mvtnorm) 共分散行列.分散を全て1に設定しているので共分散=相関係数となります. sigma00 <- matrix(c(1,0,0,1), ncol=…

変数の呼称について(目的変数と説明変数)

それぞれの研究界のご意見はあると思うのですが・・・ ややこしや 目的変数 は以下のように呼ばれています 目的変数 objective variable 応答変数 response variable 反応変数 reaction variable(response variable ) 結果変数 outcome variable 従属変数 …

2変量の正規分布をグラフでイメージ(persp)

また、ここで勉強させていただきました. http://cse.naro.affrc.go.jp/minaka/R/R-binormal.html 忘れないように要点のみ転記させていただます.まさに備忘録. 今回はRの関数perspを使用して、密度関数の数式から3Dのグラフを描いてみます 確率変数x1…

2変量の正規分布をグラフでイメージ(scatterplot3d)

ここで勉強させていただきました. http://cse.naro.affrc.go.jp/minaka/R/R-binormal.html 忘れないように要点のみ転記させていただます. 必要なパッケージをインストールします install.packages("mvtnorm") library(mvtnorm) install.packages("scatterp…

Fisherの直接法

投稿日:2017-10-25、最終更新日:2018-05-02 Fisherの正確確率検定やFisherの直接確率検定、他にFisherの正確検定などと呼ばれています(統一してくれれば良いのにといつも思います).もともとカイ二乗検定は近似法でP値を求めています.一つのセルに度数が4以…

逆関数のグラフ

の逆関数は y <- function(x){ x } y1 <- function(x){ 2*x-2 } y2 <- function(x){ (x+2)/2 } plot(y,xlim = c(-2,4),ylim=c(-2,4),col=2,ann=FALSE, axes=FALSE) #ann軸ラベル axes軸 par(new=T) plot(y1,xlim = c(-2,4),ylim=c(-2,4),ann=FALSE, axes=FAL…

分散共分散行列 相関のあるサンプル作成

データセットから分散共分散行列を求めてみます x1 <- c(151, 164, 146, 158) x2 <- c(48, 53, 45, 61) x3 <- c(8, 11, 8, 9) data <- data.frame(x1,x2,x3) #分散共分散行列 var(data) x1 x2 x3 x1 62.25000 38.250000 10.333333 x2 38.25000 48.916667 4.3…

正規分布の重ね描き

text関数でグラフに文字の挿入 curve(dnorm(x, -2, 4), from=-10, to=10, ylim=c(0,0.4),ylab ="") text(-5, 0.1, "N(-2,4)") par(new=T) curve(dnorm(x,3, 1), from=-10, to=10, ylim=c(0,0.4),ylab ="") text(1.5, 0.3, "N(3,1)") par(new=T) curve(dnorm(…

データ取り込みと保存

クリップボードから一覧表の形式に取り込み エクセルなどの一覧表から必要な部分をコピーします. その後、いかのような操作でRに取り込むことができます. #x のなかに一覧表として取り込みます x <- read.table("clipboard",header = T) #xを確認すると I…

ベータ分布

完全独習 ベイズ統計学入門作者: 小島寛之出版社/メーカー: ダイヤモンド社発売日: 2015/11/20メディア: 単行本(ソフトカバー)この商品を含むブログ (6件) を見る この本を参考にベータ分布を勉強します. ベータ分布:ベータ関数により導かれる分布. ベイ…

カッパ係数

個人的によく利用させていただいております以下のHPをもとに、今回はカッパ係数について少し勉強してみます 統計学入門−第5章 まずはHPに掲載してある次のサンプルデータを使用して、Rを使って処理してみます 分類数が2つの場合 rater01<-c(rep(1,40),rep(2,…

データフレームからの抽出 2

準備 下のデータをコピーして、Rでフレームにします 実験A 10 6 10 9 10 実験B 10 5 5 12 4 実験C 5 4 11 4 6 実験D 9 5 2 3 1 コピーして、データフレームに取り込み (x <- read.table("clipboard",row.names = 1)) V2 V3 V4 V5 V6 実験A 10 6 10 9 10 実験…

分散分析の基本

最終更新日:2018.3.5 まだ理解できていない.なので書き直し・・・ 一元配置分散分析 言葉の整理 要因(factor), 因子(factor):実験結果に影響を与える要素.それぞれの分野で使い分ける場合もあるので注意.このブログでは要因と因子の区別をせず「要因」で統…

共分散構造分析(パス図の描き方)

Rを使ったパス図作成の方法を忘れないうちに簡単に書いておきます 青木先生のデータを借用しまして勉強していきます. R -- 因子分析(factanal を援用する) dat <- matrix(c( -1.89, -0.02, 0.42, 1.23, -1.53, 0.06, 1.81, -0.59, -0.75, -0.12, 2.58, -0…

信頼区間のプロット

同じサイズのデータサンプルからt分布を利用した信頼区間の作図 まずは3×4の場合(サンプルサイズ3を4回実施する) x <- matrix(NA,nrow=3,ncol=4) #3×4の空セル for (i in 1:4){ #列数分乱数を代入 x[,i] <- rnorm(3) #標準正規分布の乱数を行数分繰り返…

ベイズの定理でモンティ・ホール問題を考える

最終更新日2018-02-21 モンティ・ホール問題は不完全燃焼だったので、再々挑戦したいと思います. 今回は下記の文献をもとにベイズの定理を使って勉強していきます. はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―作者: 豊田秀樹出版社/メ…

LaTeXでプレゼン

無料ソフトのみで統計からプレゼンまで! spss, word, power pointを使用しないで以下のような2枚のスライドを作ってみました. 使ったもの Hatena Blog R LeTeX 画像は オッズ比の信頼区間 - 統計学備忘録 since2016 からのコピペです %LaTexの記載は以下…