理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

データフレームからの抽出

例)iris アヤメ head(iris,5) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa Sepal.Length(へたの長さ)…

二項分布の最尤推定法 

母集団Aの成功率0.7をパラメータとして、この母集団のサンプルから考えていきます.成功率0.7、試行回数10回の二項分布の乱数を1000個生成して母集団Aとします. y <- rbinom(1000,10,0.7) head(y) #最初の6データを確認してみます [1] 6 7 6 4 9 8 #成功率…

ベイズの定理

ベイズの定理とは「観測値(データ)で条件付けられた、母数の分布を与える定理 」です #Rのサンプル women$height を使用します x <- women$height #標本平均 me <- mean(women$height) =65 #標本標準偏差 sd <- sqrt(sum((x - mean(x))^2) / length(x)) =4…

このブログの参考・引用文献

投稿日 2016-10-31最終更新日 2017-12-29 文献:著者五十音順 巨人の肩に乗らねば・・・ 石井一夫 ;Rとグラフで実感する生命科学のための統計入門, 羊土社 ,2017石田 基広 ;改訂3版 R言語逆引きハンドブック ,シーアンドアール研究所; 改訂3版,2016石田 基広 ;R…

一様分布

確立密度関数 , 累積分布関数(分布関数) , 平均 分散 #例)離散型一様分布(確立変数が整数の場合) #1~10の整数をランダムで発生させたとき、2~5の数が出る確率は? (5-1)/(10-1) - (2-1)/(10-1) = (5-2)/(10-1) = 0.33333 サイコロを例にグラフを作成…

正規分布

確立密度関数 ] 、 累積分布関数(分布関数) pnorm ( 1.96, lower.tail=TRUE ) - pnorm ( 1.96, lower.tail=FALSE ) = pnorm ( 1.96 ) - pnorm ( -1.96 ) = 0.9500042 yoshida931.hatenablog.com

クラスター分析

Rのサンプルattitudeを使用して、クラスタ分析(階層的方法)を勉強します. attitudeは、管理者態度のデータです.無作為に選ばれた35名の雇用者よりアンケート.好意的な割合が数値化されています. rating全般的評価、 complaints雇用者からの苦情処理、 …

シンプソンのパラドクス

最近、統計学の学習が進んでおりません ちょっとお仕事が忙しくて… 今日は少しだけ勉強しておきます. 観察研究には重要な概念です. x <- c(110,70,90,120) x <- matrix(x,2,2) rownames(x)<-c("治療A","治療B") colnames(x)<-c("改善","変化なし") addmarg…

カイ二乗検定後の残差分析

2017.12.5更新 残差=実測値-期待値 標準化残差= 標準化残差の分散= #各質問に関するyesの回答者数の割合について有意水準5%で検定します. xxx <- c(20,10,2,5,410,350,200,120) xxx <- matrix(xxx,4,2) yes no Q1 20 410 Q2 10 350 Q3 2 200 Q4 5 120 rn…

カイ自乗近似は不正確かもしれません

このコメントが出る場合は以下のようなときです 期待度数が 0になるセルがある場合、もしくは期待度数が 5未満になるセルが全体の 20% を超える場合 R: Fisher's Exact Test for Count Data that is if no cell has expected counts less than 1 and more th…

統計検定2級

統計検定2級をこれから目指す人のために 私がお勧めする本です 確率が苦手のまま検定に望んではいけません! この本を読んでから統計学に入りましょう! 高校生が感動した確率・統計の授業 (PHP新書)作者: 山本俊郎出版社/メーカー: PHP研究所発売日: 2017/0…

決定係数(寄与率)

決定係数 回帰係数がどの程度よく当てはまっているか、つまりXがYをうまく説明できているか、ということを明らかにすることは重要になります.決定係数は、その当てはまりを示す基準としてして使用されています. 観測値の平方和(全変動) 回帰による平方和…

テキストファイルに検定結果を出力

テキストファイルに検定結果を出力 投稿日2017.11.14r-de-r様からコメントいただきましたので修正しております 素直に感動しておりますテキスト形式のファイルに検定結果を書き込む練習をします sprintf:書式指定変換した出力を文字列に格納 cat:文字列を…

単回帰分析

投稿日2017.2.2 更新日2017.11.13 線形回帰分析 説明変数と目的変数との関係を直線でモデル化する回帰分析。 Xi <- c(35, 45, 55, 65, 75) Yi <- c(114, 124, 143, 158, 166) plot(Xi, Yi, pch = 16) abline(lm(Yi~Xi), col = 2) どのようにして赤のラインを…

九州理学療法士・作業療法士合同学会2017in宮崎で紹介したスクリプト

モンテカルロ法によるt検定の検定力分析 モンテカルロ法については以下を参照ください yoshida931.hatenablog.com tval <- numeric(length = 10000) #t値(空のベクトルを設定) cs <- 0 for(i in 1:10000){ x <- rnorm(n = 30, mean = 10, sd = 3) # xの乱…

分散分析(繰り返し vs 反復)

月元敬;対応あり, 繰り返し, 反復: 心理データ解析基礎において区別すべき 3 つの 「R」. 岐阜大学教育学部研究報告. 人文科学, 2015, 64.1: 67-73. 「繰り返し」と「反復」は区別なく混同している参考書も多いようですが、今回は上記の文献をもとに違いを整…

分散分析の基本

まだ理解できていない.なので書き直し・・・ 一元配置分散分析 言葉の整理 要因(factor), 因子(factor):実験結果に影響を与える要素.それぞれの分野で使い分ける場合もあるので注意.このブログでは要因と因子の区別をせず「要因」で統一します. 〇元配置分…

感度と特異度

感度と特異度 数か所間違いがありましたので再投稿します 投稿日2017.7.31 更新日2017.10.26 検査陽性 検査陰性 罹患 ×(+) ×(-) 健常 ○(+) ○(-) 感 度 (陽性反応的中度) = 罹患、検査陽性 特異度 (陰性反応的中度) = 罹患なし、検査陰性 偽陰性率 = 罹患、検…

Fisherの直接法

Fisherの正確確率検定やFisherの直接確率検定、他にFisherの正確検定などと呼ばれています(統一してくれれば良いのにといつも思います).もともとカイ二乗検定は近似法でP値を求めています.一つのセルに度数が4以下が存在する場合には近似法の精度が落ちる…

独立性の検定

独立性の検定 投稿日2016.11.4 更新日2017.10.24 この分割表において独立とは Ai ∩ Bj の各確率に対して 全ての i j(どの i j でも)に対して となるAとBが完全に独立な場合の例 A1 : A2 : A3 がどのBでも 1 : 3 : 6 B1 : B2 : B3 がどのAでも 1 : 3 : 5 帰…

並べ替え検定と正規近似

2017-07-11投稿の修正版 正確なp値 特定の確率分布をもとに推定を行うのではなく、母集団の未知のパラメータやサンプリング誤差が入らないため計算上も正しいp値が得られる. 並べ替え検定 例)x群とy群を比較します x <- c(5, 9) #平均 = 7 y <- c(6, 12…

統計学的に独立ということ

以前の独立という記事を削除して再投稿二つの事象A,Bが独立であるということ 一方の事象が起こるかどうかが、他方の事象の起こる確率に影響しないこと 2つの事象AとBがを満たす場合、事象AとBは統計的に独立である.このときAとBの余事象も独立であるまたAの…

二項分布からの最尤推定 (旧)

二項分布からの最尤推定 投稿日2017.6.13 更新日2017.10.4 理解してなかったのでもう一度勉強します二項分布の復習 確率1/2が最も尤もらしい例 右側の数値は同時確率 どう見てもP=0.5が最も尤もらしい確率です!最尤原理 最尤原理は、現在起きている事象の起…

配列 (array) の基本

配列 (array) の基本 投稿日2017.10.4リスト:異なるデータ構造をまとめて一つのオブジェクトとして保存.解析結果の多くはリスト形式. 配列:次元を自由に設定できるオブジェクト.RのサンプルHairEyeColorを通して勉強していきます > HairEyeColor , , Se…

Rのサンプル ~ データフレーム編

Rのサンプル ~ データフレーム編 投稿日2017.10.2 更新日2017.10.4 少し見やすくしましたこういうのが統計学の学習に役立つかも? サンプルの詳細を知りたいときはここ 間瀬茂 R 基本統計関数マニュアル https://cran.r-project.org/doc/contrib/manuals-jp…

確率点と累積分布

確率点と累積分布 投稿日2017.7.22 更新日2017.9.28 lower.tail logical; if TRUE (default), probabilities are P[X ≤ x] otherwise, P[X > x]. Rのhelpより TRUE=default 正規分布 上側確率が0.025になるZ値qnorm ( 0.975, lower.tail=TRUE ) = 1.959964 (…

Z検定

Z検定 投稿日2017.9.19 記号の定義 母平均μx, 母分散σx, 標本x, サイズm, 標本平均xa 母平均μy, 母分散σy, 標本y, サイズn, 標本平均ya 平均値のZ検定 2標本平均の差の検定 - 統計学備忘録 since2016より 平均値の標準誤差 問題 xa=38,σx=15, n=100, α=0.05 …

対応のないt検定の検定力分析(事後の分析)

検定力(1-β):帰無仮説が「偽」であるとき(母集団に差があるとき)にサンプルから有意差を得る確率 効果量(effect size):標準化された平均値差(検定により色々あります...d family, r family) 標本数:研究者が決定しなければならない α(有意水準):慣例的…

2標本平均の差の検定

2標本問題のまとめ 以前投稿した記事を全面改修して再投稿です 投稿日2017.9.6 2標本問題(2つの母集団の母数に関する検定) ここでは2標本の平均の差の検定のみを扱います.まずは記号の定義・・・これ大事 母平均μx, 標本x, サイズm, 標本平均xa 母平均μy,…

指数分布

指数分布 投稿日2017.9.4 今回はRを使って苦手な指数関数に挑戦します定義 を確率変数の確率密度関数とします は確率変数の累積分布関数とします 離散型の変数で確率密度関数の復習をします 例)正確なサイコロ 確率変数 y<-c(rep(1/6,6)) plot(y, type = "h…