理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

クロス表

Fisherの直接法

投稿日:2017-10-25、最終更新日:2018-05-02 Fisherの正確確率検定やFisherの直接確率検定、他にFisherの正確検定などと呼ばれています(統一してくれれば良いのにといつも思います).もともとカイ二乗検定は近似法でP値を求めています.一つのセルに度数が4以…

カッパ係数

個人的によく利用させていただいております以下のHPをもとに、今回はカッパ係数について少し勉強してみます 統計学入門−第5章 まずはHPに掲載してある次のサンプルデータを使用して、Rを使って処理してみます 分類数が2つの場合 rater01<-c(rep(1,40),rep(2,…

オッズ比の信頼区間

オッズ比、見込み比(odds ratio)または交差積比(cross-product) 前提 比は分母が小さくなると、数値が大きくなりすぎて正規近似の精度が悪くなります.比の対数であれば高い精度で正規近似することが可能になります. したがって、比の対数を考えていく…

リスク比の信頼区間

ポイント:比の対数をとり、正規近似する リスク比は疫学における指標の1つです.一般的には相対危険度(相対リスク,relative risk,RR)として利用されています. xm <- matrix(c("a","b","c","d"), nrow=2, byrow=T) name <- list("暴露"=c("あり(A群)","…

母比率の推定、母比率の差の検定

投稿日2017.6.19 更新日2018.1.30 比率の信頼区間 例)有権者から2,400人を無作為抽出した結果、1,250人は支持していたことがわかった.有権者の支持率の95%信頼区間を求めよ. 出典 日本統計学会 (編集); 日本統計学会公式認定 統計検定2級対応 統計学基…

シンプソンのパラドクス

最近、統計学の学習が進んでおりません ちょっとお仕事が忙しくて… 今日は少しだけ勉強しておきます. 観察研究には重要な概念です. x <- c(110,70,90,120) x <- matrix(x,2,2) rownames(x)<-c("治療A","治療B") colnames(x)<-c("改善","変化なし") addmarg…

カイ二乗検定後の残差分析

2017.12.5更新 残差=実測値-期待値 標準化残差= 標準化残差の分散= #各質問に関するyesの回答者数の割合について有意水準5%で検定します. xxx <- c(20,10,2,5,410,350,200,120) xxx <- matrix(xxx,4,2) yes no Q1 20 410 Q2 10 350 Q3 2 200 Q4 5 120 rn…

カイ自乗近似は不正確かもしれません

このコメントが出る場合は以下のようなときです 期待度数が 0になるセルがある場合、もしくは期待度数が 5未満になるセルが全体の 20% を超える場合 R: Fisher's Exact Test for Count Data that is if no cell has expected counts less than 1 and more th…

感度と特異度

感度と特異度 数か所間違いがありましたので再投稿します 投稿日2017.7.31 更新日2017.10.26 検査陽性 検査陰性 罹患 ×(+) ×(-) 健常 ○(+) ○(-) 感 度 (陽性反応的中度) = 罹患、検査陽性 特異度 (陰性反応的中度) = 罹患なし、検査陰性 偽陰性率 = 罹患、検…

独立性の検定

独立性の検定 投稿日2016.11.4 更新日2017.10.24 この分割表において独立とは Ai ∩ Bj の各確率に対して 全ての i j(どの i j でも)に対して となるAとBが完全に独立な場合の例 A1 : A2 : A3 がどのBでも 1 : 3 : 6 B1 : B2 : B3 がどのAでも 1 : 3 : 5 帰…

配列 (array) の基本

配列 (array) の基本 投稿日2017.10.4リスト:異なるデータ構造をまとめて一つのオブジェクトとして保存.解析結果の多くはリスト形式. 配列:次元を自由に設定できるオブジェクト.RのサンプルHairEyeColorを通して勉強していきます > HairEyeColor , , Se…