理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

Z検定

Z検定 投稿日2017.9.19 記号の定義 母平均μx, 母分散σx, 標本x, サイズm, 標本平均xa 母平均μy, 母分散σy, 標本y, サイズn, 標本平均ya 平均値のZ検定 2標本平均の差の検定 - 統計学備忘録 since2016より 平均値の標準誤差 問題 xa=38,σx=15, n=100, α=0.05 …

独立性の検定

独立性の検定 投稿日2016.11.4 更新日2017.9.13 この分割表において独立とは Ai ∩ Bj の各確率に対して 全ての i j(どの i j でも)に対して となるAとBが完全に独立な場合の例 A1 : A2 : A3 がどのBでも 1 : 3 : 6 B1 : B2 : B3 がどのAでも 1 : 3 : 5 帰…

テキストファイルに検定結果を出力

テキストファイルに検定結果を出力 投稿日2017.9.8ちょっとした小技テキスト形式のファイルに検定結果を書き込む練習をします sprintf:書式指定変換した出力を文字列に格納 cat:文字列を表示する基本的な関数, file=でファイルに書き込み備忘録 \n 改行 %.…

対応のないt検定の検定力分析(事後の分析)

検定力(1-β):帰無仮説が「偽」であるとき(母集団に差があるとき)にサンプルから有意差を得る確率 効果量(effect size):標準化された平均値差(検定により色々あります...d family, r family) 標本数:研究者が決定しなければならない α(有意水準):慣例的…

2標本平均の差の検定

2標本問題のまとめ 以前投稿した記事を全面改修して再投稿です 投稿日2017.9.6 2標本問題(2つの母集団の母数に関する検定) ここでは2標本の平均の差の検定のみを扱います.まずは記号の定義・・・これ大事 母平均μx, 標本x, サイズm, 標本平均xa 母平均μy,…

指数分布

指数分布 投稿日2017.9.4 今回はRを使って苦手な指数関数に挑戦します定義 を確率変数の確率密度関数とします は確率変数の累積分布関数とします 離散型の変数で確率密度関数の復習をします 例)正確なサイコロ 確率変数 y<-c(rep(1/6,6)) plot(y, type = "h…

1標本t検定のまとめ

t検定のまとめ 投稿日2017.1.27 最終更新日2017.9.1t検定のまとめを復習していきます Rでは次のような関数を使用してt検定を実行します. t.test(x, alternative = c("two.sided", "less", "greater"),mu = 0, paired = FALSE, var.equal = FALSE, conf.lev…

確率点と累積分布

確率点と累積分布 投稿日2017.7.22 更新日2017.9.1lower.tailのdefaultはTRUE この意味が重要です.勉強のためにdefaultのTRUEも挿入しときます. lower.tail logical; if TRUE (default), probabilities are P[X ≤ x] otherwise, P[X > x]. Rのhelpより 正規…

ブログの再構成

自分が書いたブログなのに「見にくい&理解できない」 という悩みが募ってきました. よって、少しずつ再構成することにしました. はてな記法なるものに初挑戦! 見直したとき、せめて・・・ せめて書いた本人が理解できるような内容に改めたいと思っており…

モンティ・ホール問題

モンティ・ホール問題 投稿日2017.8.30モンティ・ホール問題、モンティ・ホール・ジレンマ Rを使って何とか解いてみようと思います. 3つのドアのうち1つのドアの後ろには高級車(車の扉)があり、残りの2つのドアにはヤギ(ヤギの扉)がいます。司会者は…

モンテカルロ法で円周率を求める

モンテカルロ法で円周率を求める 投稿日2017.8.28 モンテカルロ法 対象となるある現象がいくつかの確率変数の関数で表現できる場合(数値モデル)、各変数で仮定される確率分布に沿った標本値を大量に生成(乱数)して、その計算結果の分布を推定(結果の推…

ANOVA君 で分散分析

ANOVA君 で分散分析 投稿日2017.8.25 ANOVA君はフリーの統計ソフトウェア「R」で動作する分散分析関数です。ダウンロード、使い方、リリース情報などは「井関龍太のページ」を必ずご確認ください 井関龍太のページ http://riseki.php.xdomain.jp/index.php?F…

平均と分散

平均と分散 投稿日2016.11.9 更新日2017.8.25 未だにピンときてない自分のために 更新します ( 1 , 2 , 3 , 4 , 5 , 6 ) がデータxの場合 x<-c( 1 , 2 , 3 , 4 , 5 , 6 ) データxの平均 sum( x ) / length( x ) = mean( x ) = 3.5 データxの二乗平均 sum(…

二元配置分散分析(各水準の信頼区間推定)

二元配置分散分析(各水準の信頼区間推定) 投稿日2017.8.24 各要因における各水準の母平均の区間推定 繰り返し数 n n = 繰り返し数 要因1水準Aの有意水準αの信頼区間は、xai ± t α/2 (自由度) * 標準誤差 となります. 母分散が未知なので、標準誤差を残差…

二元配置分散分析 (2)

二元配置分散分析 (2) 投稿日2017.8.22 分析後の解釈について勉強します 二元配置分散分析(1)より 分散分析表 平方和の分解∑(f)∑(g)∑(n) ( xij - xa )^2 = ∑(f) g*n*( xai, - xa ) ^2 Aの主効果 + ∑(g) f*n*( xa-j - xa ) Bの主効果 + ∑(f)∑(g)n* ( xaij -…

確率点と累積分布

確率点と累積分布 投稿日2017.7.22 更新日2017.8.22 lower.tail logical; if TRUE (default), probabilities are P[X ≤ x] otherwise, P[X > x]. Rのhelpより TRUE=default 正規分布 上側確率が0.025になるZ値qnorm ( 0.975, lower.tail=TRUE ) = 1.959964 (…

二元配置分散分析 (1)

二元配置分散分析 投稿日2017.3.8更新日2017.8.17 2要因ともに対応なし、繰り返し数がすべて等しい場合 例) 要因1(水準A1、水準A2)、要因2(水準B1、水準B2、水準B3) (仮想データ使用) Rの関数で分散分析表を作成してみます 各セルにベクトル名をつけ…

一元配置分散分析

一元配置分散分析 投稿日2016.11.2 更新日2017.8.15 言葉の整理 要因:実験結果に影響を与える要素 因子:研究対象となる要因( 母平均に差をもたらすと考えられる ) 水準:要因を分ける条件( 要因に含まれる項目 ) 群:=水準 平方和:偏差の二乗の合計 …

標準偏回帰係数の求め方

標準偏回帰係数の求め方 投稿日2017.8.12 更新日2017.8.13 忘れないように載せておきます 例)予測変数が二つの場合の重回帰分析 母回帰方程式 Y = b0 + b1*X1i + b2*X2i + Ei 予測方程式 y = β0 + β1*x1i + β2*x2i +ei 標準偏回帰係数 sβ1、sβ2 sβ1 = ( yと…

トービット回帰直線

トービット回帰直線 投稿日2017.8.4 打ち切りデータの場合、つまり天井効果や床効果が生じているデータの場合には、トービット回帰直線で分析します. 参考書はもちろん豊田秀樹 (著, 編集);回帰分析入門 (Rで学ぶ最新データ解析) ,東京図書 ,2012 Rのサンプ…

残差分析

残差分析 Rのサンプル ChickWeight を使用y<-ChickWeight$weight[1:10]x<-ChickWeight$Time[1:10]summary(lm(y~x))plot(x,y,xlab = "生後日数",ylab = "体重")abline(30.327 ,7.030) #回帰直線の挿入 残差 ei をプロットすることで、回帰モデルからのズレを…

単回帰分析

投稿日2017.2.2更新日2017.8.1線形回帰分析説明変数と目的変数を直線関係で傾向を示す。説明変数と目的変数との関係を直線でモデル化する回帰分析。 非線形回帰分析非線形関係でモデル化する回帰分析。説明変数と目的変数を非直線的関係で傾向を示す。 以下…

感度、特異度、ROC曲線

感度と特異度 投稿日2017.7.31 感 度(陽性反応的中度)= b / ( a + b ) 疾患に罹患していて、検査も陽性 特異度(陰性反応的中度)= c / ( c + d ) 疾患に罹患してなくて、検査も陰性 偽陽性率 a / ( a + b ) 疾患に罹患していて検査が陰性偽陰性率 d / (…

回帰係数の区間推定

投稿日2017.2.3更新日2017.7.31 回帰係数の区間推定 標本回帰係数の不偏推定量から母回帰係数の信頼区間を求めてみます. 次式をRにペーストしてx<-read.table("clipboard",header=T) 次のデータをコピーしてRで実行します東京 福岡1019.4 1018.41005.7 1007…

ユールのQ

ユール ( Yule ) のQユールの関連係数、ユールの連関係数とも呼ばれています.関連が強いほど1または-1に近い値をとります。 Q= ( a*d - b*c ) / ( a*d + b*c ) = ( オッズ比 - 1 ) / ( オッズ比 + 1 )例)2つの質問 ( q1 , q2 ) に関する答え ( yes , no ) …

適合度の検定 (ピアソンの 𝜒^2 適合度検定)

適合度の検定 (ピアソンの 𝜒^2 適合度検定)投稿日2016.11.4更新日2017.7.21理論上の確率分布から得られる期待度数 ( Expected frequency ) を求めることが前提となります.その期待度数を利用して観測値の度数 ( Observed frequency ) が適合するかどうか(…

二項分布からの最尤推定

投稿日2017.6.13更新日2017.7.20 二項分布から最尤推定に挑戦 二項分布のグラフ - 統計学備忘録 since2016 例)試行回数3回・確率1/2の二項分布 𝐵𝑖(3 , 0.5) 表が出る確率をp=1/2とすると、次のような分布が考えられます.確率pのときに表が〇回出る確率(同…

Rstudioでの data.frame 表示の不具合

データフレームを表示したときに、ラベルが見えなくなりました RStudio-1.0.143 から RStudio-1.0.153 へバージョンアップすることで不具合は解消しました.https://www.rstudio.com/products/rstudio/download/preview/ Rstudioのサポートページの掲示板で…

ファイ係数

連関係数 クロス集計表における2つの変数間の関連性の程度を表す指標として,連関係数が提案されています. 連関係数<|0.2| 連関はほとんどない|0.2|≦連関係数<|0.4| やや連関がある|0.4|≦連関係数<|0.7| 強い連関がある|0.7|≦連関係数 かな…

イェーツの補正

イェーツの補正 / イェーツの連続修正(Yate's continuity correction) 離散型分布を連続型分布に近似させて統計的検定を行う際に使用する修正です.2×2分割表のデータに対して行われ、より正確な検定が可能になります.「連続的なカイ二乗分布(自由度1のχ…