理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

並べ替え検定と正規近似

2017-07-11投稿の修正版 正確なp値 特定の確率分布をもとに推定を行うのではなく、母集団の未知のパラメータやサンプリング誤差が入らないため計算上も正しいp値が得られる. 並べ替え検定 例)x群とy群を比較します x <- c(5, 9) #平均 = 7 y <- c(6, 12…

統計学的に独立ということ

以前の独立という記事を削除して再投稿二つの事象A,Bが独立であるということ 一方の事象が起こるかどうかが、他方の事象の起こる確率に影響しないこと 2つの事象AとBがを満たす場合、事象AとBは統計的に独立である.このときAとBの余事象も独立であるまたAの…

二項分布からの最尤推定 (旧)

二項分布からの最尤推定 投稿日2017.6.13 更新日2017.10.4 理解してなかったのでもう一度勉強します二項分布の復習 確率1/2が最も尤もらしい例 右側の数値は同時確率 どう見てもP=0.5が最も尤もらしい確率です!最尤原理 最尤原理は、現在起きている事象の起…

配列 (array) の基本

配列 (array) の基本 投稿日2017.10.4リスト:異なるデータ構造をまとめて一つのオブジェクトとして保存.解析結果の多くはリスト形式. 配列:次元を自由に設定できるオブジェクト.RのサンプルHairEyeColorを通して勉強していきます > HairEyeColor , , Se…

Rのサンプル ~ データフレーム編

Rのサンプル ~ データフレーム編 投稿日2017.10.2 更新日2017.10.4 少し見やすくしましたこういうのが統計学の学習に役立つかも? サンプルの詳細を知りたいときはここ 間瀬茂 R 基本統計関数マニュアル https://cran.r-project.org/doc/contrib/manuals-jp…

確率点と累積分布

確率点と累積分布 投稿日2017.7.22 更新日2017.9.28 lower.tail logical; if TRUE (default), probabilities are P[X ≤ x] otherwise, P[X > x]. Rのhelpより TRUE=default 正規分布 上側確率が0.025になるZ値qnorm ( 0.975, lower.tail=TRUE ) = 1.959964 (…

Z検定

Z検定 投稿日2017.9.19 記号の定義 母平均μx, 母分散σx, 標本x, サイズm, 標本平均xa 母平均μy, 母分散σy, 標本y, サイズn, 標本平均ya 平均値のZ検定 2標本平均の差の検定 - 統計学備忘録 since2016より 平均値の標準誤差 問題 xa=38,σx=15, n=100, α=0.05 …

対応のないt検定の検定力分析(事後の分析)

検定力(1-β):帰無仮説が「偽」であるとき(母集団に差があるとき)にサンプルから有意差を得る確率 効果量(effect size):標準化された平均値差(検定により色々あります...d family, r family) 標本数:研究者が決定しなければならない α(有意水準):慣例的…

2標本平均の差の検定

2標本問題のまとめ 以前投稿した記事を全面改修して再投稿です 投稿日2017.9.6 2標本問題(2つの母集団の母数に関する検定) ここでは2標本の平均の差の検定のみを扱います.まずは記号の定義・・・これ大事 母平均μx, 標本x, サイズm, 標本平均xa 母平均μy,…

指数分布

指数分布 投稿日2017.9.4 今回はRを使って苦手な指数関数に挑戦します定義 を確率変数の確率密度関数とします は確率変数の累積分布関数とします 離散型の変数で確率密度関数の復習をします 例)正確なサイコロ 確率変数 y<-c(rep(1/6,6)) plot(y, type = "h…

1標本t検定のまとめ

t検定のまとめ 投稿日2017.1.27 最終更新日2017.9.1t検定のまとめを復習していきます Rでは次のような関数を使用してt検定を実行します. t.test(x, alternative = c("two.sided", "less", "greater"),mu = 0, paired = FALSE, var.equal = FALSE, conf.lev…

確率点と累積分布

確率点と累積分布 投稿日2017.7.22 更新日2017.9.1lower.tailのdefaultはTRUE この意味が重要です.勉強のためにdefaultのTRUEも挿入しときます. lower.tail logical; if TRUE (default), probabilities are P[X ≤ x] otherwise, P[X > x]. Rのhelpより 正規…

ブログの再構成

自分が書いたブログなのに「見にくい&理解できない」 という悩みが募ってきました. よって、少しずつ再構成することにしました. はてな記法なるものに初挑戦! 見直したとき、せめて・・・ せめて書いた本人が理解できるような内容に改めたいと思っており…

モンティ・ホール問題

モンティ・ホール問題 投稿日2017.8.30モンティ・ホール問題、モンティ・ホール・ジレンマ Rを使って何とか解いてみようと思います. 3つのドアのうち1つのドアの後ろには高級車(車の扉)があり、残りの2つのドアにはヤギ(ヤギの扉)がいます。司会者は…

モンテカルロ法で円周率を求める

モンテカルロ法で円周率を求める 投稿日2017.8.28 モンテカルロ法 対象となるある現象がいくつかの確率変数の関数で表現できる場合(数値モデル)、各変数で仮定される確率分布に沿った標本値を大量に生成(乱数)して、その計算結果の分布を推定(結果の推…

ANOVA君 で分散分析

ANOVA君 で分散分析 投稿日2017.8.25 ANOVA君はフリーの統計ソフトウェア「R」で動作する分散分析関数です。ダウンロード、使い方、リリース情報などは「井関龍太のページ」を必ずご確認ください 井関龍太のページ http://riseki.php.xdomain.jp/index.php?F…

平均と分散

平均と分散 投稿日2016.11.9 更新日2017.8.25 未だにピンときてない自分のために 更新します ( 1 , 2 , 3 , 4 , 5 , 6 ) がデータxの場合 x<-c( 1 , 2 , 3 , 4 , 5 , 6 ) データxの平均 sum( x ) / length( x ) = mean( x ) = 3.5 データxの二乗平均 sum(…

二元配置分散分析(各水準の信頼区間推定)

二元配置分散分析(各水準の信頼区間推定) 投稿日2017.8.24 各要因における各水準の母平均の区間推定 繰り返し数 n n = 繰り返し数 要因1水準Aの有意水準αの信頼区間は、xai ± t α/2 (自由度) * 標準誤差 となります. 母分散が未知なので、標準誤差を残差…

二元配置分散分析 (2)

二元配置分散分析 (2) 投稿日2017.8.22 分析後の解釈について勉強します 二元配置分散分析(1)より 分散分析表 平方和の分解∑(f)∑(g)∑(n) ( xij - xa )^2 = ∑(f) g*n*( xai, - xa ) ^2 Aの主効果 + ∑(g) f*n*( xa-j - xa ) Bの主効果 + ∑(f)∑(g)n* ( xaij -…

二元配置分散分析 (1)

二元配置分散分析 投稿日2017.3.8更新日2017.8.17 主効果:因子の効果がその水準によって異なるとき主効果があるという 交互作用:別の因子がどのようなものかによって効果が異なるとき因子間に交互作用があるという 要因効果:主効果と交互作用の総称 2要因…

標準偏回帰係数の求め方

標準偏回帰係数の求め方 投稿日2017.8.12 更新日2017.8.13 忘れないように載せておきます 例)予測変数が二つの場合の重回帰分析 母回帰方程式 Y = b0 + b1*X1i + b2*X2i + Ei 予測方程式 y = β0 + β1*x1i + β2*x2i +ei 標準偏回帰係数 sβ1、sβ2 sβ1 = ( yと…

トービット回帰直線

トービット回帰直線 投稿日2017.8.4 打ち切りデータの場合、つまり天井効果や床効果が生じているデータの場合には、トービット回帰直線で分析します. 参考書はもちろん豊田秀樹 (著, 編集);回帰分析入門 (Rで学ぶ最新データ解析) ,東京図書 ,2012 Rのサンプ…

残差分析

残差分析 Rのサンプル ChickWeight を使用y<-ChickWeight$weight[1:10]x<-ChickWeight$Time[1:10]summary(lm(y~x))plot(x,y,xlab = "生後日数",ylab = "体重")abline(30.327 ,7.030) #回帰直線の挿入 残差 ei をプロットすることで、回帰モデルからのズレを…

回帰係数の区間推定

投稿日2017.2.3更新日2017.7.31 回帰係数の区間推定 標本回帰係数の不偏推定量から母回帰係数の信頼区間を求めてみます. 次式をRにペーストしてx<-read.table("clipboard",header=T) 次のデータをコピーしてRで実行します東京 福岡1019.4 1018.41005.7 1007…

ユールのQ

ユール ( Yule ) のQユールの関連係数、ユールの連関係数とも呼ばれています.関連が強いほど1または-1に近い値をとります。 Q= ( a*d - b*c ) / ( a*d + b*c ) = ( オッズ比 - 1 ) / ( オッズ比 + 1 )例)2つの質問 ( q1 , q2 ) に関する答え ( yes , no ) …

適合度の検定 (ピアソンの 𝜒^2 適合度検定)

適合度の検定 (ピアソンの 𝜒^2 適合度検定)投稿日2016.11.4更新日2017.7.21理論上の確率分布から得られる期待度数 ( Expected frequency ) を求めることが前提となります.その期待度数を利用して観測値の度数 ( Observed frequency ) が適合するかどうか(…

Rstudioでの data.frame 表示の不具合

データフレームを表示したときに、ラベルが見えなくなりました RStudio-1.0.143 から RStudio-1.0.153 へバージョンアップすることで不具合は解消しました.https://www.rstudio.com/products/rstudio/download/preview/ Rstudioのサポートページの掲示板で…

ファイ係数

連関係数 クロス集計表における2つの変数間の関連性の程度を表す指標として,連関係数が提案されています. 連関係数<|0.2| 連関はほとんどない|0.2|≦連関係数<|0.4| やや連関がある|0.4|≦連関係数<|0.7| 強い連関がある|0.7|≦連関係数 かな…

イェーツの補正

イェーツの補正 / イェーツの連続修正(Yate's continuity correction) 離散型分布を連続型分布に近似させて統計的検定を行う際に使用する修正です.2×2分割表のデータに対して行われ、より正確な検定が可能になります.「連続的なカイ二乗分布(自由度1のχ…

符号検定

符号検定 ( sign test ) 一標本問題 n個のうちx個以下の符号が他の符号と異なる確率を求める検定です.正と負が同じ確率で出るときに、正(または負)の値の数がxとなる確率が B ( n , 0.5 ) の2項分布に従うことを利用します.例y<- c (1.5, 1.1, 1.2, -1.…