理学療法士がまとめたノート

統計学備忘録(R言語のメモ)

since2016 ときどきTEXのメモ

クラスター分析

Rのサンプルattitudeを使用して、クラスタ分析(階層的方法)を勉強します.
attitudeは、管理者態度のデータです.無作為に選ばれた35名の雇用者よりアンケート.好意的な割合が数値化されています.
rating全般的評価、 complaints雇用者からの苦情処理、 privileges特別な特権の付与、 learning学習機会の付与、 raises業績による昇進機械、 critical批判的態度、 advance進歩

# xxはdata.frame

(result<-hclust(dist(xx),method="single"))
plot(result, main = "最近隣法")

(result<-hclust(dist(xx),method="complete"))
plot(result, main = "最遠隣法")

(result<-hclust(dist(xx),method="average"))
plot(result, main = "群平均法")

(result<-hclust(dist(xx),method="centroid"))
plot(result, main = "重心法")

(result<-hclust(dist(xx),method="median"))
plot(result, main = "メディアン法")

(result<-hclust(dist(xx),method="ward.D"))
plot(result, main = "ウォード法 ward.D")

(result<-hclust(dist(xx),method="ward.D2"))
plot(result, main = "ウォード法 ward.D2")

実際にウォード法を実行してみます  まずは変数クラスタを求めてみます

xx <- t(attitude)
(result<-hclust(dist(xx),method="ward.D"))
plot(result, main = "ウォード法 ward.D")

f:id:yoshida931:20171219114804p:plain:w400
進歩、批判的態度を除くと2グループに管理者の評価は分かれるようです 進歩、批判的態度、向上意欲をくみ取る能力、雇用者の全般的な評価といった分類になりそうです (これかは私の勝手な見解です)

つぎにサンプルクラスタをもとめてみます

xx <- attitude 
(result<-hclust(dist(xx),method="ward.D"))
plot(result, main = "ウォード法 ward.D")

f:id:yoshida931:20171219114910p:plain:w700
雇用者が数グループに分けられそうです.
こんなデータが病院経営戦略にも役立つのかも…?

引用・参考 間瀬 茂;R 基本統計関数マニュアル(https://cran.r-project.org/doc/contrib/manuals-jp/Mase-Rstatman.pdf)