理学療法士がまとめたノート

統計学備忘録 since2016

Rを使って統計学を勉強するブログです

ベイズの定理でモンティ・ホール問題を考える

最終更新日2018-02-21
モンティ・ホール問題は不完全燃焼だったので、再々挑戦したいと思います.
今回は下記の文献をもとにベイズの定理を使って勉強していきます.

はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―

はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―

参考web
yoshida931.hatenablog.com

 あるクイズ番組を想定して、あたり(○)とはずれ(×)で考えていきます.ABCの袋があり、それぞれの袋に〇か×のどちらかが入っていています.どれか一つに〇が入っており、司会者は答えを知っています(ポイント).ここで、あなたはAを選択したとします. 次に、あなたがAの袋を確かめる前に、司会者がBの袋を開けて見せてくれました.Bはハズレ(×)でした.「Aに当りのある確率は・・・? 」という問題です.残りA、Cのどちらかに入っているので、「確率は1/2」と考えるのが直観解とよばれている解答になります.

f:id:yoshida931:20180119115348p:plain:w250

ベイズの定理を用いてもうすこし深く考えてみたいと思います.まず、準備として以下のことを定義付けておきます.

P(A○)  # Aが当りの確率
P()  # Bがはすれの確率
P(C○)  # Cが当りの確率
P()  # Cがはずれの確率
求めたいのは、(B×)の場合の(A○)の確率です.

P(A○|B×) = \frac{P(B×|A○)*P(A○)}{P(B×)}



yoshida931.hatenablog.com

P(A○|)=P(|A○)*P(A○) / P()
# ここで分母のP(B×)を考えてみます
P() = P()*P(A○) + P()*P(C○) 
     = P(A○)*P(|A○) + P(C○)*P(|C○)
# 当然、当りは均等の確率なのでP(A○)=P(B○)=P(C○)=1/3です.
# P(B×|C○)は、Cが当たりの場合に司会者はCを開けません.必ずBを開けてB×(ハズレ)を示します.従って、P(B×|C○)の確率は1になります.
P()1/3 * P(|A○) + 1/3 * 1  
#したがって
P(A○|) =( P(|A○) * 1/3  )  /  ( 1/3 * P(|A○) + 1/3 * 1   )

つぎに P(B×|A○)について考えてみます
これは自分が選んだAがあたりの場合に、司会者がBを見せる確率になります.
Aがあたりの場合には、司会者はBまたはCを見せることになります.
つまり「Bを見せる確率」と「Cを見せる確率」の合計は1になります.

  P(|A○)    A○ →  B×
  P(|A○)    A○ →  C×

P(|A○) + P(|A○) = 1
P(|A○) = 1 - P(|A○)

P(B×|A○) は0~1の確立であることが理解できました.つまり次にようなことが考えられます.

# 例えば、P(C×|A○)=1/2の場合
P(|A○) = 1 - P(|A○)  = 1/2    求める解であるP(A○|) = 1/3 になり1/2(直観解)とは異なります

無情報的事前分布

直感的にはP(A○|B×)の確率は1/2(直観解)なのですが、「P(B×|A○)の確率が不明」と考えた方が妥当ということになります.
P(B×|A○)の確率, つまり「自分が選んだAが当たりの場合にBがハズレの確率」です.この確率を考えることが重要なポイントとなります.
このような場合にP(B×|A○)の確率として仮定するのが、無情報的事前分布となります.

Rを使って確率分布のシミュレーション
P(B×|A○)は確率なので0~1の一様分布を仮定します.求めたい確率P(A○|B×) はどのような分布になっているでしょうか.

P(A○|) = ( P(|A○) * 1/3  )  /  ( 1/3 * P(|A○) + 1/3 * 1   )
P(A○|) = y
P(|A○) = x

#Rを使用して一様分布[0,1]を1万個生成して
x <- runif(10000)
y <- x/(x+1)
hist(y)
P(A○|B×)の確率分布(事後分布
f:id:yoshida931:20180123100530p:plain:w300

確かに直観解の1/2が最も多い(MAP推定値)ので、そのまま1/2と答えても間違いではないのですが、大正解でもなさそうです.

summary(y)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000545 0.1994000 0.3325000 0.3073000 0.4298000 0.5000000 

P(A○|B×)の平均は0.307となりました(EAP推定値).
P(A○|B×)の中央値は1/3となりました(MED推定値).

問題の答え
Aに当りがある確率が1/2になる確率が一番多くなり、平均は1/3程度になります… といったところでしょうか?

まとめ

モンティ・ホール問題におけるP(A当たり|Bハズレ)の確率を求めるのですが、P(Bハズレ|A当たり)の確率には言及されていないません. P(Bハズレ|A当たり)の確率評価が重要になります.

f:id:yoshida931:20180221104529p:plain:w400


下の図を用いて正規化から簡単に考えてみても同じ回答を得ます

f:id:yoshida931:20180316144544p:plain:w300


司会者結局、Bを開けたのでCを開ける事象は消去されます

f:id:yoshida931:20180316144717p:plain:w300


つまり「A〇&B開く」の確率は、\frac{\frac{1}{3}\times\frac{1}{2}}{\frac{1}{3}\times\frac{1}{2}+\frac{1}{2}} = \frac{1}{3}