最終更新日2018-02-21
モンティ・ホール問題は不完全燃焼だったので、再々挑戦したいと思います.
今回は下記の文献をもとにベイズの定理を使って勉強していきます.

はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―
- 作者: 豊田秀樹
- 出版社/メーカー: 朝倉書店
- 発売日: 2016/06/02
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (11件) を見る
参考web
yoshida931.hatenablog.com
あるクイズ番組を想定して、あたり(○)とはずれ(×)で考えていきます.ABCの袋があり、それぞれの袋に〇か×のどちらかが入っていています.どれか一つに〇が入っており、司会者は答えを知っています(ポイント).ここで、あなたはAを選択したとします. 次に、あなたがAの袋を確かめる前に、司会者がBの袋を開けて見せてくれました.Bはハズレ(×)でした.「Aに当りのある確率は・・・? 」という問題です.残りA、Cのどちらかに入っているので、「確率は1/2」と考えるのが直観解とよばれている解答になります.

ベイズの定理を用いてもうすこし深く考えてみたいと思います.まず、準備として以下のことを定義付けておきます.
P(A○) # Aが当りの確率 P(B×) # Bがはすれの確率 P(C○) # Cが当りの確率 P(C×) # Cがはずれの確率
P(A○|B×)=P(B×|A○)*P(A○) / P(B×) # ここで分母のP(B×)を考えてみます P(B×) = P(B×)*P(A○) + P(B×)*P(C○) = P(A○)*P(B×|A○) + P(C○)*P(B×|C○) # 当然、当りは均等の確率なのでP(A○)=P(B○)=P(C○)=1/3です. # P(B×|C○)は、Cが当たりの場合に司会者はCを開けません.必ずBを開けてB×(ハズレ)を示します.従って、P(B×|C○)の確率は1になります. P(B×) =1/3 * P(B×|A○) + 1/3 * 1 #したがって P(A○|B×) =( P(B×|A○) * 1/3 ) / ( 1/3 * P(B×|A○) + 1/3 * 1 )
つぎに P(B×|A○)について考えてみます
これは自分が選んだAがあたりの場合に、司会者がBを見せる確率になります.
Aがあたりの場合には、司会者はBまたはCを見せることになります.
つまり「Bを見せる確率」と「Cを見せる確率」の合計は1になります.
P(B×|A○) A○ → B× P(C×|A○) A○ → C× P(B×|A○) + P(C×|A○) = 1 P(B×|A○) = 1 - P(C×|A○)
P(B×|A○) は0~1の確立であることが理解できました.つまり次にようなことが考えられます.
# 例えば、P(C×|A○)=1/2の場合 P(B×|A○) = 1 - P(C×|A○) = 1/2 求める解であるP(A○|B×) = 1/3 になり1/2(直観解)とは異なります
無情報的事前分布
直感的にはP(A○|B×)の確率は1/2(直観解)なのですが、「P(B×|A○)の確率が不明」と考えた方が妥当ということになります.
P(B×|A○)の確率, つまり「自分が選んだAが当たりの場合にBがハズレの確率」です.この確率を考えることが重要なポイントとなります.
このような場合にP(B×|A○)の確率として仮定するのが、無情報的事前分布となります.
Rを使って確率分布のシミュレーション
P(B×|A○)は確率なので0~1の一様分布を仮定します.求めたい確率P(A○|B×) はどのような分布になっているでしょうか.
P(A○|B×) = ( P(B×|A○) * 1/3 ) / ( 1/3 * P(B×|A○) + 1/3 * 1 ) P(A○|B×) = y P(B×|A○) = x #Rを使用して一様分布[0,1]を1万個生成して x <- runif(10000) y <- x/(x+1) hist(y)

確かに直観解の1/2が最も多い(MAP推定値)ので、そのまま1/2と答えても間違いではないのですが、大正解でもなさそうです.
summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0000545 0.1994000 0.3325000 0.3073000 0.4298000 0.5000000
P(A○|B×)の平均は0.307となりました(EAP推定値).
P(A○|B×)の中央値は1/3となりました(MED推定値).
問題の答え
Aに当りがある確率が1/2になる確率が一番多くなり、平均は1/3程度になります… といったところでしょうか?
まとめ
モンティ・ホール問題におけるP(A当たり|Bハズレ)の確率を求めるのですが、P(Bハズレ|A当たり)の確率には言及されていないません. P(Bハズレ|A当たり)の確率評価が重要になります.

下の図を用いて正規化から簡単に考えてみても同じ回答を得ます

司会者結局、Bを開けたのでCを開ける事象は消去されます

つまり「A〇&B開く」の確率は、