ベイズの定理とヒューリスティック

久々に書きたくなったので書きます。学問ネタは初めてなので間違ったこと書いてないか心配です(致命的なミスはないはず...)。ググれば無限に出てくるネタですが、まあ自分のアウトプットの練習として。

 

先日、TwitterのTL上でこんな問題が話題になりました(一部改めてあります)。

「Aは100人に1人の割合でかかる病気Xに自分がかかっているかを知りたくなった。病気Xに検査薬で検査したところ、陽性であった。この検査薬が正しい確率は99%であり、Xにかかっていないにもかかわらず陽性を示す確率は1%である。また、Xを患っている場合は必ず陽性を示す。このとき、AがXを患っている確率はいくつか。」

賢明な皆さんであれば、正確に答えることができるかもしれません。「検査薬が陽性を示した時に、実際にXにかかっている条件付き確率」を求めればいいのですから

 (検査薬が陽性を示す確率)=0.01*0.99+0.99*0.01=0.02*0.99

   (Xにかかっているときに検査薬が陽性を示す確率)=0.01*0.99

より、(0.01*0.99)/(0.02+0.99)=0.5 つまり50%となります。

 この計算結果を見て、不思議に思う人が多いことかと思います。検査薬は99%の確率で正しい結果を示してくれるはずなのに、実際にXにかかっている確率は50%まで落ちてしまうのです。

 次に、こんな問題を考えてみましょう。

「ある夜に、タクシーがひき逃げ事件を起こした。その町では、緑のタクシーと青のタクシーが営業している。タクシーの比率は85%がタクシー、15%が青タクシーである。ある目撃者が言うには、事故を起こしたタクシーは青だったという。そこで事故が起きた状況で目撃証言の信頼性をテストしたところ、80%は正しく色を判断できたが、20%は誤りであった。このとき、事故を起こしたのが本当に青タクシーである確率はいくつか。」

同様の計算で答えが導けます。「目撃者が青タクシーだと証言したときに実際に青タクシーであった確率」なので

   (0.15*0.8)/(0.15*0.8+0.85*0.2)≒0.41

と。41%となります。

 この問題は実験に使われていて、被験者の多くが青タクシーが犯人である確率を80%前後と推定したといいます。そんなの条件付き確率の知識がないだけやろと思うかもしれませんが、パッと出題されたらまあ80%ぐらいかなあと思うのではないでしょうか。

 

ベイズの定理

 上2つの問題の計算過程ではベイズの定理を使っています。ベイズの定理というのは簡単に言うと(詳細はぐぐってください)、事象Aと事象Bに対して、事象Aが起こった時に事象Bが起きている確率P(B|A)が

   P(B|A)=P(A∩B)/P(A)

で求まるというものです。以後、P(B|A)を事後確率と呼びます。

さて、タクシーの問題ではAが「目撃者が青タクシーだと証言する」Bが「青タクシーが犯人である」となります。また、緑タクシーが85%、青タクシーが15%という情報がありましたが、この確率のことを事前確率と言います。また、目撃者の証言の信頼度は尤度と呼ばれます。ベイズの定理は、事前確率と尤度から事後確率を導く定理というわけですしかし、実験被験者の多くは青タクシーが犯人である確率は80%だと答えました。つまり、本来事前確率と尤度を用いて事後確率を計算すべきところを、事前確率を無視して尤度に謎の微調整を事後確率を推定していると考えられます。これを事前確率の無視と呼ぶことにしましょう。そして正しい解答を導けたとしても「直感に反する」だとか「不思議だな」といった感想は、この事前確率の無視から来ていると考えられます。この事前確率の無視には、人間の判断や意思決定を支えるヒューリスティック(heuristic)というものが関わっています。

 

ヒューリスティックとは?

 ヒューリスティックというのは、必ずしも正確な解は得られないが、近似解が期待できる方法のことをいいます。特長は、回答に至るまでの時間が短縮できることです。対置される概念としてアルゴリズム(algorithm)があります。アルゴリズムは、必ず正しい解を返すことのできる一連の手順のことをいいます。

 人間は記憶や推論に使用できる認知資源に限りがあります。アルゴリズムというのは場合によっては複雑であったり、計算量が多かったりするので、代わりにヒューリスティックを用いることで処理の複雑さを軽減しているのです。

 繰り返しになりますが、ヒューリスティックは簡単に用いることができて、回答までの時間を短縮できます。一方で、必ずしも結果は正しくなく、結果には系統的な歪みが生じることが生じることがあります。そして、事前確率の無視は、このヒューリスティックによるものだという説明ができるのです。事前確率の無視を説明する2つのヒューリスティックを見ていきましょう。

 

代表性ヒューリスティック

代表性ヒューリスティック(representative heuristic)とは、ある事例の起こりやすさ(確率)を、典型例(いわゆるステレオタイプ)と類似している程度によって判定する方法のことをいいます。対象が典型例と類似しているほど、代表制ヒューリスティックが生じやすくなります。

有名な例としてこんなものがあります。

「リンダは、独身で31祭の率直な聡明な女性である。彼女は大学では哲学を専攻した。また、学生時代は人種差別や社会正義の問題に関心を持ち、反核デモに参加していた。

ここで、リンダについてどちらの可能性が高いだろうか?」

 A:「銀行員である」

B: 「フェミニストの銀行員である」

みなさんはどちらを選びますか?

集合論的に考えれば、当然Aの方が確率は高いはずです。ところが、この問題での実験参加者の約90%がBを選んだのです。ここでリード文を見てみると、たしかに「フェミニストっぽい」フレーズがちりばめられています。実験参加者は代表制ヒューリスティックによって、リンダについての説明文と銀行員やフェミニストの典型例との類似性から可能性を判断したのです。このような誤りは連言錯誤と呼ばれています。実験室の中でならよいですが、これが社会的ステレオタイプとなると面倒です。例えば「東大生だから○○だ」「理系/文系だから」という言説には困らされることがあるでしょう。

 さて、この代表制ヒューリスティックから事前確率の無視を捉えてみます。事故の犯人のタクシーを推定するとき、町のタクシーの比率で判断するより、目撃者の証言で判断する方が代表的なわけです。そのため判断材料として目撃者の証言の方に偏ってしまうことになります。最初に挙げた病気の例も、検査薬の結果で判断するのが代表的だとして、そちらに引っ張られるわけです。

 

 さて長くなってしまって僕も疲れてきたのであとは簡単に終わらせますが、事前確率の無視には係留と調整ヒューリスティック(anchoring and adjustment heuristic)を用いた説明も可能です。このヒューリスティックは始めの値を錨(anchor)のように基準値として設定して、そこからわずかな調整だけで最終的な結果が決まってしまうということです。事前確率の無視といっても完全に無視されているというわけではないとされているのですが、タクシー問題の例でいえば、一度目撃者証言の信頼度に基準を定めてしまうため、そこからわずかにしか推定値が変化しないのでしょう。

 

 事前確率の無視についての教科書的な説明をしてきましたが、実はこれはおかしいのではないかという議論もあります(問題文は妥当か、ここでいう「確率」とは数学的な確率なのか?%表記ではなく頻度表記にするとうまくいく...etc)が、それはここではやめおきましょう(笑)。

 

参考:教養としての認知科学 (鈴木宏明 著 東京大学出版会)

  認知心理学 (箱田裕司 編 有斐閣)

       ゲーム理論入門 (渡辺隆浩 著 日本経済新聞出版社)