ウェブ1丁目図書館

ここはウェブ1丁目にある小さな図書館です。本の魅力をブログ形式でお伝えしています。なお、当ブログはアフィリエイト広告を利用しています。

結果から原因を予測するベイズ統計

物事の結果には、何か原因があるもの。

ある出来事が発生すれば、その前には必ず原因があるはずです。

例えば、交通事故が起こったら、なぜ、その時、その場所で交通事故が起こったか、原因を探ろうとします。運転手が居眠りをしていたのではないか、信号無視をしたのではないか、スピードを出しすぎていたのではないか。このように考えるのは、交通事故の原因が運転手の過失にあることを前提としています。一方、信号が設置されていなかった、ガードレールがなかった、車道と歩道の区別がなかったなどを事故の原因として挙げる場合は、道路の整備状況に事故の原因があるのではないかと疑っています。

どちらの場合も、事故の原因を推理する人の主観であり、これだと、真の事故の原因にたどり着くのが難しそうです。

主観だけに頼らず、真の事故の原因を見つけるにはどうすれば良いでしょうか。その助けとなるのが、原因の確率を結果から予測するベイズ統計です。

結果から原因を予測するとは

ベイズ統計は、数学者のトーマス・ベイズさんが書き残した遺稿をもとに生まれた統計の手法です。

何やら難しそうに思えますが、統計コンサルタントで統計アナリストの石村貞夫さんの著書「『超』入門 ベイズ統計」を読むと、その初歩的な内容を理解できます。

同書では、殺人事件の犯人をベイズ警部が捜査する過程で、ベイズ統計の説明が行われていきます。被害者は毒殺され、男女3人が容疑者として捜査線上に浮かびあがります。いずれの容疑者も、被害者と過去にトラブルを起こしており、怨恨から殺害にいたった可能性があります。

ベイズ警部は、3人のプロファイリングをし、専門家の助言を得ながらベイズ統計を使って犯人を絞り込んでいきます。そして、ついにベイズ警部は、犯人を見つけ出すことができました。


ベイズ統計は、結果から原因を予測するものです。では、どうやって結果から原因を予測するのでしょうか。

ベイズ警部は、パブでよくお酒を飲みます。誰でも、お酒を飲めば酔うことがあります。でも、酔わないこともあります。酔う原因はお酒を飲むからなのですが、では、酔っぱらっている人がどの種類のお酒を飲んだかを予測できるでしょうか。

ベイズ警部が通うパブには、エール、赤ワイン、スコッチの3種類のお酒があり、パブの女主人によれば、客は、60%でエール、30%で赤ワイン、10%でスコッチを注文しているとのこと。

また、ベイズ警部がパブの客にアンケートを取ったところ、以下の回答を得られました。

  • エールを飲んで酔っ払う確率=28/49
  • 赤ワインを飲んで酔っ払う確率=9/25
  • スコッチを飲ん酔っぱらう確率=13/17


これだけのデータがあれば、ベイズ統計を使えば、パブで酔っぱらっている客が、どのお酒を注文したかを予測することが可能です。

通常であれば、アルコール度数が高いお酒を飲むと酔いやすいので、酔っぱらっている人は、3つのお酒の中で最もアルコール度数の高いお酒を飲んだ人だと予測するのではないでしょうか。でも、酔うかどうかは、酒量の影響も受けるので、アルコール度数の低いお酒の方がたくさん飲んで酔う可能性が高くなるはずだとも考えられます。

こんなことを考えていると、主観で犯人を決めつけてしまいかねません。

すでに起こった結果から原因を探る方が、冤罪を防ぎやすくなるでしょう。

酔っぱらっている状態から飲んだお酒を予測する

パブに来た91人の客のうち50人が、お酒を飲んで酔っ払っています。

その酔った客50人のうち28人は、エールを飲んで酔っ払っていますから、なんとなくでも、酔っぱらっている客が飲んだお酒はエールの可能性が高そうだと予想できます。

でも、もうちょっと詳しく計算してみないと、エールを飲んで酔っ払う確率はわかりません。


お酒を飲んだ客全員のうち酔っ払う客の確率は、それぞれのお酒を注文する確率にそのお酒を飲んで酔う確率を乗じた確率の合計となります。


エール=60%×28/49=34.29%
赤ワイン=30%×9/25=10.80%
スコッチ=10%×13/17=7.65%
合計=34.29%+10.80%+7.65%=52.74%→52.7%


このお酒を飲んで酔っ払った客の割合52.7%で、エールを注文して酔っ払らった客の確率を除せば、飲んだお酒がエールである確率を求めることができます。


飲んだお酒がエールである確率=(60%×28/49)/52.7%=65.1%


したがって、パブで酔っぱらっている客は、65.1%の確率でエールを注文したに違いありません。

確率や統計だけでは事実はわからない

パブで酔っぱらっている客は、エールを注文したに違いない。

そう決めつけたくなりますが、酔っぱらっている客のうち、約3分の1の客は、赤ワインかスコッチを注文した可能性があります。

いや、その日は赤ワイン同好会がパブを貸し切っていて、皆、赤ワインしか注文していなかった場合には、酔っぱらった客全員、赤ワインが原因で酔ったはずです。

確率や統計だけで事実を知ることはできません。むしろ、確率や統計をどんなに駆使しても、得られるものは確からしさでしかありません。

ベイズ警部は、ベイズ統計を使って見事に犯人にたどり着きましたが、捜査の過程で見落としていたものに気づきました。

それはいったい何だったのか。「『超』入門 ベイズ統計」を読んでのお楽しみです。


ベイズ統計は、結果から原因を探る点で、結果が行動の頻度に影響を与えるとする行動分析学と視点が似ています。両者を同時に勉強することで、それぞれの理解がより深まるかもしれませんね。