ウェブ1丁目図書館

読書で得ること感じること。ここはウェブ1丁目にある小さな図書館です。本の魅力をブログ形式でお伝えしています。

確率を頭の中で考えるな!現場を見ろ。

パソコンの発達で、確率の計算は、表計算ソフトを使えば簡単にできるようになりました。

仕事で、よく確率や統計データを見たり、作ったりしている人は多いと思いますが、パソコンのおかげで作業が楽になったと感じているのではないでしょうか。

確率や統計データを作っている人は、それがどのようにして計算されたのかを十分に理解していると思います。でも、その確率や統計データを見せられても、いったいどうやってこのような数字になったのか、ちゃんと理解できない人はたくさんいます。そのデータを作った人の説明が下手なのかもしれませんが、ほとんどの場合、データを見せられた人は頭の中だけで結論を導き出そうとするから、確率や統計データをちゃんと理解できないのです。

事件は現場で起こっている

代々木ゼミナール数学科講師の山本俊郎さんの著書「高校生が感動した確率・統計の授業」は、確率計算は脳内だけで理解するのが難しいことを教えてくれています。

山本さんは、確率の本質をこのように述べています。

「事件は会議室で起きてるんじゃない。現場で起きてるんだ」
これは1998年公開の映画『踊る大捜査線THE MOVIE~湾岸署史上最悪の3日間!』の中で、主人公・青島俊作織田裕二さん)が発した言葉です。映画をご覧にならなかった方でも、テレビで流れた予告編でこの言葉を耳にされた方は多いはず。
(12ページ)

そう、確率は、このセリフのように会議室(脳内)で起こっているのではなく現場で起こっているのです。しかし、多くの人が、確率を脳内で計算しようとするから、ある確率を見せられて説明されても、納得できたようなできていないような、中途半端な理解になってしまいます。

例えば、「区別のつかない2枚の100円玉を投げたときに2枚とも表が出る確率はいくらか」を問われたとします。あなたは、これに正しく答えられますか?

まず、2枚の100円玉を投げた時、以下の3パターンがあることはすぐにわかりますよね。

  1. 2枚とも表が出る
  2. 1枚は表が出て、他の1枚は裏が出る
  3. 2枚とも裏が出る


結果は3通り考えられるから、2枚とも表が出る確率は3分の1と答えたくなりますが、これは間違いです。

わかりやすくするために10円玉と100円玉を同時に投げたとしましょう。そうすると、考えられるのは以下の4パターンです。

  1. 2枚とも表が出る
  2. 10円玉は表が出て、100円玉は裏が出る
  3. 10円玉は裏が出て、100円玉は表が出る
  4. 2枚とも裏が出る


そうすると、どちらも表が出る確率は4分の1となります。

まだ、よくわからない方は、2枚とも100円玉だったとしても、片方が平成10年の100円玉、もう片方が平成20年の100円玉だったとしましょう。この場合、どちらかが表となるのは、「平成10年が表で平成20年が裏」と「平成10年が裏で平成20年が表」の2つの場合が考えられますよね。区別のつかない100円玉2枚と言った場合も、考え方は同じで、片方だけが表となる組み合わせは2通りあるのです。

すべての組み合わせを把握することが大事

もう一つ問題です。

今、A君とB君の2人が2回ジャンケンをします。A君が2連勝する確率はどうなるでしょうか?

A君は勝つ場合と負ける場合があるから、1回のジャンケンでA君が勝つ確率は2分の1、それが2回連続で起こるから、2分の1に2分の1を乗じた4分の1が、A君が2連勝する確率だと思った方。

あなたは、引き分けもあることを忘れていますよ。

A君から見ると、ジャンケンは勝ち、負け、引き分けの3通りがあり、勝つ確率は3分の1。それが2回連続するのは、3分の1に3分の1を乗じた9分の1ですから、正解は9分の1です。おそらく、高校で確率・統計を勉強した方なら、このように計算して答えを導き出したはずです。でも、この考え方も、やはり、事件が会議室で起こっている人の考え方です。

事件が現場で起こっている人は、こう考えます。

まず、1回目のジャンケンでは、何通りの出し手があるのかを把握します。A君がパーを出した場合、対するB君はグー、チョキ、パーの3通りの中から1つを出すことになります。A君がグーの場合もB君の手は3通りですし、A君がチョキの場合もB君の手は3通りです。したがって、1回目のジャンケンで考えられる出し手は合計9通りあります。

次にA君が勝つ場合を考えます。A君がグーで勝つ時、B君はチョキを出しているはずです。A君がパーを出した場合は、B君はグーを出しています。A君がチョキならB君がパーでA君の勝ちです。つまり、A君が勝つのは3通りです。

したがって、A君は9通りあるパターンの中で3通りで勝つことができますから、A君の勝つ確率は9分の3、約分して3分の1となるのです。
f:id:daumaneko:20180415111750p:plain

では、2回目のジャンケンはどうなるでしょうか?

A君は、1回目のジャンケンでパーで勝ったとします。この場合、2回目のジャンケンでは1回目と同じく9分の3の確率で勝利します。
f:id:daumaneko:20180415111810p:plain

A君が、1回目にグーで勝った場合も、2回目は9分の3の確率で勝ちます。A君が、1回目にチョキで勝った場合も、2回目は9分の3の確率で勝ちます。

そうすると、1回目のジャンケンでA君が勝つ結果が3通りあり、2回目のジャンケンの結果がそれぞれ9通りあるので、考えられる2回目の結果は27通りです。その中で、A君が勝つ回数はそれぞれ3回ずつですから、1回目の勝ち手グー、チョキ、パーのそれぞれの場合の2回目の勝ち手を合計すると9通りになります。すなわち、1回目の3つの勝ちの結果から2回目にA君が勝つパターンは27分の9通りなのです。

したがって、A君が2連勝する確率は1回目と2回目の勝つ確率を乗じた9分の1となります。
f:id:daumaneko:20180415111829p:plain

1回目にパーで勝ったのなら、2回目のジャンケンの結果は9通りで、そのうち3通りがA君の勝ちですから、2回目に勝つ確率は27分の9ではなく、9分の3として計算するべきところです。でも、事件が現場で起こっていることをしっかりと意識するためには、考えられるすべての結果、この場合は27通りを書きだした方が良いです。

公式に当てはめれば、簡単に計算できますが、確率の本質を理解するためには、起こりうるすべての結果を把握することが大切です。

レインボーブリッジも封鎖しておけ

さて、先ほど「区別のつかない2枚の100円玉」という表現が出てきました。

片方の100円玉だけ表が出やすい細工がしてあれば、確率の計算が狂ってきます。2枚の100円玉が同質という前提があるからこそ、確率を計算できているわけですね。

踊る大捜査線の続編で、織田裕二さんが「レインボーブリッジ封鎖できません」と言う場面があります。確率や統計を考える際は、「事件が現場で起こっている」ことも大切ですが、「レインボーブリッジを封鎖する」ことも大切です。

よく、「国立××大学が、10万人を対象に10年間に渡って実施した大規模コホート研究の結果、足が臭い人は深夜1時以降に寝る習慣があることが分かった」という研究報告をネットニュースなどで見ることがあります。もしかしたら、「国立××大学」の研究だから、正しいに違いないと思う人がいるかもしれません。

10万人を10年間、追跡調査しようと思ったら、いったいどれだけの費用がかかるのか。10万人の就寝時刻と足の匂いを毎日チェックすることが可能なのか。それらをまず考えなければなりません。

普通に考えれば、被験者が増えれば増えるほど、期間が長くなれば長くなるほど管理が困難になることはわかります。つまり、10万人の被験者全員の就寝時間と足の匂いのチェックを10年間もチェックし続けることは、極めて難しいことなので、このようなコホート研究では意味のある結論を導き出しにくいのです。

たくさんの自動車やバイクが行き交うレインボーブリッジを封鎖するのにどれくらいの困難を伴うのかわかりませんが、確率や統計で確からしさを得ようと思うのなら、レインボーブリッジを封鎖するように対象期間中は被験者の行動を捕捉し続けなければなりません。

大規模コホート研究と聞くと、何かすごいことをやっているように思ってしまいますが、実行可能性を考慮するとアンケートを集計する程度のことしかできていないと想像する方が無難です。

高校生が感動した確率・統計の授業 (PHP新書)

高校生が感動した確率・統計の授業 (PHP新書)