ウェブ1丁目図書館

ここはウェブ1丁目にある小さな図書館です。本の魅力をブログ形式でお伝えしています。なお、当ブログはアフィリエイト広告を利用しています。

統計分布から世の中の傾向を読み解く

統計が氾濫している。

そう感じるのは僕だけでしょうか。

統計データを持ち出して、事実はこうだと論じる人が増えているように思うのは、ネットの普及でそのような主張を見かける機会が増えたからかもしれません。そして、統計を使って説明されると、妙に納得してしまうところもあります。その主張がまちがっていたとしても。

統計にはグラフがついてくる

統計を使って自論を展開する人を見て説得力があるなと思えるのは、グラフを示されるからかもしれません。グラフを見せられるだけで、なんか頭が良い人が話しているから、きっと正しいんだろうなと思ってしまいます。

でも、グラフを使えば、誰だって、それっぽいことを言えます。変な理屈であっても、グラフを使えば1本筋が通った主張になっているように思えるものです。

理学博士の松下貢さんの著書『統計分布を知れば世界が分かる』を読めば、グラフを見せられただけでは簡単に納得しなくなるでしょう。

統計データを見やすくするためにグラフが使われることが多く、統計にグラフはつきものと言っても過言ではありません。

例えば、日本人の平均身長を求める時に集めた個々人の身長のデータ。平均身長は、集めたデータの全員の身長の合計を人数で割ると求められます。男性なら170cmくらいが平均身長になるそうです。平均身長が170cmなら、実際の身長が170cmくらいの人が最も多くなると予想されます。それをグラフで表すとすれば、横軸に身長、縦軸に人数をとったものとなるでしょう。

さて、出来上がったグラフがどうなるかというと、確かに身長が170cmの人の数が最も多くなり、170cmから離れていくほど人数が少なくなっていきます。このグラフは、身長170cmを中心に左右対称の釣鐘型になることがわかっています。このような釣鐘型の統計分布を正規分布といいます。

また、地震が一定期間に起こる頻度を調べると、弱い地震が圧倒的に多く、強くなるにつれて地震の発生回数が少なくなっていきます。この地震の頻度を視覚的に見やすくするために横軸に地震の大きさ、縦軸に回数をとったグラフを作成すると、右下がりの曲線になります。このような統計分布をべき乗分布といいます。

正規分布とべき乗分布が合わさった対数正規分布

正規分布とべき乗分布のグラフは見ることが多いと思います。

学校の試験の成績をグラフにすると正規分布になりやすいですし、競馬で勝った馬の人気をグラフにすると人気が低くなるほど勝利数が少なくなっていくべき乗分布になりやすいです。

世の中の様々な物事の傾向は、正規分布やべき乗分布で表されそうですが、それら以外にも対数正規分布で表される物事もあります。

対数正規分布は、正規分布とべき乗分布が合わさった形をしたグラフになります。例えば、日本人の体重は、身長と同じように平均くらいが最も人数が多い釣鐘型のグラフとなります。しかし、体重の場合は、身長と異なり、平均体重を中心に左右対象とはならず、体重が軽い人の人数よりも重い人の人数の方が多くなるグラフが出来上がります。

平均体重付近を見れば正規分布に見えますが、体重が重たい人の人数が軽い人の人数よりも多く、右下がりにだらだらと長い曲線が描かれているのを見るとべき乗分布のように見えます。

このような正規分布とべき乗分布が合わさったような対数正規分布は、世界各国のGDP、個人所得、町村人口等に見られます。

格差は拡大しているのか縮小しているのか

本書のタイトル『統計分布を知れば世界が分かる』が示すように対数正規分布を使うことで、社会の傾向を把握することができます。

最近、話題になることが多い貧富の格差問題も、対数正規分布のグラフから読み解けます。

格差は拡大しているのか、縮小しているのか。これについては、拡大していると主張する人もいれば、縮小していると主張する人もいます。どちらの見解が正しいのか、対数正規分布のグラフからは格差は拡大していると見ることができます。

格差が少ない社会であれば、個人の所得のグラフは身長と同じような正規分布になるはずです。しかし、実際の社会には超が付くほどの大金持ちがいるので、グラフで見ると対数正規分布になります。

ただし、典型的な対数正規分布になるのではなく、超大金持ちの人たちは対数正規分布から外れ、彼らにより多くの富が集中する傾向が見て取れます。また、超極貧層も対数正規分布から外れ、さらに貧しい方向に移行しているのも見て取れます。

ということで、対数正規分布から貧富の格差がどうなっているのかを分析すると、その格差は拡大方向にあると言えそうです。


一つの事実に対して、まったく異なる2つの見解が主張されるのは、なぜなのでしょうか。

それは、統計データを自分の主張の都合に合わせて使うことができるからでしょう。これからも、統計を使って自論を展開する人は増えていくでしょうから、それが正しいかどうか判断できるよう統計の初歩的な知識は持っておきたいですね。