自然界では1から始まる数字が多く、9から始まる数字は少ない…2万件超のデータから判明した不思議な法則
数字は噓をつかないが噓つきは数字を使う
Profile
数字の不正を見抜く方法はあるのか。数学史ライターのFukusukeさんは「アメリカの物理学者フランク・ベンフォードが発見した『ベンフォードの法則』というものがある。実用的に思えない法則だが、実際にアメリカの大統領選でも議論の引き金となるなど社会で応用されている」という――。 ※本稿は、Fukusuke『教養としての数学史』(かんき出版)の一部を再編集したものです。
自然の数字には「出現率」がある
図表1は日本の都道府県別の人口をまとめたものだが、とりわけ、最も位の高い数字に注目してほしい。
最高位の47個の数字の中で、最も頻繁に出てくる数字を実際に数えてみると、図表2のようになる。
「1」が圧倒的に多いことがわかる。
「だから何だ」「偶然ではないか」で片付けてしまえばそれまでだが、2万件以上のデータから最高位に現れる数字に隠れた法則を見つけた人物がいた。
その人物が、アメリカの物理学者フランク・ベンフォードである。彼はデータにおける最高位の数字は「1」が最も多くなることを「ベンフォードの法則」として発表した。実用的に思えない法則だが、実際にアメリカの大統領選でも登場し、議論の引き金になった。本記事ではベンフォードの法則が成り立つ理由や活用例について見ていこう。
「ベンフォードの法則」
まず、ベンフォードの法則を解説する。
自然界に出てくる数値と聞くと、感覚的には「1」から始まる数値と「9」から始まる数値の個数は同じように思える。しかし、ベンフォードの法則によれば「1」から始まる数値が登場する確率は、「9」から始まる数値が登場する確率の6.5倍だ。
この法則は経験則だけではなく、数学的根拠も与えられている。
「自然界に出てくる数値」というのは、比でスケールする数値のことである。森林面積、人口、株価などがそれにあたり、ニュースなどでも「前年度比」とか「前日比」といった比率で語られることが多い。現実的ではない例だが、人口が毎年2倍でスケールした場合、1万人から10万人に増えるまでに3年ちょっとかかる。このときの増え方を1カ月単位で表したのが図表3である。
これを見ると最高位の数字が「1」である期間が最も長いのがわかる。また、1~9の数字に対して、その数字が最高位となる期間の長さをグラフにすると図表4のようになる。
人口が増える割合を現実的な数値に変えてもこの傾向は変わらない。
ベンフォードは自然界におけるさまざまな数値について調べ、それらが比でスケールしていくことを明らかにした。1~9までの各数字の登場確率は図表5のように、対数を使って表すことができる。
人口がスケールしたときのグラフとベンフォードの法則のグラフは同じ形をしているのがわかるだろう。