新刊【イラストエッセイのはじめかた】はこちらから

統計学が最強の学問である、読了

 ヨビノリチャンネルの確率統計の流れで、ひと昔前のベストセラーであるこちらの本を読んでみました。「統計学が最強の学問である」です。

著:西内 啓
¥1,267 (2024/11/20 10:55時点 | Amazon調べ)

 なかなか刺激的なタイトルですが、中身は他の学問との比較や統計学がいかに優位か、といったものではなく、ビッグデータで統計学が現実味を持って実用される時代になり、統計学を使いこなせると他と差別化できるよ!といったメッセージだと私は受け取りました。

ビッグデータという言葉自体はキャッチーで「これだけデータがあれば何でもできそうだ」と思わせるものがありますが、莫大なデータを扱うための投資額と、それから得られる利益が見合っているのか?という問題にまず答えなければなりません。たとえば男女比のような想定解が少ない(男か女かそれ以外など)ようなものに関しては、データの点を1万点増やしても標準誤差は0.1%ほどしか変わらないので、果たしてビッグデータは必要か?となります。

一方で、物質の構造計算など無限に候補があるようなものを対象としてスクリーニングする場合はビッグデータを扱う意味が出てきそうです。

この本では、ビジネスを主題としているため「正しい判断のための必要最小のデータ」で話が進むので、いわゆるビッグデータの扱い方的な話は出てきません。むしろ紙と鉛筆で統計を行なっていた時代はどうやっていたのか?という私たちにも分かりやすい古の統計学からはじまり、天才フィッシャーの逸話など、どうやって統計学が生まれてきたのか、何に役立ってきたのかという歴史的なお話が序盤の主なハイライトです。

この逸話たちが面白く、この本の冒頭の「あみだくじに勝つ方法」や、フィッシャーの「紅茶にミルクを注いだのか、ミルクに紅茶を注いだのかが分かる夫人へのテスト」などには、今はやり?の「ファクトフルネス」や「ナンバーセンス」に通じる数字に騙されない、感覚やバイアスに騙されないといった統計リテラシーのエッセンスが詰まっていると思います。

 この本の中でかなりの分量を割いて丁寧に説明されるのが、統計学の歴史の中で革新的だった「ランダム化比較試験」です。「ランダム化」によって「フェアな比較」ができ、莫大なデータを必要とせずとも結論を導き出せるという話は、分かってはいても「でもそれでいいんだっけ・・・?」という疑問を人に抱かせます。

具体的には、

「全国民からのランダムサンプリングではないので信用できない」

「この結果を一般化できるのですか」

といった、統計から得られた結果が果たしてビジネスに有用なのかという話である。著者もこの問いには「学問的な視座の違い」であると答えており、状況によって適した答えは異なるという話に落ち着いています

たとえば、タバコと癌には関連性があるのか?といった問いには、多くの統計結果と医学的な根拠をもって「尤もらしい」とされているように、他に結果を支持する報告があるかだったり、もしくはその結果がどれほどインパクトあるのか(薬効なのか健康補助食品か?)といったものによって統計データが使えるかどうかが異なるでしょう。

統計データを提供する側も、読み解く側も、統計リテラシーが求められる時代であり、アナリストとして働く私としては「分かりやすく説明する」ことが大切だなと身に沁みました。

よかったらシェアしてね!
  • URLをコピーしました!
目次