〈仮説→事実→一般〉とすすみます。グラフをつくり、方程式をみちびきます。予測ができます。
統計の達人とよばれる、スウェーデンのハンス=ロスリング博士は統計の役割についてつぎのようにのべています(注)。


一つは、身のまわりの現象からデータを集め、データが何を意味しているのかを、一目でわかるように示すことである。

もう一つの役割は、未知の結果を推定することである。


たとえばワイン愛好家にして経済学者のオーリー=アッシェンフェルター教授は、統計を駆使して、ワインの将来の価格を予測しました(注)。ワインの価格は、生産された年によってことなり、また時間がたつにつれて変化していきます。

アッシェンフェルター教授は、ワインに関係する要素をたくさんしらべあげ、つぎの4つが、おおきな影響を価格にあたえる重要な要素であるとかんがえました。


それは、原料であるブドウがつくられた年の「4〜9月の平均気温」と「8、9月の雨の量」、そして「収穫前年の10月〜3月の雨の量」、「ワインの年齢(つくられてからの経過年数)」だった。


  • 4〜9月の平均気温
  • 8、9月の雨の量
  • 収穫前年の10月〜3月の雨の量
  • ワインの年齢

そしてこれらの要素のデータをたくさん収集し、要素を横軸に、ワインの価格を縦軸にとり、各データを配置しました。このようなグラフを「散布図」といいます。

その結果、たとえば「4〜9月の平均気温」(ブドウがそだった夏の平均気温)がたかいほど、ワインの価格もたかくなる傾向がみとめられました。これを「正の相関」といいます。あるいは「8、9月の雨の量」(ブドウがそだった夏の降雨量)がおおいほど、ワインの価格はひくくなる傾向がありました。これを「負の相関」といいます。このように、2つの要素を比較してそれらの間の関係をしらべる統計手法は「相関分析」といいます。

さらにアッシェンフェルター教授は、えられた散布図から、つぎの「ワインの方程式」をみちびきだしました。この手法は「回帰分析」とよばれます。


 〔前年の10月〜3月の雨の量〕× 0.00117
ー〔8,9月の雨の量〕× 0.00386
+〔4〜9月の平均気温〕× 0.616
+〔ワインの年齢〕× 0.02358
ー 12.145
= ワインの価格








以上の過程を整理するとつぎのようになります。

アッシェンフェルター教授は、ワインに関するさまざまな要素を徹底的にしらべあげ、それまでの経験もふまえて、4つの要素が、おおきな影響を価格にあたえているのではないだろうかとかんがえました。つまり仮説をたてました。

つぎにこれらの要素のデータを大量にあつめました。データとは、数値などで事実を記述したものです。

そしてデータがかなりあつまってきた段階で散布図(グラフ)をつくり、相関関係をあきらかにしました。

さらにえられた散布図にもとづいて「ワインの方程式」をみちびきだしました。この方程式が、ワインの価格変動の一般的傾向・規則をあらわすのであり、おおげさにいえば「ワイン価格の法則」がわかったことになります。

以上のように、仮説をたてて、データ(事実)を収集し、一般的傾向や規則・法則をあきらかにする論理(方法)は帰納法とよばれます(図)。統計は帰納法の技術化といってもよいでしょう。


200612 一般

図 帰納法のモデル


こうして帰納法によって方程式がもとめられると、あとは、具体的な数値を方程式に代入するだけで今後の価格を予測することができます。こうした方法は、自然科学や医学でもつかわれており、たとえば物理法則も、この例と同様に帰納法であきらかにされ、方程式でしめされます。 

おなじワイナリーであっても、ワインの味そして価格は、ワインが生産された年によっておおきくことなります。できたてはおいしくなくても10年後においしくなるワインもあります。ワインの価格ほど予測がむずかしいものはありません。それまでは、ワインの専門家と称する評論家の意見を参考にするしかありませんでしたが、彼らの予測ははずれることがおおく、論理的な方法がもとめられていました。

なお上記の過程でみおとされがちな注意点として仮説の立案があります。仮説をたてないで、やみくもにデータを大量にあつめているだけだと途方にくれます。ワインに関する要素は、気温・雨量・年齢以外にも、日射量や湿度・風・土壌成分・品種など、たくさんありますが、アッシェンフェルター教授は、上記の4つが重要な要素(指標)であるという仮説をたて、これらに集中してデータをあつめました。

このような観点からは、調査は、大型で高性能な機器をつかって大規模にやればよいというわけではないこともわかります。大規模調査が有利だとはかならずしもいえません。規模のちいさな調査でも適切な仮説をたててデータを収集すれば全体像や本質がつかめます。むしろ、小規模調査で明瞭な傾向をつかむことのほうが重要です。

そのためには、課題にかかわる周辺情報をどれだけつかんでいるかや、ものの見方、社会・文化などに関する理解も前提として大事です。今回の例では、アッシェンフェルター教授がワイン愛好家であったことがよかったです。ワインに興味のない人が、しょうがなく “仕事” でやっているだけだと仮説がうまくたてられません。



▼ 関連記事
新型コロナウイルスの感染拡大と〈仮説法→演繹法→帰納法〉
論理の3段階モデル - 新型コロナウイルスの感染拡大 -
仮説法・演繹法・帰納法 -「統計」(Newton 増刊 2)-
論理をすすめる -「統計と確率」(Newton 2019.4号)-
予測の論理とカオス -『天気予報の科学』(Newton)-


▼ 注:参考文献
『Newton 統計の威力』(Kindle版)ニュートンプレス、2015年
スクリーンショット 2020-06-12 19.17.44