条件によって確率は変化していきます。統計学の手法は帰納法であり、仮説法や演繹法とくみあわさってただしい認識をもたらします。
グラフィックサイエンスマガジン『Newton』2019年4月号では「統計と確率」を特集しています。その PART 3 は「ベイズ統計」です。
あなたの前には、三つの箱(A,B,C)があります。そのうち、一つには当たり(ダイヤモンド)が入っており、残りの二つははずれ(石ころ)です。ショーの司会者は、どの箱に当たりが入っているかを知っています。(中略)
あなたはAの箱を選びました(まだ開けません)。すると司会者は(中略)Cの箱を開けました。もちろん中ははずれでした。そして司会者は次のように話します。「さぁ、残る箱はAとBの二つ。あなたの選択はAのままでよいですか? Bに変えてもかまいませんよ。どうしますか?」
はたして、あなたは箱を変更したほうがよいのでしょうか? 変更しないほうがよいのでしょうか?
このゲームは、1960年代のアメリカのテレビ番組でおこなわれたものであり、番組の司会者の名前から「モンティ・ホール問題」とよばれています。司会者が、当たりの箱をしっていることが前提であり、司会者が、当たりの箱をあけないため(はずれの箱をへらしてくれるため)、司会者が、はずれの箱をあける前と後とで当たりの確率が変化します。
ある現象Xがおきたときに、別の現象Yがおきる確率を「条件つき確率」とよびます。この例でいえば、はずれの箱を司会者があけたときに、最初にえらんだ箱Aが当たりである確率が条件つき確率です。条件つき確率は、状況がかわった場合でも現状を把握し、未来の選択をすることに役立ちます。
このような、条件つき確率をもとめるための統計学を「ベイズ統計」とよびます。
たとえば、ある男性が「がんであれば80%の確率で陽性になる検査」を受けて、「陽性」という結果が出たとします。単純に考えると、この男性は80%の確率でがんであるようにも思えてしまいますが、実はそうではありません。ベイズ統計を使うと、陽性という結果が出たときに、その原因がほんとうにがんである確率を求めることができます。
「ベイズの定理」をつかって計算してみると、検査で陽性だった場合にほんとうにがんである確率は約4.6%になります。
このように、ベイズ統計とは結果から原因を推測する統計学であり、みぢかなところでは「迷惑メール」の判定にも利用されています。ベイズ統計では、あらたな情報(条件)が追加されると、それにともない確率が変化して(更新されて)いき(これを「ベイズ更新」といいます)、迷惑メールの判定では、単語が追加されるごとに迷惑メールである確率が更新されます。
ベイズ統計には、よくわからない情報についてはとりあえずの値を設定し、そのご補正をしていくというかんがえかたがあり、これは、人間の知能を模した AI(人工知能)と相性がよく、「形の識別」や「病名診断」など、さまざまな分野で応用されています。AI とは、ごく単純にいってしまえば、統計学や確率論にもとづいて「判定」や「分類」をおこなうコンピュータープログラムであり、「学習」することで精度をあげていくので、ベイズ統計は、AI に応用しやすい手法になっています。
今日、フェイクニュースや統計不正などが社会的な大問題になっています。その情報は本当にただしいのだろうか? 情報のなかにひそむただしさあるいは不正をみぬく手法として統計と確率がおおきな役割をはたします。統計と確率はまさに現代社会のための数学です。基本的なかんがえかたをしっておくだけでもだまされにくくなります。
*
以上、今回の『Newton』の特集でみてきたように、統計と確率は、たくさんの情報から一般的傾向や規則性をつかむために有効であり、一般的傾向や規則性がわかれば判断や選択がしやすくなります。
つぎのような事例もかんがえてみましょう。
事例(イ)
- 太郎さんが、箱のなかから鉱物を1個とりだしました(箱のなかには鉱物がたくさんはいっていますが なかをみることはできません)。
- とりだした鉱物をよく観察してみたらルビーでした。
- 箱のなかのたくさんの鉱物はルビーであるとかんがえられます。
しかし箱のなかの鉱物がすべてルビーであかどうか? それをたしかめるためには、もっとたくさんの鉱物を箱のなからとりだしてしらべなければなりません。しかし一般的には全部をとりだすことはできないので(全数調査はできないので)、標本調査をおこないます。このようなことを計算によっておこなうのが統計学であり、実社会においてとても有用な論理になっています。
ところでつぎのような思考(論理)もありえます。
事例(ロ)
- 机のうえにルビーがおいてありました。
- 箱のなかにはルビーがたくさんはいっています(そのことがわかっています)。
- このルビーは、その箱のなかから誰かがとりだしてここにおいたのではないだろうか、という仮説をたてることができます。
事例(ハ)
- 箱のなかはみることはできませんがなかには鉱物がたくさんはいっており、それらはルビーであることがわかっています。
- その箱のなかから鉱物をとりだせば、
- それはルビーである(ルビーをみることができる)、と予見あるいは推論できます。
事例(イ)の統計学的手法は帰納法、事例(ロ)は仮説発想法(あるいは仮説法、発想法)、事例(ハ)は演繹法といってもよいです。人間がおこなう論理はこの3つが基本であり(この3つしかなく)、統計学(帰納法)は、演繹法や仮説法と対比してみるとその位置づけ・役割がよくわかります。
また統計学的手法(帰納法)によって「箱のなか」がわかると、それが、仮説法と演繹法をすすめるときの前提としても役立ちます。
あるいはつぎのような事例もあります。
事例(二)
- ゴミ置き場のゴミ袋がやぶられて、ゴミが路上に散乱していました。(事実)
- カラスは、人間のゴミをくいあらす習性をもつとよくいわれます。(前提)
- ゴミ置き場のゴミをちらかしたのはカラスではないだろうか。(仮説)
これは仮説法であり、「犯人はカラスではないだろうか」とかんがえています。
事例(ホ)
- カラスは、人間のゴミをくいあらす習性をもつとよくいわれます。(前提)
- ゴミ置き場のゴミをちらかしたのはカラスではないだろうか。(仮説)
- ゴミ置き場のゴミをあさりにカラスがまたやってくるにちがいない。(事実予見)
これは演繹法であり、前提と仮説にもとづいてカラスの行動を予見したのですから、あとは、ゴミ置き場にはやめにいってカラスが本当にやってくるかどうかを観察・確認します。確認できれば仮説の確度がたかまります。あるいは仮説が証明できたことになります。
事例(ヘ)
- ゴミ置き場のゴミをちらかしたのはカラスではないだろうか。(仮説)
- ゴミ置き場のゴミをちらかしているカラスを観察する。(事実)
- カラスは、人間のゴミをくいあらす習性をもつ。(前提、一般的傾向)
これは帰納法です。しかしカラスの「人間のゴミをくいあらす習性」が特殊ではなく一般的であることを科学的・客観的にしめすためには多数回の観察・観測により多数の事実を確認しなければならず、さらに事実をデータ化し、それらを統計学的に処理することによって、カラスの一般的習性をあきらかにしなければなりません。
このように、仮説をまずたて(あるいはモデルをつくり)、つぎにその仮説(モデル)のもとで観察・観測をくりかえしてデータをあつめ、たくさんのデータを処理して一般的傾向や規則性をつかむのが帰納法であり統計学的手法です。
ただし仮説(モデル)をまずたてるときには仮説法がつかわれ、仮説は、演繹法によって検証されて確度がたかまったり、修正されたりします。仮説は最初は不完全なものでもよく、不完全な場合は、観察・観測事実によって修正されることになります。
こうして仮説(モデル)は、演繹法と帰納法をうみだす母体としての役割もはたします。演繹法と帰納法では、数学をつかった分析的方法が重視されるのに対し、仮説の発想では直観が重要です。
以上のような過程によって、対象や現象の一般的傾向や規則性があきらかになり、それらがひろく社会でみとめられるようになります。一般的傾向や規則性の究極は法則とよばれ、法則がわかれば未来予測がおのずとできるようになります。
▼ 関連記事
確率をこえられるか -「統計と確率」(Newton 2019.4号)-
統計の基本をしる -「統計と確率」(Newton 2019.4号)-
論理をすすめる -「統計と確率」(Newton 2019.4号)-
仮説をたて検証する - 仮説法(発想法)と演繹法の活用 -
真実への推理 - 名探偵コナン 科学捜査展(日本科学未来館)-
▼ 参考文献
『Newton』(2019年4月号)ニュートンプレス、2019年