HOME » 医学の地平線 » 第148号 再び、確率のない国

医学の地平線

第148号 再び、確率のない国

約10年前、2015年に「確率のない国」と題した文章を掲載しました。

https://www.tufu.or.jp/horizon/2015/1182

確率の概念のない国があって、そこでは「あるかなし」ですべてが決まり、わからない事は「アバウト」という分類となる、という内容です。その国では目に見えるモノが重視され、情報が軽視される傾向があり、そのため大きな問題が起きるという趣旨でした。アバウトの世界では個人の好みでどうとでも主張でき、それを論理的に解決する方法が無いからです。

最近、重要性が増しているAI(人工知能)においても確率は最も重要な中心的概念です。例えば、ChatGPTでは学習過程においては単語(正しくはトークン)の確率を推定しており、生成過程においては、その推定された確率に基づき単語が選択されています。AIの1兆個にもなるパラメータを備えたシステムの全体は、この確率を推定するための道具なのです。

確率とは何か?

今回は、「確率」についてもっと詳しく考えてみます。

確率は「割合」に似ていますが、少し異なった概念です。割合は過去の現実ですが、確率は未来の予測という違いがあります。つまり、未来の予測(過去の事でも不明の事実を知りたい場合もある)のために、過去の割合の概念を利用するわけです。過去は確実ですが未来は不確実なので、それをつなぐ概念が「確率」なのです。従って、確率のない国では過去を踏襲する限り(未来の予測に過去の結果をあてはめる)物事はうまくいきますが、環境が変化すると対応が難しくなります。従って、確率のない国は環境の変化に弱いのです。

確率は出来事(an event)の関数

サイコロを投げる行為を考えてください。投げる前は出る目(結果)はわかりませんが、投げた後は出た目(結果)は明らかです。英語でいえば、投げる前はan outcomeですが、投げた後はthe outcomeになります。出る目を1とすると、投げる前は確率1/6、投げた後は確率という概念は消えますが、しいて言えば確率は0か1になります。しかし、確率はan outcomeに対応するだけではなくoutcomesにも対応します。このような結果の集合の事を出来事(event)と言います。例えば「偶数の目」と言う出来事は、2, 4, 6のそれぞれの目が出るという結果の集合となります。出来事も、サイコロを投げる前はan eventですが、投げた後はthe eventになります。投げた後の結果(the outcome)が、その出来事(the event)に含まれるとき、「その出来事が起きた」といいます。そして、確率はan eventの関数であり、その値は0以上1以下となります。

このように、冠詞や単数複数の違いを区別しないと確率を理解する事は難しいのです。ここに、日本社会が確率を理解することが容易ではない理由があります。不確実な対象(an outcome, an event)を理解することが容易ではないからです。

生物界も物質界も確率に支配されている

確率の概念はギャンブルから始まっています。しかし、本格的に自然科学に応用された例は、19世紀に発表されたメンデルの法則(1865年)とボルツマン分布(1868年)です。前者は生物世界において、後者は物質世界において、本質的原理は「確率」であることを初めて示しました。しかし、いずれも19世紀の間は注目されていません。両発表者の死後、20世紀になってメンデルの法則は1900年にドフリス、チェルマク、コレンスにより、ボルツマン分布は1900年にプランク(黒体輻射)により再発見され、アインスタイン(1903年、ブラウン運動)により物理界の大発見として認められるようになります。

等確率による確率の定義

それでは確率はどのように定義されるでしょう。ギャンブルに始まった確率の定義は「等確率の原理」です。サイコロに不正が無ければそれぞれの目が出る確率は同じ(等確率)と考えます。そのため1の目が出る確率は1/6となるのです。しかし、サイコロがいかさまで歪んでいたら等確率とはなりません。

頻度論による確率の定義

そこで、サイコロを何回も投げて、1の目が出た割合を確率とするという「頻度論による確率」の定義ができました。これはメンデルがエンドウ豆を数多く集めて、その割合から確率を推定するという方法を用いた事例に相当します。このように頻度論による確率は、遺伝学にぴったり合うのです。その理由は、遺伝学における確率が極めて安定で変化しないという事実に基づいています。初期の統計学では遺伝学が中心的役割を果たしたので、頻度論による確率が広く受け入れられていました。

ベイズ確率

しかし、統計学が社会学、経済学、心理学、気象学などに応用されるとそうは行かなくなります。メンデルの法則のように安定した確率を定義することが実際的ではないのです。そこで、「ベイズ確率」がしばしば用いられるようになりました。

例えば、ジョーカーのない52枚のトランプカードからAさんが1枚引きます。それはハートのエースでした。次にBさんが残りの51枚のカードから1枚を引きます。この時、Bさんのカードがスペードのエースである確率はいくつでしょう。もし、BさんがAさんのカードの情報を知らなければ、確率は1/52です。しかし、Aさんのカードの情報を知ったとたんに1/51になります。つまり、BさんがAさんのカードの内容を知るか知らないかで確率が変化します。

このように変化する確率とは一体何でしょう。このような場合、確率とはBさんの信念の強さという事になります。最初はスペードのエースであるという信念の強さが1/52でしたが、Aさんのカードのデータがわかったとたんに、それは更新され1/51になったのです。数学的には事前確率を1/52とし、条件付確率を整理したうえで、事後確率を1/51とすることで計算できます。これがベイズ確率です。

公理的確率論による確率の定義

しかし、確率を本当に心の問題と考えてよいのでしょうか。それは非科学的と言えないでしょうか。実際にベイズ確率が科学界で認められる前に激しい論争があったのです。特に遺伝学者は確率が変化しないと信じていたので、激しく反対しました。ただし、確率のない国では、この論争はほとんど起きませんでした。この論争は、量子力学における不確定性原理をめぐる論争と類似しています。

そこで、確率を数学的に厳密に定義するという試みがなされました。コルモゴロフによる「公理的確率論に基づく確率」の定義です。正確な定義は成書を参考にしてください。大まかにいうと、確率はan outcomeの集合であるan event = outcomesの関数であり、値域は[0,1]です。複数のeventsが互いに排他(重ならない)場合は、それぞれのeventの確率を加えて、events全体の確率としてよい、という内容です。以上は、outcomeが数えられる場合ですが、数えられない場合(実数のように)も特定の条件を付けて適用できます。

20世紀は情報の時代

私は20世紀を情報の時代と考えています。メンデルとボルツマンという先駆者による生物界、物質界における確率の重要性の再発見は1900年に行われています。物理的対象が観察により変化するという相対性理論、量子の存在さえ観察に依存するという不確定性理論も20世紀初めに発表されています。そして、その情報の時代の最終到達点が人工知能です。約40億年前に出現した「遺伝子情報システム」が、約7億年前に「脳情報システム」を作り、それが21世紀になって「AI情報システム」を作ったのです。つまり情報システムは約40億年の歴史をもって進化してきたのです。

21世紀のフロンティアはエネルギーとエントロピー

そして、21世紀のフロンティアは「エネルギーとエントロピー」であると考えられます。ペレルマンによるポアンカレ予想の証明、宇宙の加速膨張を説明するダークエネルギー、ブラックホールのエントロピーが境界表面積に比例する事に基づくホログラフィック宇宙論、バーリンデによるエントロピー重力、脳科学におけるフリストンの自由エネルギー原理、AIの原理としてのエネルギー最小化、エントロピー最小化。これらすべてが、エネルギーとエントロピーという概念を中心概念として取り入れています。それなしに21世紀の科学は発達しなかったでしょう。

AIには様々な問題点があることもわかってきました。しかし、AIの属する情報の分野から、その解決法は出にくいと考えています。近い将来、AIの問題点がエネルギーとエントロピーという視点から議論されると予測しています。

日本の改善点

さて、日本は情報に疎く、暗号解読、機械制御、統計学が弱く太平洋戦争に負けました。また製造業では大成功しましたが情報産業が不得意で、世界の中の経済的地位は低下を続けています。科学も情報を取り入れる力が弱く、同じく衰退を続けています。

その改善策として、私は「不確実性と確率」を論理的に理解するための教育の重要性を主張しています。数学、プログラムやソフトウェア、アプリの使用法だけではなく、「現実世界の対象物を数に関連付けるスキル」の教育に力を入れるべきです。

つまり、モノ-データ(数)-情報、という情報の構造の中で、モノ-データ(数)の対応を理解するための教育です。データ(数)-情報、の関連付けのための数学は、ある程度備わっています。デジタル能力の低さ、AIへの対応の弱さ、これらを改善するには、このような教育を地道に続けるしかありません。

HOME » 医学の地平線 » 第148号 再び、確率のない国

PageTop