第７０号　新しい産業に対応するための教育(１１)確率を理解するには

医学の地平線

第７０号　新しい産業に対応するための教育(１１)確率を理解するには

確率を現実世界に対応させて深く理解するためには、コルモゴロフによる公理的確率論を理解する必要があります。公理的確率論を理解するためには集合と要素、変数と値、量と質などの違いを理解する必要があります。ここで、理解するという意味は数式としての理解ではなく、現実世界に対応させて「実感と納得」を持って理解するということです。それには日本語による説明では不十分だと考えています。複数と単数ないし集合名詞、不定冠詞と定冠詞、可算名詞と不可算名詞の違いが無いからです。

以上の問題を克服するために私は日本語と英語を対応させて公理的確率論を教えるべきだと主張しています。これにより例えば任意の対象物と特定の対象物の違いをaとtheの違いにより理解できます。集合の集合という概念を単数と複数ないし集合名詞の区別により理解できます。これらの違いが情報を捉える上で不可欠であることも理解できます。

しかし、公理的確率論を現実世界の対象物と対応させるには具体的対象が必要です。私はメンデルの法則を例としてこれを教えるべきだと考えています。サイコロやコインも悪くはありませんが人工物であるため現実性に欠けると思います。第一のサイコロ、第二のサイコロという区別より、父、母という区別のほうがはるかに現実的です。

メンデルの法則の本質の理解は実は容易ではありません。その理由は情報を対象としたものであるからです。メンデルが発表した時から、多くの人が理解するようになるまで30年以上がかかったという事実が、その理解の困難さを示しています。私は、実はメンデルの法則の本当の理解はこれからであると考えています。メンデルの法則は「座位」「アレル」「遺伝型」「表現型」などの概念を対象として特定の出来事の起きる確率を記述したものと言えます。座位（locus）、アレル（allele）、遺伝型（genotype）、表現型（phenotype）はモノではなく情報です。しかし、日本ではこれらの用語を訳すときに「遺伝子座」「対立遺伝子」「遺伝子型」というように、「遺伝子」ということばを入れてしまっています。これらの概念は実は情報なのに、日本人はどうしても遺伝子という「モノ」として理解したいためだと思います。モノはよく認識できるが情報の認識が不得意という日本社会の問題点がここにも表れています。現実にはこれらの訳は極めて不都合になっています。なぜなら、遺伝子とは言えない対象物を取り扱う場合が多くなっているからです。

公理的確率論ではまずひとつの施行（a trial）を定義する必要があります。例えば、メンデルの法則を例に取ると、ひとつの施行とは「両親から一つの座位の遺伝型を構成する二つのアレルのうち任意の一つのアレルを一人の子に伝達し、子に伝達された特定の二つのアレルの組み合わせが子の遺伝型と定義される」という施行になります（A trial is defined as follow. “One of the two alleles that compose the genotype for a locus of each parent is transmitted to a child, and the combination of the two alleles is defined as the genotype of the child.”）。一人の個体では一つの座位の遺伝型は二つのアレルで構成されるので、その任意の一つが伝達されることになります。この任意性により不確実性が生じるのです。この施行によるすべての結果の集合が標本空間です。標本空間は4つの要素で構成されます。片親から伝達されるアレルは二種類あるので、結果は4種類になるのです。例えば両親の遺伝型をAB, CDとすると4つの結果はAC, AD, BC, BDで表されます。もし両親の遺伝型がどちらもXxであったとすると、A,CはX, B, Dはxという事になり、AC, AD, BC, BDはXX, Xx, xX, xxということになります。父母由来のアレルを区別すればXx, xXは区別できますが、父母由来のアレルを区別せず、組み合わせと考えると二つの遺伝型は同じになります。従ってXx, xXの結果の集合を考えると、これは「出来事」になります。標本空間は4つの結果で構成されますが、これをXX, Xx, xxという3つの出来事で分けることができます。次に片親から任意のアレルを選択する確率を1/2とすることにより、標本空間のそれぞれの結果の確率が決まり、すべての出来事の確率が決まります。例えばXXとxxの結果を併合した出来事は「ホモ接合体」ということばで示すことができます。前述のXxとxXを併合した出来事は「ヘテロ接合体」という出来事、XXとXx, xXを併合した出来事は「Xを保有する」という出来事になります。結果は4種類ですが出来事は16種類あります。この中には不可能な出来事（どの結果も入っていない）、確実な出来事（すべての結果を含む、即ち標本空間そのもの）も入っています。不可能な出来事の確率は0、確実な出来事の確率は1です。

次はランダム変数です。ランダム変数は結果の関数です。標本空間から一次元実数空間への写像です。例えば遺伝型の中のXの数はランダム変数です、Ｆをそのランダム変数とすると、Ｆ(XX)=2、Ｆ(Xx)=1、Ｆ(xX)=1、Ｆ(xx)=0となります。一つの結果は一つの実数に対応しますが、一つの実数には複数の結果に対応することも、対応する結果がないことも有ります。ランダム変数を用いて、結果という現実世界の対象物を数に対応させることが出来たのです。これに基づいて確率量関数や累積分布関数のグラフを描くことが出来ます。数になったので結果を横軸に並べることが出来るようになったのです。縦軸は元々確率なので並べて描くことは可能でした。ランダム変数は結果の関数ですが、確率関数は出来事の関数です。この違いはとても大切です。

このように、文章で表された概念を標本空間上の明確な結果の集合、即ち出来事として認識することが大切なのです。明確な標本空間、可測空間、確率空間が把握できれば抽象的と思える「情報」を「実感と納得」で認識することができます。多くの人々は文章で表された概念を直感的に理解する傾向があると思います。直感は人により異なり、しかも同じ人でもいつも同じ結果をもたらすとは限りません。それが不確実で多様な対象物を取り扱うときの判断を誤らせる原因となります。

メンデルの法則の例は、前述の単純なトリオ（両親と一人の子）に限りません。これを大きな家系に応用すると連鎖解析が可能となります。集団に広げると集団遺伝学的解析が可能になります。複雑な場合でも標本空間、可測空間、確率空間という公理的確率論を考えながら処理すれば理解できるようになります。情報はモノという明確な対象物の上に頑強な論理によって構築された構造物であり、直感的、抽象的に理解されるべきものではありません。

公理的確率論を日本語と英語を対比して教え、メンデルの法則を例にとって教えるべきであるという私の主張の概略は以上の通りです。ご意見をいただければ幸いです。

次回は標本空間が連続量を取り扱う場合です。

HOME » 医学の地平線 » 第７０号　新しい産業に対応するための教育(１１)確率を理解するには

医学の地平線