HOME » 医学の地平線 » 第33号 不確実性と多様性にどう対処するか(9)

医学の地平線

第33号 不確実性と多様性にどう対処するか(9)

日本人が不確実性と多様性を対処するための応用数学に弱い事は前に述べた。その原因の一つが日本語と英語の違いにあると言う私の考えについても前述した。ここでもう少し具体的にこの問題を掘り下げてみたい。

不確実性と多様性を理解するために欠かせない概念として「確率」がある。確率を厳密に定義するためには集合論を理解する事が重要である。現在の確率論・統計学において「確率」の概念はコルモゴロフによる公理的確率論によって定義される。まず、一つの試行(実験)が定義され、それによる結果(outcome)の集合である標本空間(sample space)が定義される。標本空間には有限可算、無限可算、無限不可算の集合がある。その部分集合の集合のうち、特定の性質を持つσ集合体(σ field)が定義される。その上に確率が定義されるのである。

現実の問題に確率の概念を当てはめる時は、この定義にそって厳密に考えを進める必要がある。例えば、連鎖解析という遺伝学上での手法の場合、結果に当たる物は、家系の遺伝継承に関するすべての変数が確定した対象物である。集団の場合はハプロタイプが結果に当たる。そのように標本空間を定義したうえで、特定の部分集合の確率を定義し、解析を進めていく。

このような解釈を理解するためには集合論を深く理解する必要がある。しかし、日本語で育った日本人はこのような訓練を受ける機会が少ない。英語の名詞には、既に集合論の基本的要素が含まれていると言える。まず、名詞には可算、不可算の違いがある。英語を用いる時は、常に可算、不可算の区別をしていることになる。可算の名詞は単数か複数かがわからないと書けない。更に集合名詞(collective noun)がある。集合には因子があり、因子は通常可算であり冠詞(article)が付く場合がある。集合の因子が特定されていない時は不定冠詞(indefinite article)を用い、特定されているときは定冠詞(definite article)を用いる。部分集合の場合は複数形となる。

例えば、日本語は通常Japaneseであるが、日本人全体はthe Japaneseである。Japanese peopleと言うと、部分集合を指す場合が多い。集合の中の特定されない一人の日本人はa Japaneseであり、特定される場合はthe Japaneseである。男性ならthe Japanese manとなる。水は無限不可算なのでwaterであり、a waterともwatersとも言えない。グラスに入った水はa glass of waterであり、特定されればthe waterで良い。対象物が多い、または大きい時は、可算ならmany、不可算ならmuchである。日本語では対象物が水でも人間でも「多い」となる。

日本における集合論、確率論、統計学の教育は、以上の言語的問題の確認から始めるべきである。さもないと、外国由来の理論をそのまま応用するだけになってしまう。現実対象への適用の正当性は、前述の公理的確率論に基づくからである。もちろん、経験的に、その理論に基づく予測が正しかった事は十分、正当性の根拠になるが、それがわかるのは予測の結果が多く得られた後であり、今現実に予測しなければならない対象には非力である。

日本における確率論・統計学の教育では、早い段階で言語上の問題を取り入れる事により理解が深まると考える。

HOME » 医学の地平線 » 第33号 不確実性と多様性にどう対処するか(9)

PageTop