第３７号　赤いリンゴはおいしい｜公益財団法人痛風・尿酸財団

医学の地平線

第３７号　赤いリンゴはおいしい

情報とはおおよそ次のようなものである。
「赤いリンゴはおいしい」
これは重要な情報である。営利を目的とすればこれを元に大きな利益を得ることができる。また消費者にとっても、この情報をうまく使えば、おいしいリンゴを食べられると言うメリットがある。

赤いリンゴは見ればわかるが、おいしいかどうかは食べてみないとわからない。従って、生産者や、流通業者は出荷量が限られているときには、赤いリンゴだけを出荷するようにすれば利益が上がる。消費者はせいぜい1-2個のリンゴを食べるだけだから、赤いリンゴを選んで食べればよい。

赤いリンゴの問題は情報に関する重大な要素の多くを含んでいる。例えばGoogleの提供する情報は「Googleを見れば、あなたが探している情報が見つかる」、「Googleに広告を出せば、顧客が多く獲得できる」という、赤いリンゴとほとんど同じ構造の情報である。「薬Aを飲めばあなたの病気は良くなる」というのも同様の構造を持っている。そして重要な事は、「赤いリンゴはおいしい」、「Googleを見れば、あなたが探している情報が見つかる」、あるいは「薬Aを飲めばあなたの病気は良くなる」という情報が正しいかどうかである。そして、この情報が正しいと言う事が「統計的に」示されると言うことが重要である。「直感」や「情緒」、「好み」、「利害」ではなく、数学と言う客観的な手段で示されることが肝要なのである。

なぜ統計かというと、リンゴが生物だからである。工業製品であれば、あまり統計は必要ない。一つの製品が良ければ、同じ工場で作った同じ製品は、ほぼ間違いなく良いからである。統計学の必要性は「モノ」より「生き物」において顕著である。生き物はモノと違って「不確実」で「多様」だからである。

しかし、赤いリンゴの情報は必ずしも単純ではない。まず、第一の問題として、(A) 赤いリンゴの「赤い」が質的な情報か、量的な情報かを明確にする必要がある。即ち、赤、と赤では無い、に明確に分けられるかどうかという問題である。連続か離散か、という問題と言ってもよい。対象が量か質かという問題に日本人は鈍感な事が多い。名詞に可算と不可算の区別が無い事もこれを反映している。Quantitative（量的）をquantityの形容詞ではなくquantitationの形容詞であると解釈し、「定量的」「計量的」と訳す傾向があることもこれと関係していると思われる。定量生物学（quantitative biology）も計量経済学（quantitative economics）も、量る（quantitation）が重要なのではなく、量（quantity）的に考える事が重要なのである。記述的ではなく、数学的な視点が重要である。計量、定量と訳すとquantitationの訳というニュアンスが強く、測定に焦点が当たるのではないか。Qualityとquantityの違いの重要性が認識されていない可能性がある。

更に、第二の問題として、(B) 「おいしい」という情報が質的な情報か、量的な情報かという問題がある。おいしいリンゴとおいしくないリンゴを明確に区別できるかの問題である。おいしいという情報が水のように量的な物であれば、明確に区別する事はできない。おいしいという概念は数える事ができず、量る事しかできなくなる。

上記の(A) (B)の問題がいずれも質的な問題である場合は比較的単純である。赤いかどうか、おいしいかどうかが確実に決まる質的な情報の場合である。しかし、このような比較的単純な場合も、第三の問題として、(C) 記述の確実性と不確実性の問題がある。即ち、「赤いリンゴが必ずおいしい」か、「赤いリンゴはおいしい傾向がある」か、どちらかの違いがある。後者の場合は、赤いリンゴは赤くないリンゴより、おいしい確率が高いという、確率の問題と関連している。前者の情報の方が有用性は高いが、対象が生物の場合にはこのような情報が確実に得られる場合は限られており、後者の情報である事が多い。つまり、赤いリンゴは必ずおいしいとは限らないが、おいしい傾向があると言う事である。それでも全く情報が無い状態よりもはるかにましである。Googleの場合は、Googleのランキングで自分の見たい情報が「必ず」手に入るわけではないが、「手に入る確率が高い」ことが、数学的に示されていると言う事である。薬Aの場合は、服用しても100%治るわけではないが、飲まないより良くなる可能性が高いと言う事が示される必要がある。

以上の三つの問題は実は理解が容易な問題では無い。しかし、情報を統計的に理解する上で不可欠の概念を含んでいる。また、これらの問題のすべてが、英語と日本語の違いと関係している。「赤いリンゴはおいしい」という記述を英語で行うと、「(a). A red apple is delicious.」「(b). Red apples are delicious.」「(c). The red apple is delicious.」「(d). The red apples are delicious.」などの表現があり、それぞれのニュアンスは微妙に異なる。英語で表現する場合は、この4つのうちどれを採用するかを常に吟味する必要がある。

(a)と(b)、(c)と(d)との違いは要素と集合の違いである。A red appleは要素であるが、Red applesは集合である。前者では一つ一つのリンゴをランダムに抽出して調べる状況を考えればよいが、後者ではリンゴの集合を対象とする。現実世界でこのような区別を常に意識すれば集合の概念が実感を伴って理解できるはずである。即ち、情報を理解するために大切な第一の事項は、要素を対象としているのか、集合を対象としているのかを理解する事である。

次に、(a)と(c)との違いを理解するためには、特定の条件に該当する複数の対象の一つを抽出して考えると言う「変数」の概念の構築が必要である。The red apple is delicious.というと、特定の一つのリンゴについてだけ言っているが、A red apple is delicious.というと、複数のリンゴの中の一つを対象としている。従って、一つのリンゴでは正しくても、他のリンゴでは正しくない事はありうる。このような思考を繰り返せば、変数と値を現実世界に対応させるための概念構築が可能となるであろう。即ち、情報を理解するために重要な概念の第二は、変数と値の違いを理解する事である。そして、第三は、前述のように対象が量的な物か質的なものかを区別すると言う事である。日本語を話す我々は、このような困難を克服する必要がある。

統計学の効用は主として3つある。検定（test）、推定（estimation）、予測（prediction）である。検定と推定には対象物を集合として捉える概念形成が不可欠である。確率は集合の関数だからである。「赤いリンゴはおいしい（傾向がある）」という情報が本当に確実か、得られたデータで「検定」する必要がある。引き続き、赤いリンゴは赤くないリンゴに比べて、おいしい確率が何倍かというパラメータを「推定」する必要がある。これらは集合である「apples」を対象として初めて可能な作業である。

そして、検定、推定の結果を現実世界に役立たせるためには、次の「予測」が重要である。予測は集合ではなく、要素に対して行う。変数である、a red appleがおいしいかどうかの予測を立てる必要があり、その予測はapplesという集合から得られた情報である。そして、実際に赤いリンゴを食べておいしければ「The red apple is delicious.」となる。集合と要素、変数と値、量と質、の概念を常に意識しながら、その間を思考が往復するとい作業が必須である。

以上のように、「赤いリンゴはおいしい」という命題の真偽を判定するためには「集合と要素」「変数と値」「量と質」という概念を理解した上での数学的作業が必要である。このような概念は英語を話す人々では比較的容易であると思われるが、日本語では努力が必要である。

日本では、この真偽を判定するために、「赤いリンゴを食べたらおいしかった、だから赤いリンゴはおいしい」という少数の体験や、「赤いリンゴは日光に当たる時間が長かったので、糖ができやすくおいしいはずである」という「お話し」の論理になりやすい。しかし体験やお話しは人間を始めとする生物を対象とした場合無力である。不確実性と多様性が不可避であり、客観性が保障されないからである。

日本社会が生物を対象とした数学を不得意とする理由は数学能力の不足にあるのではない。現実社会の対象物を認識し、数学に適用するための概念が不足しているのである。これを正しく認識し、思考概念の構築を行えば克服する事は困難では無い。

日本社会や日本人の集団は海外から見ると「子供のサッカー」のように見えると言う。ボールのあるところに群がる傾向がある。Decisionに集団心理の影響が強く、数理的論理に乏しいように思われる。これを改善するためには、そもそも不確実で多様な現実世界を数学に乗せるための概念形成が肝要であると思う。

HOME » 医学の地平線 » 第３７号　赤いリンゴはおいしい

医学の地平線