HOME » 医学の地平線 » 第140号 情報の担い手、遺伝子と脳

医学の地平線

第140号 情報の担い手、遺伝子と脳

情報を担当する二つのシステム

理解が困難な分野でも新しい見方をすることで今までより格段に理解が容易になる事があります。情報の分野はわかりにくい分野の代表ですが、これから説明する新しい視野により理解が容易になるかもしれません。

情報の担い手として遺伝子と脳があります。すべての情報は脳がないと認識できませんが、脳は遺伝子が作ったものです。従って、世界のありとあらゆる情報は遺伝子か脳が担当していると言えます。

情報を担当する二つのシステム、遺伝子と脳の間には明確な因果関係があります。脳は遺伝子によってできたものです。つまり遺伝子が原因であり、脳は結果です。このように、因果関係で結ばれている二つの情報の担い手、遺伝子と脳はどのような性格を持つのでしょうか。ちなみに、コンピュータやAIも脳が作ったものなので、ここにも因果関係があり、脳が原因でコンピュータやAIは結果と言えます。

情報は目に見えないので「モノ」と違って把握が容易ではありません。モノは実物を見たり、図に描いたりすることで誰でも捉えることができます。しかし、情報は見たり図に描いたりすることはできません。そのためリアリティーを持って捉えることが容易ではないのです。特に、日本社会は情報を捉えることが得意では無いようです。このため製造業で強かった日本の産業はIT(情報技術)産業とバイオ産業では苦戦をしています。そのため、日本の国力は産業の分野でも科学の分野でも衰退を続けています。しかし、情報を遺伝子と脳という具体的な対象に関係づけて理解すると、より分かりやすくなります。特に、情報を深く理解するための概念の把握に役立つのです。

 

これまでの統計学の歴史と、遺伝子と脳の情報

例えば、記述統計学と推計(推測)統計学の違いが、遺伝子の情報と脳の情報に関連付けると容易に理解ができます。記述統計学と推計統計学では情報の捉え方が大きく違います。欧米では、この二派の学者の間で互いの非難合戦を伴うほどの激しい論争が行われました。しかし、我が国では大きな論争は起きていません。これは、概念の違いを十分深く理解できていないからではないかと思われます。概念を深く理解せず、単に数式に基づく解析技術の理解に留まれば、激しい対立が起きるはずはありません。

次に、従来の統計学とベイズ統計学も遺伝子と脳の情報に関連付けると非常に理解が容易になります。この二つの統計学者の間でも欧米では激しい非難合戦が起きましたが、日本では起きていません。もちろん、最近注目されている人工知能と、統計学の違いも遺伝子と脳の情報の違いに関連付けると理解しやすくなります。それでは、これから具体的に説明を始めましょう。

 

遺伝子と脳の情報システムの比較

メンデルの法則の発見、ワトソン・クリックによるDNAの二重らせん構造の発見、分子生物学とコンピュータによるゲノム配列の解析などにより、遺伝子にかかわる情報についてはかなり明確になってきました。プリン・ピリミジン塩基よりなるAGTCの4文字、デオキシリボース、リン酸による一直線の配列、それらのデータが世代を超えて伝えられます。配列の大きさは約30億個で、その中に約2万個の遺伝子が含まれています。遺伝子は一つのユニットの配列であり、多くの場合、メッセンジャーRNAを通じ、タンパク質をコードしています。その配列に大きな変化が起きた場合(変異)はメンデル型形質となりますが、小さな変化は個人個人の間の違い、つまり「多様性(variation)」を形成します。30億個の配列のうち、一世代交代で約数十個の配列が変化すると考えられます。

情報伝達と処理の仕組みの解明が進んだ遺伝子に比較して、脳が担当する情報の解明はこれからと言えます。ニューロンという細胞が一単位となり、異なったニューロン間の情報伝達はシナプスという接合で行われています。脳のニューロンの数はヒトで約200億個とされ、シナプスの数は約100兆個、あるいはそれ以上とされています。膨大な数のニューロンと、ニューロン間の接合であるシナプスの構造が脳の情報処理の基本的構造を形成しています。シナプスはニューロン間の情報伝達効率を刻々と変化させ(シナプス可塑性)、これにより刻々と変化する環境に対応した反応をしていると考えられています。

ここで、遺伝子と脳の情報の性質を比較してみます。脳への情報の入力は感覚器(目、耳など)で、出力は筋肉によりなされます(感覚器→脳→筋肉)が、遺伝子のシステムでは、これに相当する入力は環境から、出力は表現型によりなされます(環境→遺伝子→表現型)。脳に似せて人間が作った人工知能(AI)、特に深層学習でもこれと似た構造が形成されています。即ち、入力から情報処理システムを通じ、出力を出す(入力→情報処理→出力)構造です(1)。深層学習はニューロンとシナプスによる脳の構造に似せて形成されており、ニューロンはノード、シナプスはエッジに相当します。そして、シナプス可塑性に相当するものはパラメータ(重み、バイアス)と呼ばれる変化する数値となっています。遺伝子のシステムの場合、このパラメータに相当するものは遺伝子、あるいは配列になります。

 

記述統計学と推計統計学

情報に関する科学は19世紀の記述統計学から始まりました。ゴールトンは親子の身長の関係から「回帰」という概念と解析法を導入し、ピアソンはcontingency table、相関係数、多くの確率分布、カイ二乗検定、モーメント、モーメント生成関数など様々な記述統計学的概念と解析法を整備します。これに引き続く推計統計学的手法はメンデルの法則の統計学的解釈を論じた1918年のフィッシャーの論文により始まったとされます(2)。ピアソンとフィッシャーの間では生涯をかけた激しい対立がありました。これが、記述統計学と推計統計学の明確な立場の違いを反映しています。これは脳的な情報解釈と遺伝子的な情報解釈の違いと考えられます。

ピアソンは、アインシュタインにも大きな影響を与えた著書、The Grammar of Scienceの中で、科学とはimage impressionを説明する方法を発見する事が目的であり、因果を解明することが目的ではない、と主張しました。Image impressionは感覚器と脳の所作と言えます。つまり、記述統計学を大成したピアソンは感覚器と脳が形成する情報を説明する事が科学の目的と考えたのです。これに対し、フィッシャーは、その上に遺伝子という原因を置き、メンデルの法則という厳密な確率を適用することを提案したのです。ピアソンに代表される記述統計学者の集団は、ゴールトンに始まる生物計測学派(biometric school)を構成し、当時のメンデル学派(Mendel’s school)と激しく対立していました。

フィッシャーはメンデルの法則に基づき、多変量線形モデル、分散、ランダム効果モデル、ランダム化、尤度・最尤法、フィッシャーの厳密検定、など様々な推計統計学的手法を導入します。フィッシャーの手法に見られる厳密さは、メンデルの法則に見られる確率の厳密さを反映したものです。

しかし、脳の情報システムは遺伝子の情報のシステムのように極端に厳密なものでは無いと考えられます。その理由は、脳は遺伝子より環境変化に即時に対応しなければならないからです。遺伝子と脳を情報として捉えた場合、最も基本的違いはパラメータの更新間隔です。遺伝子ではパラメータの更新間隔は約20年(ヒトの場合)ですが、脳では極めて短時間です。そのため、パラメータの数は遺伝子では2万個(あるいは30億個)ですが脳では100兆個です。また、遺伝子では法則の多くが線形ですが、脳では非線形と考えられます。これらの違いにより、遺伝子のシステムは短期の融通は効かないが長期に存続することができ、脳のシステムは一代限りだが様々な環境に瞬時に対応できるのです。

フィッシャーによる推計統計学は、厳密で安定した統計学であったため記述統計学の次の時代に広く受け入れられてきたのです。例えば、遺伝的データの解析だけではなく、薬効検定などの分野では大きな力を発揮しました。しかし、それは融通が利かないという問題点も持っていました。

 

従来の統計学とベイズ統計学

遺伝子の情報システムでは主観は廃され、客観的確率が重視されます。主観は脳に存在するもので、遺伝子には存在しません。しかし、脳では確率は柔軟性に富み、刻々変化するパラメータ(シナプス可塑性)により変化します。遺伝子のシステムは環境から影響を受けない恒常性が重視され、脳のシステムでは環境により柔軟に変化する可塑性が重視されます。後者の性質は最近のベイズ統計学に反映されていると考えられます。

従来の統計学では「確率」は頻度に基づいて定義されています。メンデルの法則では親から子へ、遺伝子から表現型へという因果関係が明確であり、確率は原因から結果や出来事の方向に従って容易に定義できるからです。サイコロを振ると3の目がでる確率のような定義です。しかし、これでは柔軟性に欠けるので、コルモゴロフは頻度に基づいた確率の概念を「測度」に基づいた概念に拡張しました(公理的確率論)。公理的確率論の標本空間を結果ではなく数の集合とみなせば、確率は単に特定の性質を満たす数と数の集合の上に定義された関数となります。これにより、結果や出来事の確率だけではなく、原因の確率まで定義できるようになったのです。

従来の統計学では特定の原因の下で結果や出来事の起きる確率が定義されます。しかし、ベイズ統計学では、その原因の確からしさを事後確率で評価します。これは脳に必須の機能です。例えば、動物は暗闇で出会った相手が捕食者か獲物かを瞬時に判断しなければなりません。その判断材料は原因である相手が発生する姿や音です。結果である姿や音から、原因である相手が捕食者であるか獲物かを判断する必要があります。前者であれば後退し、後者であれば前進します。この時の「捕食者である確率」は頻度からは定義できません。それは動物の脳の中にある主観に基づくものであり、それは感覚器から提供されるデータにより刻々と変化するものです。また、この確率(事後確率)は、データが提供される前の動物があらかじめ持つ主観的な確からしさ(事前分布)によって変化するでしょう。これはベイズ統計学が脳の情報システムに類似している事を示しています。

つまり、歴史的に記述統計学(脳)→推計統計学(遺伝子)→ベイズ統計学(脳)と推移してきたと言えます。ただし、記述統計学では感覚器→脳、のプロセスは明確ですが、筋肉に相当する出力は本格的に取り扱われていません。ベイズ統計学では事後確率、事後分布の形で、この出力が明確に定義されています。また、最近の人工知能が脳のシステムに類似していることは当然のことで、科学者は脳と類似したシステムを作ることを目的としているのです。

 

今後の統計学と情報学の方向性

さて、今後、情報に関する科学はどのように進むでしょうか。これまで、記述統計学(脳)→推計統計学(遺伝子)→ベイズ統計学と人工知能(脳)、と進んできたことがわかれば、次は、遺伝子の時代が来るとも考えられます。あるいは遺伝子と脳を併合したようなシステムを目指すのではないかとも想像できます。脳は、主観的確率を次々に提供されるデータにより更新していると考えられます。事前確率から尤度により事後確率を計算しています。それでは脳による事前確率は何により与えられるでしょう。もちろん、過去の経験は重要な要素でしょう。しかし、おおもとの情報は遺伝子によって与えられると考えられます。遺伝子と脳の両方の情報システムを統合するには事前確率を構成するパラメータの、そのまた事前確率を考えなければなりません。つまり、階層的ベイズモデルのような、ハイパー・ハイパー・…・ハイパーパラメータを考えたモデルのような解析となるのではないでしょうか。

 

  1. Kamatani N. Genes, the brain, and artificial intelligence in evolution. J Hum Genet 66, 103-109, 2021
  2. Fisher RA. The correlation between relatives on the supposition of Mendelian inheritance. Trans Roy Soc Edin 52, 399-433, 1918

HOME » 医学の地平線 » 第140号 情報の担い手、遺伝子と脳

PageTop