HOME » 医学の地平線 » 第112号 深い学習、深い思考、深い理解

医学の地平線

第112号 深い学習、深い思考、深い理解

最近、deep learning(深層学習)という言葉がはやっていて、情報関係以外の科学者や、一般の人々も用いているようです。最強のプロ棋士に勝った人工知能、アルファ碁で有名になった機械学習のフレームワークがdeep learningなのです。このdeep learningの内容をdeepに知ることで我々の思考の深層と科学の一面を明らかにできるのではないかと思います。

もともとdeep learningは多層ニューラルネットワークと呼ばれる機械学習フレームワークの一つです。高等動物の神経システムの研究成果を最大限に取り入れた内容となっています。最初は入力層と出力層で構成されていたシステムに中間層(隠れ層とも言われる)を複数加えたシステムが一般的です。人間の思考も、5感から入力データを取り入れ、複雑な思考の後に何らかの判断を下し行動に移すという点で、極めて似たシステムと言えます。

人間の持つ高度な機能の中枢を占める「思考」は、学習なしに行うことは難しく、そして学習のためには出来る限り大きなデータ(ビッグデータ)が必要です。学習のしかたは、「教師あり学習」と「教師なし学習」にわけられます。つまり、正しい出力を教えて貰える場合と、教えてもらえない場合があるのです。コンピュータでも、人間に教えてもらえない場合も入力データから「自己学習」ができるという事は示唆に富む事実です。

教師あり学習では、コンピュータはひたすら先生の教えに従います。間違った答えを出すと先生に注意され、先生と近い答えがでるように内部を修正するのです。それでは先生の答えに近いかどうかは何で判断するのでしょう。「回帰(regression)」です。回帰の方法は3つに分けられます。線形回帰、ロジスティック回帰、ソフトマックス回帰です。そうです、遺伝学(genetics)で使われる手法と全く同じですね。そうです、回帰や最尤法は遺伝学に由来する概念です。遺伝子と環境が表現型に与える影響は、線形関数、ロジスティック関数、ソフトマックス関数で表され、そして現実のデータ(教師)に比較して、それに近くなるように係数を推定し、関連を検定します。遺伝学では現実データを関数に入力し、尤度関数を作成します。そして、その尤度関数の最大化(最尤法)を行います。Deep learningでも全く同じです。でも、deep learningではその方法が勾配降下法という方法です。これは遺伝学と違いますね。なんで、Newton-RaphsonとかEMアルゴリズム使わないかというと、データが多すぎて計算不可能だからです。

Deep learningが取り入れているのは、神経システムからの知識、遺伝学からの知識だけではありません。物理学、熱力学からのアイデアも取り入れられています。ボルツマンマシン、エントロピー、ギプス自由エネルギーなどです。クラウジスによる熱力学の立場からのエントロピーに統計力学的解釈を与えたのはボルツマンです。エントロピーが増加し、ギブス自由エネルギーが低下する方向に自然現象は進み、系が安定してくるというのは熱力学第二法則の教えるとおりです。それを情報理論に取り入れたのは遺伝学を学んだシャノンです。

このように、遺伝学、神経学、熱力学、統計力学の知識を取り入れているフレームワークがdeep learningです。まさに人間の深い思考、科学における思考の歴史を取り入れたシステムと言えるでしょう。科学のフレームワーク、神経系のフレームワーク、遺伝学のフレームワークは互いに極めて類似しています。その理由は、生命を支配する生命ゲノムシステムのフレームワークを神経系が取り入れ、それにより作られた科学のフレームワークがそれらの枠組みをコピーするためであると思われます。

日本は今、人工知能がブームになっているように思われます(私もあやかっていますが)。しかし、その枠組の詳細、数式の深い意味、その由来などよりも、出来上がったソフトウェアを使って何ができるかのみに注目が集まっているように見えます。日本の科学が輸入科学であることの特徴として、理解が表層的(superficial)になってしまう傾向があります。Deep learningの最大の特徴は入力層、隠れ層、出力層の中の「隠れ層」にあります。日本ではどうも、入力層、出力層にばかり注目が集まる傾向があると思います。隠れ層は見えないからです。

これからの日本の課題として、深い学習(deep learning)、深い思考(deep thinking)、深い理解(deep understanding)をあげたいと思います。Deepな隠れ層は多くの人々には見えません。しかし、これこそ先進国が最大の武器とすべきものです。誰にでも見えるものは誰にでも真似されます。見えないものは容易には真似できません。

私は18世紀に起きた産業革命は、「ものづくり産業革命」と定義すべきものだと考えています。その後、「情報産業革命」が起き、第二次世界大戦にも多大な影響を与えました。それが、今、確実に世界の最大の産業になりつつ有ります。しかし、それは見えないために認識しがたく、まだ日本では十分理解されていません。

深い学習について、東洋にはすばらしい格言があります。孔子(時代はブッダ、キリストより前)のことばに、「学びて時に之を習う、またよろこばしからずや」があります。これが「学習」ということばの由来でしょうか。学習には楽しさの要素が必要ですね。また、「学びて思わざるは則ちくらく、思いて学ばざるは則ちあやうし」とあります。表層学習をくりかえすだけで「深く思わざるは、則ちあやうし」という警告と取れないこともありません。

HOME » 医学の地平線 » 第112号 深い学習、深い思考、深い理解

PageTop