HOME » 医学の地平線 » 第22号 Big data

医学の地平線

第22号 Big data

最近、「big data」ということばを良く聞くようになった。コンピュータやインターネットを通じて大量のデータが得られるようになったのでそれを用いて解析を行う。それにより専門とする人々以外にも良くわかるように可視的に示したり(見える化)、意思決定(decision making)を容易にしようとする試みをさす。例えばコンビニの客や商品、売り上げなどのデータ、スイカなどのカード使用のデータ、インターネットのチャットなどの内容のデータ、気象のデータなどを解析するという。

Big dataの取り扱いは大規模なコンピュータやソフトウェアさえあれば困難ではないが、問題はその結果の解釈である。結果の解釈が正しく行われるには、そのデータの生成過程やメカニズム、更にはデータ解析の論理や意味の詳細を理解していなければならない。

残念ながら日本では、コンピュータ、ソフトウェア、解析結果そのものに注目が集まり、結果の解釈の正当性を支える論理の把握が不足していることが多いように思われる。外来の科学や知識をそのまま取り入れた事の弊害であろうか。

我々は10年以上も前からゲノムの「big data」の解析を進めてきた。その経験から、日本の現状について心配している。Big dataを解析すれば結果はたくさん出てくる。しかし、その結果の解釈の正当性を示すことは容易ではない。ゲノムデータの例でいえば、それらのデータがどのようなメカニズムで生成されたかを詳細に知る以外には結果を解釈することはできない。

Googleはこのbig dataの解析が得意な会社である。Big dataから自分の見たいものを検索するアルゴリズムこそ、Google設立の最初の趣旨であった。社会の価値が物ではなく、英知へと移行しつつあることは喜ばしい事ではある。しかし、日本でその英知を生み出し、理解する人々を増やす必要がある。

HOME » 医学の地平線 » 第22号 Big data

PageTop