医学の地平線
第84号 がんゲノム研究の現場と大局(3)
がんゲノム分野において、次のボールは何処に来るでしょう。がん細胞は正常の体細胞に由来するものです。正常の体細胞は受精卵に由来するものです。現在はがん細胞のゲノム解析が盛んです。これは、受精卵、正常体細胞、がん、に至る最後の段階の研究です。がん細胞のゲノムの研究により、変異をターゲットにした個別化医療が行われることは33年前に予測した通りです。また、変異の性状により変異原物質が特定される可能性もあるでしょう。
しかし、私は次のボールの来る場所は、受精卵から正常体細胞に、正常体細胞からがん細胞に至る過程の研究だと思います。しかし、がん細胞がクローン状態であるのに比較して、体細胞はクローンとは言えません。クローンである癌細胞のゲノム配列は多数の細胞の集合を材料として行うことができました。しかしクローンではない体細胞のゲノム解析は一細胞単位で行う必要があるでしょう。つまり、single cell sequencingです。それを見越し、我々は23年前にこれを行いました。これが可能だったのは我々がAPRT欠損症という特殊な遺伝病の研究を行っていたからです。APRTを完全に欠損した細胞を特殊な環境でクローニングすることができるのです。APRT欠損症のヘテロ接合体の体内には1万個に1個程度のAPRT完全欠損細胞が存在します。その80%にはLOH(loss of heterozygosity)という遺伝子の変化が見られます。LOHではない残りの20%をsequencingしたところ、それぞれ異なった変異が見られました。APRT欠損症のヘテロ接合体ではない正常人には2億個に1個程度の完全欠損細胞が見られました。300人のサンプルから2個見つかったのです。もちろんそれぞれの細胞には2つの変異(LOHも含め)が見られました。
このように正常体細胞にもゲノム変異は見られ、それは1個について数百個程度です。我々は特殊な方法で正常体細胞の変異を見つけましたが、現在では次世代シークエンサーを用いた方法により遺伝子によらず効率的に行えるようになります。問題はPCRによるエラーです。我々が行った細胞のクローニングの場合proof-readが働くのでエラーは低く抑えられますが、PCRの場合、そうは行きません。しかし、膨大なデータ(big data)と統計解析、情報解析を用い問題解決は可能だと思います。細胞によっても異なると思いますが、私は前述の研究から、正常体細胞の段階で平均数百の点変異があると予測します。これをエラーの雑音の中から統計的に抽出する必要があります。
この作業は集団遺伝学と類似したものになるでしょう。つまりフィッシャーが個人の遺伝的データから(当時はゲノムは読めませんでしたが)統計学を用いて集団と進化を説明したように、個々の細胞のゲノムデータから細胞集団とがん化の過程を説明できるようになるのです。これにより、受精卵、体細胞、がんに至る過程が解明され、癌になりにくい予防法の構築につながると考えています。