HOME » 理事長通信 » 2015年 » 第108号 遺伝力の欠損問題(Missing heritability problem)と日本のゲノミクスの欠損問題(Missing genomics in Japan)

2015年12月24日

第108号 遺伝力の欠損問題(Missing heritability problem)と日本のゲノミクスの欠損問題(Missing genomics in Japan)

人々の特徴(形質といいます)に遺伝がどの程度影響するかは医学上の大きな問題です。遺伝がすべてを決めていないことは確実であり、環境の影響も大きいと考えられます。しかし、身長や体重、それに病気にも遺伝は関係していると考えられています。遺伝を担当しているのは DNAであり、DNA の上のヌクレオチド配列というデータ(ゲノムデータ)です。個人は父と母からそれぞれ約 30億個のゲノムデータを受け継ぎます。従って、「遺伝(heredity)」を親から子へ伝わる情報と考えれば、それはゲノムデータによって伝えられていると考えるのが自然でしょう。この 30億個すべてが読めるようになったのですから画期的なことです。これにより、この医学上の大きな問題が解決する可能性があると世界中が注目しています。

個人の全ゲノム配列データが得られる前は、ゲノムワイド関連解析(GWAS)という方法が個人間のゲノムデータの違いを検出するために用いられていました。最初の GWAS研究は理化学研究所から世界で初めて発表されました(中村祐輔氏他)。これは 30億の配列の中で個人のゲノムデータごとの違いのある部分のみを用いた解析方法です。人によりゲノム配列が異なることを多様性(variation)、その異なった配列を多様体(variant)(例えばSNP )といいます。しかし、 GWASは多様性の中でも頻度の高い 50 – 100万個程度を調べる方法であり(初期には 10万個程度)、頻度の低い(例えば 1%未満)多様体の殆どは含んでいません。従って、 GWASのデータでは個人の形質に与えるゲノムの影響を十分把握できないと考えられていました。実際に、 GWAS研究により多数の形質関連 SNPが見つかりましたが、見つかった関連 SNPすべてを用いても計算上、形質に影響するゲノム要因のわずかしか説明できないと考えられていました。全ゲノムデータが得られるようになれば、人の形質に影響する多様性のほとんどが発見できると期待されていたのです。

遺伝が環境を含めたすべての中で個人間の形質にどの程度の影響を与えているかを示す概念として、遺伝力(heritability)があります(遺伝率と訳されることもあります)。遺伝力は家系データから推定されていましたが(例えば一卵性双子と二卵性双子の比較研究)、例えば身長では 80%、BMI では 50%と考えられていました。しかし、これまで GWASで発見された多様体の効果のすべてを集めて計算しても、身長やありふれた病気(糖尿病、関節リウマチ、心筋梗塞など)の遺伝力には到底及ばないのです。これは「遺伝力の欠損(missing heritability)問題」として近年の遺伝学の最大の問題と考えられていました。

この「遺伝力の欠損問題」を説明する要素として大きく 3つの可能性が考えられていました。第一に、ありふれた病気に関連する多様体の多くは稀な多様体であり、 GWASでは把握できないという可能性です。第二に、関連する多様体は GWASで把握できるが、その一つ一つの効果が小さいために現在のサンプルの大きさでは、そのどれが関連する多様体かわからないという可能性です。第三に、家系データを用いた遺伝力の推定は過大であり、もともと遺伝の効果はこれまでのデータほど大きくないという可能性です。

近年、全ゲノム配列データが続々発表されています。英国では 1万人のゲノムデータを読み終えました。その結果が世界に衝撃を与え始めています。多様性のある場所の数は 4千5 百万個以上に昇ることがわかりました。つまり、 30億個のなかで100個に 1個以上は1 万人の中で異なる配列を持っている人がいるのです。

この1 万人ほどの全ゲノムデータを用いて、遺伝力の欠損問題の検討が行われました(1)。その結果は意外なものでした。結果は、現在 GWASに用いられている多様体のデータを用い、既に公開されている 1000人ゲノムのデータを参照してインピュテーションを行えば、ほとんどの形質に関連しているゲノム多様性は検出できるというものです。この方法により頻度が 1%以上の多様性の96%、それ以外の多様性の 73%を把握できるという結果です(1万人に一人しか検出できなかった多様性などを除き 17,600,000個の多様性で検討)。GWASにインピュテーションを組み合わせた方法で把握できる多様体により身長の多様性の 55.5%, BMIについては多様性の27.4%を説明できるという結論です(把握率の不足を考慮すると 61%、29% )。そして、身長、 BMIに寄与する多様性については頻度の高い(> 1%)多様性で47.6% 、25.0%を説明し、稀な(それ以外)の多様性で残りの 8.4%、3.8% が説明できるというものです。そして、ありふれた疾患に関連する多様性を更に検出する効率的な方法は GWASを更に多くの人々について行うことであり、全ゲノム配列を決定することは非常に効率が悪いという結論です。ただし、全ゲノム配列を超低いカバー率(1以下)で行う方法は期待が持てるという予想も書かれています。この研究は、これからの世界のゲノミクス研究に大きな影響を与えるでしょう。実は、同様な結論は 1万人の全ゲノムデータが得られる前から発表されていました(3)。

遺伝力の欠損を説明する前記の三つの可能性の中で、第二の可能性、即ち関連する多様体は現在の GWASのためのアレーで把握できるが、その一つ一つの効果が小さいために現在の人数では、そのうちどれが関連しているかわからないという事になります。また、実は第三の可能性、つまり家系データから推定された遺伝力が過大であるという可能性も同時に正しいようです。中でも、遺伝的に近いペアは環境要因も近いことが多いという環境共分散の問題は遺伝力の過大評価の大きな要因と推定されています。最近の推定では身長、 BMIでは正しい遺伝力は60%、 20-40%とされています。もしそうだとすると、「遺伝力の欠損問題」のほとんどは、解消された事になります。また、関連する多数の多様性は中立ではなく環境による選択を受けているという証拠も発表されています。

以上の、遺伝力の欠損問題の研究については膨大なゲノムデータと高度な遺伝統計学の手法が用いられています。身長、 BMIに関与する多様性が、具体的にどれであるかはわからないものの、関与する多様性全体の効果の大きさは統計的手法で推定できるのです。基本的には、各SNPと個人の表現型との関連だけではなく、個人間の表現型と遺伝型の関連(相関係数や共分散)を利用する手法です。この遺伝統計学が極めて弱いことは日本のゲノミクス研究のアキレス腱です。私はこれを「日本のゲノミクスの欠損問題」と呼びたいと思います。 DNAという「モノ」、ゲノム配列という「データ」までは得意なのですが、遺伝統計学的手法を用いた「情報」が弱いのです。「ゲノム」までは得意ですが「ゲノミクス」が弱いのです。それが弱いために、日本では高度な数学的分析結果に基づいた研究戦略が建てられず、数学を無視した直感に基づいた戦略が建てられる傾向にあります。とりあえずシークエンサーを買って、シークエンスをしようとする傾向があり、得られたデータをどのように遺伝統計学を用いて解析するかという展望が無いのです。遺伝統計学的分析なしにゲノミクスの研究戦略が建てられるはずがありません。近年のMissing heritabilityを検討する論文(1-3)は、その内容について妥当性を詳しく検討する必要があります。しかし、その遺伝統計学の内容を理解する研究者は日本には極めて少ないのが現状です。日本は先進国の中でゲノミクスのガラパゴスになりつつあります。もし、1-3の論文の詳細がわかる研究者がいたら是非、紹介してほしい。そのような人々が、日本のゲノミクス研究の戦略立案の主導権を握るべきだからです。

  1. Yang J et al. Genetic variance estimation with imputed variants finds negligible missing heritability for human height and body mass index. Nat Genet. 2015 Oct;47(10):1114-20.
  2. Yang J, Lee SH, Goddard ME, Visscher PM. GCTA: a tool for genome-wide complex trait analysis. Am J Hum Genet. 2011 Jan 7;88(1):76-82.
  3. Golan D, Lander ES, Rosset S. Measuring missing heritability: inferring the contribution of common variants. Proc Natl Acad Sci U S A. 2014 Dec 9;111(49):E5272-81.

HOME » 理事長通信 » 2015年 » 第108号 遺伝力の欠損問題(Missing heritability problem)と日本のゲノミクスの欠損問題(Missing genomics in Japan)

PageTop