HOME » 医学の地平線 » 第126号 多重比較の問題点

医学の地平線

第126号 多重比較の問題点

私は理化学研究所に務めているときゲノムワイド関連解析(GWAS)を多く行ってきました。この方法は、ゲノム上に多数設けたSNV (single-nucleotide variation、SNPと言われることもある)について、患者群とコントロール群で有意差があるかを統計的に調べる方法です。例えばrs231というSNVについて有意差がある場合、その遺伝子が疾患に関与していることが疑われるというわけです。

しかし、統計的手法では常に偶然がつきまといます。本当は差が無いのに、統計のいたずらで偶然、差が出ることがあります。そこで、統計では一応、P = 0.05という基準を設け、検定でこれ以下のP値がでれば有意という判断をすることになっています。しかし、ゲノムワイド関連解析では P = 0.0000005を基準としています。なぜこんなに低いP値を基準として設けているかというと、60万個ものSNVについて検定を行うからです。60万個のSNVのどれひとつ疾患と関連しないとしても、平均3万個のSNVがP < 0.05となります。これを多重比較(多重検定)の問題と言います。そこで経験も含め、0.05/600,000 = 8.3 x 10-8に近い値を基準としているのです。

統計的検定が最も威力を発揮するのは薬物の効果と安全性を検討する疫学研究です。この場合も偶然に有意差が出ることを避けるため、検定は1つに絞ります。これを主要評価項目(Primary end point)と言います。主要評価項目は試験開始前に決定しなければならず、原則として、主要評価項目だけが評価の対象となります。主要評価項目以外にも副次的評価項目(Secondary end point)を複数設けることが普通です。しかし、副次的評価項目については例えP = 0.05より低い検定結果が出たとしても多重比較の問題があるため参考程度という事になります。ただ、あまりにも低いP値が出た場合は本当に差がある可能性が高くなります。どれくらい低いと有意かという問題は難しい問題ですが、一つの方法としてはP < 0.05/全評価項目数、が目安となるでしょう。これをボン・フェローニの補正と言います。

痛風に関係する薬としては去年、フェブキソスタットとアロプリノールの安全性比較に関する調査結果がNew England Journal of Medicineに出ました(CARES研究)。それによると、主要評価項目ではフェブキソスタットはアロプリノールに比較して安全性で劣っていないという結果でしたが、副次評価項目である心臓死や全死亡でフェブキソスタットの方がアロプリノールより多いという結果でした。しかし、これは冷静に判断すべき結果で、副次項目が有意に出たからと言って直ちに結論付けるべきではありません。この試験では10以上の副次評価項目を設けているので、常識的に考え、副次評価項目に関してはP = 0.005以下の値を有意とすべきでしょう。この試験の副次評価項目はそのレベルには到底達していません。

このように副次項目で P = 0.05以下の値が出た場合、それは仮説として別の試験で検証すべきです。そこで、CARESの論文が出た後にいくつかの別の試験での検討が行われ発表されています。台湾の全国的な調査報告ではフェブキソスタットとアロプリノール使用者に心臓血管疾患の発生率に違いは無いが、重症皮膚副作用ではアロプリノールがはるかに多かったという報告でした。日本からの報告でもフェブキソスタットとアロプリノールの間に心臓血管疾患の発生率に差は無かったという報告が出ています。またイタリアのグループからは逆にフェブキソスタットの方がアロプリノールより心臓死が少ないという逆の結果が報告されています。

今後、様々な試験でも同様の検討がなされるでしょう。ところが、良く過去の文献を調べるとアロプリノール、あるいはフェブキソスタットが心臓血管疾患、または心不全を改善するという論文がたくさん出ていることがわかります(多くの論文ではアロプリノールが対象)。人間を対象としたものだけでも20を超える論文が出て、いずれもアロプリノール、あるいはフェブキソスタットが心臓血管疾患または心不全を改善するという内容です。中にはアロプリノール600 mg/日投与と偽薬を比較したRCTで運動時の心電図変化を比較し、アロプリノールは冠動脈障害を改善したという論文もあります(Lancet)。この項目はこの試験の主要評価項目であり、P値は0.0002です。この試験は高尿酸血症の患者ではない集団で行われたので、ほとんどの患者で治療後、著しい低尿酸血症となっています。また、膨大な集団のメタ解析による結果も発表され、アロプリノールは確かに心臓血管疾患を改善するという報告がなされています。つまり、アロプリノールが心臓血管疾患を改善する事は間違いない事で、フェブキソスタットも同様に改善する可能性があるという事が真実だと思います。どちらが優れているかというと、米国の報告ではアロプリノールの方が心臓血管疾患については優れている可能性が出たという事でしょう。しかし、特にアジア人ではスティーブンス・ジョンソン症候群などの重症副作用は、はるかにアロプリノールの方が多いので、フェブキソスタットの方が優れている可能性があります。これは遺伝子の違いによるものであることがわかっています。今のところ、世界的には一概にどちらが良いとは言えないというのが現状でしょう。

アロプリノールやフェブキソスタットなどのキサンチン酸化還元酵素阻害薬が心臓血管疾患などを改善するという効果は、そのメカニズムも含めこれから研究が待たれるところです。

HOME » 医学の地平線 » 第126号 多重比較の問題点

PageTop