東北メディカル・メガバンク計画では、コホート調査に参加された方々からのDNA試料を中心に全ゲノム解析を行い、日本人の全ゲノムリファレンスパネルの構築に取り組んできています。この全ゲノムリファレンスパネルは、2015年の1,070人の解析を行ったバージョン(1KJPN)から、2016年には2,049人(2KJPN)、2017年には3,554(3.5KJPN)人へと順次サイズを拡大してまいりました。その間、当機構においては、解析手法の進歩に対応し、解析や公開手法を随時見直してきています。
直近の2017年に行った3.5KJPNへの更新においては、1KJPN論文に記載した手法でフィルターを適用したリファレンスパネルに加えて、そのフィルターにより除外していたエラーの可能性を含む変異も同時に公開しました。これら変更内容及び今後の取組の予定は以下のとおりです。
3.5KJPN公開における主な変更点
フィルターを適用したリファレンスパネルの公開に加えて、フィルターを適用していないリファレンスパネルも公開しました。具体的には3個以上のアレルを持つ箇所や、ハーディー・ワインベルクの法則に反する箇所など、エラーの可能性を含む箇所についても全て公開しました。
参照) iJGVDのウェブサイト から利用規約への同意のうえダウンロード可能です。
変更理由
人類集団は最近の急速膨張などにより、その遺伝子内に大量の突然変異を蓄積していることが明らかになりつつあります。このため、同じ遺伝子サイトに何度も突然変異が生じ、3個、4個のアレルを持つという(ポリアレリックな)状態が生じます。このようなサイトは、ゲノム解析の技術的観点から、また、遺伝学の従来のモデルに従わないという観点から、分析対象とはしないという議論があり、これまで他の国際的な全ゲノムリファレンスパネルプロジェクトでも分析対象から除外されていました。当機構でも1KJPN、2KJPN構築の際には、この議論にしたがってポリアレリックな変異を持つサイトを除外していました。
しかし、機構内部で慎重な分析・検討を進めたところ、このようなサイトは必ずしも除外すべきでないとの結論に達し、3.5KJPNでは公開対象に加えました。なお、従来モデルに従わないサイトの存在自体は新しい理論を導き始めています。全ゲノムリファレンスパネル構築が常に進歩する科学的な挑戦であることを認識させる例であると考えます。
今後の予定
現在、当機構では、全ゲノムリファレンスパネルの更なる進化に向けて取り組んでいます。1KJPN構築の当時には全ゲノムリファレンスパネルの構築手法に関するコンセンサスはありませんでしたが、1KJPN公開から2年半が過ぎ、上述のように解析手法も進歩してきているため、国際的な全ゲノムリファレンスパネルと比較性能に優れたものを提供することも重要になっています。
このため、当機構が本年6月頃の公開を目指して準備を進めている4,000人規模の全ゲノムリファレンスパネルにおいては、リファレンスパネルを一層ご活用いただけるように、他の国際全ゲノムリファレンスパネル構築の手法も取り入れて、比較性能に優れたものを構築し、フィルターを適用していないものと併せて公開する予定です。