発表のポイント
・ 1万4千人の全ゲノム解析データをもとに日本人全ゲノムリファレンスパネル*1 14KJPNを公開しました。
・ 日本人にみられる約6万8千個のゲノム構造多型*2とその頻度情報をデータベースとして公開しました。
・ 次世代シークエンス解析の参照配列として実用性を高めた日本人基準ゲノム配列*3の新バージョンJG2.1を公開しました。
・連鎖不平衡*4情報をもとにした遺伝地図*5の対象人数を96人から150人に拡大し解像度が向上しました。
概要
東北メディカル・メガバンク計画は、公開データベース日本人多層オミックス参照パネル(jMorp:Japanese Multi Omics Reference Panel)を大幅に更新し、1万4千人分の全ゲノム解析情報に基づく日本人全ゲノムリファレンスパネル「14KJPN」を新たに公開しました。同データベースは均一性の高い民族集団における世界最大規模のもので、約1億個のバリアント*6を収載しています。また、主に最新の長鎖リードシークエンサー*7を用いた333人分の全ゲノム解析に基づく構造多型データベース、「JSV1:Japanese Structural Variation」を作成・公開しました。さらに、日本人基準ゲノム配列の実用性を高めた新しいバージョンである「JG2.1」を公開し、遺伝地図は対象人数を150人に拡大し精度の向上をはかりました。
jMorpはこれまでもゲノム解析情報の公開により、ゲノム医学・医療研究の発展に貢献してきました。今回の拡充により、ますます精緻なゲノム解析が可能となります。
用語解説
*1. 全ゲノムリファレンスパネル : 東北メディカル・メガバンク計画で実施された、日本人の一般住民数千人の全ゲノム次世代シークエンシング解析により、検出されたゲノムDNAバリアントから構築された日本人ゲノム配列のパネル。
*2. ゲノム構造多型 : ゲノム配列において、SNV(後述)や短鎖リードシークエンサーで検出できるようなINDEL(後述)などの短い長さの多型ではなく、数十から数千、あるいはそれ以上の塩基が個人間で異なる多様性のこと。
*3. 基準ゲノム配列 : 次世代シークエンシング解析を行う際、ひな型となるゲノム配列。参照配列ともいう。次世代シークエンシング解析ではリードと呼ばれる小さな単位で大量に配列解読を行い、リードを基準ゲノム配列に当てはめて検体の元のゲノム配列を推定する。そのため基準ゲノム配列の品質がゲノム解析の精度を左右する。
*4. 連鎖不平衡 : ゲノム上の連鎖している(座位)の各2種類の塩基(アレル)について、ランダムに生じる以上の偏った組み合わせ(ハプロタイプ)の存在。
*5. 遺伝地図 : 染色体上のマーカー間の距離を、組換えの頻度で表したもの。100回の減数分裂で1回の組換えが生じる距離を1センチモルガン(cM)と呼ぶ。
*6. バリアント : 標準となるゲノム配列とは異なる箇所のこと。
*7. 長鎖(短鎖)リードシークエンサー : 大量のゲノム情報を同時並行で高速に解析可能な装置が次世代シークエンサーであり、数百塩基単位で解析しその後情報を基準ゲノム配列に当てはめるのが短鎖リードシークエンサー、数千から万単位の塩基を解析可能なのが長鎖リードシークエンサーである。短鎖リードシークエンサーは解析速度やコスト面で優位性があり、長鎖リードシークエンサーは基準ゲノム配列から外れた配列も解析可能であるため構造多型の解析に適している。