‐日本人2,049人の全ゲノム解読データの調査から‐
【発表のポイント】
東北メディカル・メガバンク計画で2016年に作成した「日本人の全ゲノムリファレンスパネル(2,049人)」(2KJPN)を用いて、25の遺伝性疾患に関する57遺伝子*1上に、日本人一般成人がどれだけ一塩基変異*2を持っているかを解析した。結果、過去の研究で疾患原因らしいと指摘された一塩基変異が143検出され、そのいずれかを21%に当たる431人が保有していた。日本人の遺伝性疾患の実態を解明する一歩となる成果が、当計画による全ゲノムリファレンスパネルを用いて初めて得られたと言える。
検出された143の一塩基変異の一部を改めて精査したところ、必ずしも過去の研究によるエビデンスが高いものばかりではないことがわかった。また、一塩基変異の頻度には民族差があるものがあり、さらに143の疾患原因変異以外にも、より疾患との関連が疑われるような、タンパク質が働かなくなる可能性がある一塩基変異も見出された。
これらのことから、知られている疾患原因とされる遺伝子変異を単にそのまま適用する、といったことで得られることには限界があり、日本人全ゲノムリファレンスパネルをもとに、日本人での遺伝性疾患と一塩基変異との関連を一つひとつ分析していく必要があることが、改めて示された。
【概要】
東北大学東北メディカル・メガバンク機構(ToMMo)では、日本人の全ゲノム解読を大規模に行っており、全ゲノムリファレンスパネルを構築して一塩基変異の頻度情報を、国内外に公開しています。本研究では、日本人2,049人の全ゲノム解読データから2016年に構築された全ゲノムリファレンスパネル(2KJPN)の一塩基変異データの中に、遺伝性疾患の原因として過去に報告された一塩基変異の有無を調べ、頻度の分析と精査を行いました。
今回の研究で着目した遺伝子は、2013年に米国臨床遺伝・ゲノム学会(American College of Medical Genetics and Genomics: ACMG)が、臨床診断時の網羅的なゲノム解析が実施された場合に偶発的・二次的所見としての遺伝情報を知ることが患者にとって有意義としている遺伝性疾患の原因遺伝子です。具体的には、現在示されている26疾患(59遺伝子)のうちから、常染色体上に存在する57遺伝子(25疾患)を本研究の解析対象としました。
2KJPNの一塩基変異データに対して、生物・医学的アノテーション*3(注釈付け)と分析を行い、上記疾患との関連が報告されデータベースに記載のある一塩基変異を同定し、頻度の分析と精査を行いました。自動的な解析と分類のみにおいては、過去の研究で疾患原因と推定された143の一塩基変異が検出され、21%(431/2,049)の人が一つ以上保有する、という結果を得ました。そのうち5つの疾患を選んで文献調査に基づく精査を行ったところ、それぞれの一塩基変異は過去の研究で疾患原因と推定されたたものの、必ずしも研究エビデンスが高いものばかりではないことが分かりました。既報の疾患原因とされる遺伝子変異を、そのまま応用することで得られることは限られると考えられます。
これらのことから、日本人のゲノム医療のための情報インフラ構築のためには、過去に疾患原因と推定された遺伝子の変異の一般集団内での存在実態の分析に加えて、日本人での遺伝性疾患と一塩基変異との関連の精査(エビデンスの確認)が欠かせないことが分かりました。
【背景】
全ゲノム解析や全エクソーム解析により、ヒトゲノムの多様性の大量データが得られる時代となりました。当機構でも、日本人の全ゲノム解読を大規模に行い、検出された一塩基変異のリファレンスパネルを構築し、疾患と遺伝要因との関係解明のための研究に活用できるよう、国内外での利用促進を行っています。一方で、ゲノム全体をカバーする解析は、疾患の原因遺伝子の塩基配列の解読もされてしまうこともあって、偶発的所見・二次的所見についての扱いのポリシーが課題になっています。このような状況で、米国臨床遺伝・ゲノム学会(American College of Medical Genetics and Genomics: ACMG)は、臨床の枠組みにおいて偶発的・二次的所見としての遺伝情報の結果の返却を推奨する最小限の遺伝子セットを推奨しており、現在、26の遺伝性疾患(59遺伝子)となっています。これらの遺伝性疾患と遺伝子は、北米の医療体制のもとでは対処法があることで選択されています。これらの遺伝子について、日本人の一般集団では、疾患原因の変異はどのようなタイプがあって、どのような割合で存在するのかがまだわかっておらず、実態の解明が必要です。
【成果】
本研究の解析で着目したのは、25の遺伝性疾患とそれらの57の原因遺伝子で、これらは、ACMGが推奨する、偶発的・二次的所見としての遺伝情報の結果の返却を推奨する遺伝子のセットのうち常染色体上のものに相当し、大部分が遺伝性腫瘍や遺伝性循環器疾患の原因遺伝子です。
本研究では、当機構で作成した2KJPNの一塩基変異データに対して、生物・医学的アノテーションと精査を行うことで、疾患の原因として報告のある一塩基変異の同定と頻度の分析の開始を行いました。
2KJPNには、常染色体全体で約2,800万の一塩基変異がありますが、解析対象の57遺伝子の範囲に存在するものは約47,000ありました。これらの一塩基変異について、疾患関連の遺伝子変異のデータベースである、The Human Gene Mutation Database(HGMD)とClinVarを用いて、対応づくものを同定したところ、約400の一塩基変異に絞られました。アノテーションの記載や集団内頻度に基づいて自動分類を行ったところ、過去の研究で疾患の原因と推定された143の一塩基変異が検出されて、21%(431/2,049)の人が、一つ以上を保有していることが分かりました。
遺伝性腫瘍や家族性高コレステロール血症など、5つの疾患に着目して、一塩基変異のデータを目視して、文献調査を通した精査を行いました。その中の一つの家族性高コレステロール血症では、原因遺伝子であるLDLR, APOB, PCSK9で検出された一塩基変異を精査し、これら3つの遺伝子において、既に報告されている疾患原因となる一塩基変異が2KJPNに存在したことを確認しました。PCSK9遺伝子においては、機能亢進型のバリアントはコレステロール値を上げ、機能喪失型はコレステロール値を下げることが報告されておりましたが、2KJPNには両方のタイプの一塩基変異が観察されました。またAPOB遺伝子においては、これまで国内からは遺伝子変異の報告が無く、日本では初めての報告となります。文献調査では、2KJPNで見つかった、過去の研究で疾患原因と推定された一塩基変異がどのような研究で報告されたのか、また文献における患者群での遺伝子変異頻度などを確認しました。その結果、過去の研究で疾患原因と推定されたバリアントの中でも、疾患との関連性についての研究エビデンスは高いものばかりではないことが分かりました。主な理由の一つは、これまでは患者群の遺伝情報の分析が中心であり、一般人における一塩基多様性の頻度のデータが不足したからです。
解析対象遺伝子の2KJPNでの一塩基変異の頻度は、ヨーロッパ系、アフリカ系の集団の頻度と比較を行い、頻度に民族差があるものが見つかりました。今回2KJPNで検出された、疾患の原因と推定された一塩基変異の中には、アジアからの研究で報告され、他の民族では殆ど見つからず、疾患との関連性について異なる解釈が存在するものがありました。このような一塩基変異については、今回検討していない健康調査における表現型や病歴の情報もあわせながら、今後のさらなる検証や精査が必要です。さらに、報告されている疾患原因一塩基変異以外にも、途中の終始コドンの発生などにより、機能喪失を起こす可能性のある一塩基変異も見つかりました。
【今後の展望】
日本人集団の全ゲノム解読をもとにした遺伝性疾患関連の一塩基変異の研究は今回が初であり、これらは今後、日本人の遺伝性疾患とゲノムの変異の関係性、および日本人集団内での遺伝性疾患に関わる一塩基変異の頻度を理解するための基盤になる成果です。今回の研究では、常染色体上の一塩基変異のみを分析しましたが、今後は挿入・欠失のような他の変異のタイプを含めたり、X染色体上の遺伝子も対象として、解析の網羅性を向上させ、さらに人数が拡大されたパネルを用いて、低頻度で存在する疾患原因となる一塩基変異の頻度推定の精度を上げていきます。また、疾患原因変異として報告がなくても、機能喪失を起こす可能性のあるバリアントが検出されましたが、疾患によっては必ずしも機能喪失が疾患原因となるとは限らず、原因の可能性であるかを同定するには、さらなる分析が必要です。
今回の解析とアノテーション活動を通して、日本人一般集団における遺伝性疾患の原因変異のタイプと頻度についての実態を理解するには、報告されている遺伝子の変異と疾患と関係の精査が重要であると分かりました。そこで今後は、関連情報の統合的な分析と精査を通して、適切なバリアント解釈を行い、日本人に適した情報インフラの構築に貢献していきます。また、報告されている疾患原因の一塩基変異の頻度には、日本人と他の民族との違いも検出されました。ACMGが偶発的・二次的所見として結果の返却を推奨する疾患や遺伝子のセットは欧米中心で作成されましたが、このセットが日本人にとって最適かどうかは検討の余地があります。今後は民族差、さらに我が国での医療状況も考慮して、日本人に適切な対象遺伝子および疾患と関連性が高い一塩基変異の選定が可能になるよう、他の遺伝性疾患の原因変異の調査と共に、一般集団のゲノム解析データを拡充しながら研究を進めていきます。
【論文】
Evaluation of reported pathogenic variants and their frequencies in a Japanese population based on a whole-genome reference panel of 2,049 individuals
日本語タイトル:日本人2,049人の全ゲノムリファレンスパネルを用いた、既報の疾患原因バリアントの頻度と精査
掲載誌: Journal of Human Genetics
執筆著者:
Yumi Yamaguchi-Kabata, Jun Yasuda, Osamu Tanabe, Yoichi Suzuki, Hiroshi Kawame, Nobuo Fuse, Masao Nagasaki, Yosuke Kawai, Kaname Kojima, Fumiki Katsuoka, Sakae Saito, Inaho Danjoh, Ikuko Motoike, Riu Yamashita, Seizo Koshiba, Daisuke Saigusa, Gen Tamiya, Shigeo Kure, Nobuo Yaegashi, Yoshio Kawaguchi, Fuji Nagami, Shinichi Kuriyama, Junichi Sugawara, Naoko Minegishi, Atsushi Hozawa, Soichi Ogishima, Hideyasu Kiyomoto, Takako Takai-Igarashi, ToMMo Study Group, Kengo Kinoshita, Masayuki Yamamoto
Published online: 01 December 2017
Doi: 10.1038/s10038-017-0347-1
【用語解説】
*1:25の遺伝性疾患に関する57遺伝子:2013年に米国臨床遺伝・ゲノム学会(American College of Medical Genetics and Genomics: ACMG)が臨床における網羅的ゲノム解析の偶発的所見の取り扱いについての推奨(ACMG Recommendations for Reporting of Incidental Findings in Clinical Exome and Genome Sequencing)として、網羅的なゲノム解析において、偶発的・二次的所見としての遺伝情報の結果の返却を推奨する24疾患56遺伝子を発表した。これは、病気の診断のために行われた遺伝学的検査で偶発的・二次的所見が見つかった場合には、その結果を主治医へ返却すべきであるというもの。2013年時は24疾患56遺伝子のリストだったが、2016年に更新され26疾患59遺伝子のリストとなっている。本論文は、このうち、常染色体上にある25疾患57遺伝子について扱っている。なお、このリストは今後も更新される方針である。
https://www.ncbi.nlm.nih.gov/clinvar/docs/acmg/
当機構はこの2013年時のリストの24疾患について、日本の医療の状況等についてまとめ、遺伝学的検査の結果返却に関して検討すべき課題点について考察した論文「網羅的ゲノム解析における偶発的所見を含む遺伝情報の結果の返却に関する我が国の現状と課題の検討―米国臨床遺伝・ゲノム学会(ACMG)の偶発的所見取り扱いに関する推奨からの考察―」(日本遺伝カウンセリング学会誌 37(3): 105-126 2016)を発表している。
*2:一塩基変異:DNA塩基配列の点突然変異に由来する、種内におけるゲノムの多様性。Single Nucleotide Variation(SNV)とも呼ばれる。一定以上の頻度で存在するものは、一塩基多型(Single Nucleotide Polymorphism; SNP)と呼ばれている。
*3:アノテーション:ここでは、ゲノムの塩基配列や変異について、生物・医学的な注釈付け。