ゲノム解析部門の成田暁助教、田宮元教授らが参画する国際研究グループは、様々な民族集団にまたがるゲノムワイド関連メタ解析(メタGWAS)を実施し、その研究成果が国際科学誌Natureに掲載されました。
Global Lipids Genetics Consortium(GLGC)は、様々な民族集団で構成される201のコホート・バイオバンク(計165.5万人)のデータを対象に、脂質関連5項目のメタGWASを実施しました。
このメタGWASから得られた結果に基づいてポリジェニックリスクスコア※を算出し、そのスコアでLDLコレステロールの分布をどの程度説明できるかを評価したところ、各祖先グループごとに特定されたゲノム多型とその推定効果量よりも、集団全体のデータから特定されたゲノム多型とその効果量をもとに算出されたポリジェニックリスクスコアの方が、予測性能が高いことが示されました。
様々な民族集団データを解析対象に含めることで、より信頼度の高い原因多型の探索や疾患発症リスク予測が可能となり、さらには、医療アクセスに関する、民族集団間の不平等な状況を是正し、世界のすべての人々に医療面での恩恵をもたらすと考えられます。
詳細
血中脂質レベルの上昇は動脈硬化を引き起こし、心血管疾患の発症リスクを高める因子であることはよく知られています。GLGCは、5つの祖先グループ(アフリカ系集団、東アジア系集団、ヨーロッパ系集団、ヒスパニック系集団、南アジア系集団)で構成される201のコホート・バイオバンク(計165.5万人)のデータを対象に、総コレステロール(TC)、中性脂肪(TG)、HDL、LDL、nonHDLの、計5種類の脂質関連項目のメタGWASを実施し、その結果をもとに、血中脂質レベルの差異を説明するゲノム多型とその効果量の推定値を得ました。
ToMMoでは、上記のメタGWASから得られたゲノム多型のリストとその効果量の推定値を用いて、 地域住民コホート調査(宮城)の参加者約28,000人のポリジェニックリスクスコアを算出し、そのスコアでLDLの分布をどの程度説明できるかを、決定係数と呼ばれる指標に基づいて評価しました。
その結果、各祖先グループごとに特定されたゲノム多型とその推定効果量よりも、集団全体のデータから特定されたゲノム多型とその効果量をもとに算出されたポリジェニックリスクスコアの方が、LDLの分布をよりよく説明でき、その傾向は他の民族集団における検証用データにおいても同様であることが示されました。
また、上記のコホート・バイオバンク(165.5万人)のおよそ8割がヨーロッパ系集団ですが、同じヨーロッパ系集団のサンプルサイズを増大させるよりも、異なる祖先グループの民族集団を解析に加えることが、より多くの関連ゲノム多型の検出やファインマッピング(ゲノム多型の統計学的有意性や連鎖不平衡構造データに基づいて、ターゲットとする疾患や形質の原因多型を特定するための手法)の解像度向上に有効であることも示されました 。
これまでのGWASは、ヨーロッパ系集団を対象としたものが大半でしたが、本研究の結果から、様々な民族集団データを解析対象に含めることで、より信頼度の高い原因多型の探索や疾患発症リスク予測が可能となると考えられます。
さらに、多様な民族集団を対象としたゲノム医学研究は、医療アクセスに関する、民族集団間の不平等な状況を是正し、世界のすべての人々に医療面での恩恵をもたらし得るとされており、本研究はその一つと位置付けられます。
書誌情報
タイトル:The power of genetic diversity in genome-wide association studies of lipids
著者:Sarah E Graham, Shoa L Clarke, Kuan-Han H Wu, Stavroula Kanoni, et.al (当機構からの共著者:Akira Narita, Gen Tamiya, Masayuki Yamamoto)
掲載誌:Nature
掲載日:2021年12月9日
DOI:10.1038/s41586-021-04064-3
※ ポリジェニックスコア
GWAS等で、疾患との関連が示唆されたゲノム多型サイトについて、高リスク多型がもたらす推定効果量と、各個人が持つ高リスク多型の数の積をすべて足し合わせて得られる数値。個人ごとに算出され、このスコアに基づいて、様々な疾患における遺伝的な発症リスクの高低を定量的に評価できる。疾患の有無だけでなく、血圧や血糖値などの連続的な測定値についても用いられる。