AIを用いた遺伝子型インピュテーション法に関するレビュー論文がJournal of Human Genetics誌に掲載されました。
遺伝子型インピュテーション(以下、インピュテーション)は、SNPアレイによるゲノムデータを利用したゲノムワイド関連解析、遺伝率推定、疾患発症リスク予測に不可欠な、塩基レベルでの遺伝子変異情報の復元を可能にする集団遺伝学的手法です。従来のインピュテーション法は、次世代シークエンサーによって得られた数千人規模の遺伝子型情報を含む参照パネルを必要としますが、個人情報保護の観点から研究機関間での参照パネルの共有が難しく、その利用には制限が伴います。
近年、AI技術の飛躍的な進歩により、個人レベルでの遺伝子型情報の復元が困難な統計データやAIモデルのパラメータを用いる参照パネルフリーなインピュテーション法が開発されています。これらの手法は、個人情報保護の問題を解決することを目的としています。
本論文では、これまでに提案された参照パネルフリーなインピュテーション法の紹介と、従来のインピュテーション法との性能比較を行いました。参照パネルフリーな手法のいくつかが未観測値のある入力データに脆弱であり、性能比較からも脆弱性が認められることから、本論文では未観測値を復元するRCDA法の提案も行っています。
RCDA法では、Denoising Autoencoderを用いて、SNPアレイデータの一部をランダムに未観測としたデータから、元のSNPアレイデータを復元する学習を行います。この手法により、未観測値が復元されたSNPアレイデータを用いて、参照パネルフリーなインピュテーション法を適用することで、参照パネルフリーな手法の弱点であった未観測値による性能低下が大幅に軽減されることが検証されており、今後の参照パネルフリーなインピュテーション法の利用促進が期待されます。
書誌情報
タイトル:Two-stage strategy using denoising autoencoders for robust reference-free genotype imputation with missing input genotypes
著者名:Kaname Kojima, Shu Tadaka, Yasunobu Okamura, Kengo Kinoshita
掲載誌:Journal of Human Genetics
掲載日:2024年6月25日
DOI:10.1038/s10038-024-01261-6