東北メディカル・メガバンク機構(ToMMo)では、これまで約14,000人のゲノムバリアントについてProtein Data Bankのタンパク質立体構造への対応づけを提供してきました。今回新たにGoogle DeepMindの開発したタンパク質立体構造予測手法であるAlphaFoldを用いて構築されたヒトプロテオーム全体のタンパク質予測構造データベースAlphaFold DB の予測構造に対して、バリアントの対応づけを行い、 公開しました。この機能は創薬等先端技術支援基盤プラットフォーム(BINDS)事業の高度化の一環として追加されました。本公開は、ToMMoがゲノム解析情報やメタボローム解析情報を公開するプラットフォームとしてきた、日本人多層オミックス参照パネル(jMorp: Japanese Multi Omics Reference Panel)で行われました。より多層的で情報量の多いデータベースが構築されたことにより、多くの研究者により利便性高く利活用されることが期待されます。
ToMMoは、コホート調査に参加された方々からのDNA試料をもとに全ゲノム解析を行い、日本人の全ゲノムリファレンスパネルの構築に取り組んできました。この全ゲノムリファレンスパネルは、2015年の約1,000人の解析を行ったバージョン(1KJPN)から、2021年には約14,000人(14KJPN)へとサイズを拡大しています。これらのゲノム情報はjMorpにて公開しています。
今回、jMorpの全ゲノムリファレンスパネルの情報をさらに拡張し、ゲノムバリアントとAlphaFold DBのタンパク質への対応を追加しました。追加した機能により、世界中の研究者にとってタンパク質のアミノ酸変化を引き起こすバリアントの機能的解釈に役立てられると考えられます。
主要なアップデート点の詳細
バリアント情報をAlphaFold DBの予測立体構造上に表示する機能の追加
ゲノム上にあるバリアントが、タンパク質をコードする遺伝子内にあり、かつそのタンパク質の立体構造がすでにProtein Data Bankにおいて解析されている場合に、その立体構造上でのバリアントに対応するアミノ酸の位置をビューワーで見る機能をこれまで提供してきました。これに加えて、そのタンパク質の予測立体構造がAlphaFold DBにある場合に、その予測構造上でのバリアントに対応するアミノ酸の位置をビューワーで見る機能をさらに追加しました。問題となっているバリアントによるアミノ酸変化がタンパク質の構造の維持に影響しそうか、あるいは酵素活性などの機能に重要な影響がありそうか、などの推定の参考材料とすることができます。AlphaFold DBによってヒトのほとんどすべてのタンパク質についてこの情報を提供することができるようになりました。