講演情報
[S14-3]TogoVarにおけるデータ統合と利活用の取り組み
○片山 俊明 (ライフサイエンス統合データベースセンター)
TogoVarは日本人ゲノムから同定された全てのバリアント頻度情報の統合利用を目指したリファレンスデータベースで、バイオサイエンスデータベースセンター(NBDC)とライフサイエンス統合データベースセンター(DBCLS)が開発し2018年より公開している。NBDCヒトデータベースに寄託されたデータをJGAから再解析した頻度情報、AMEDのGEM-Jに含まれるバイオバンク・ジャパン・理化学研究所・東北メディカル・メガバンク機構(ToMMo)からの頻度情報、ToMMoのゲノムコホートからの頻度情報、長浜コホートを中心としたHGVDからの頻度情報を統合して収載している。これらのバリアントに対し、論文等で参照できるようIDを付与しているほか、Ensembl Variant Effect Predictor (VEP)による対応遺伝子・Consequence・SIFT/PolyPhenスコアの情報を参照できるようになっている。一方で、日本人と他の民族集団でのアリル頻度の違いを見るためにgnomADの頻度情報も収載しており、今年度開発した詳細検索インターフェイスを用いて日本人で頻度が低く他民族で頻度が高い(またはその逆)といったバリアントを絞り込み検索できる。さらに疾患に関連するバリアント情報としてClinVarおよびMedGen等からのアノテーションと文献情報を統合している。現在GRCh38への対応、疾患関連バリアントを収載するMGeNDデータベースとの連携、構造多型の収載、さらなるデータの拡充、インターフェイスの改良などを進めている。これらの情報統合は知識グラフの形で実現しており、その利活用は日本人の個別化医療に資するものと期待している。