講演情報

[4Yin-B-07]MONDO疾患概念を起点としたマウスモデル探索のための知識グラフ埋め込み検索node2vecによる基盤検証

〇櫛田 達矢1、臼田 大輝1、小林 紀郎1、桝屋 啓志1 (1. 国立研究開発法人理化学研究所)

キーワード:

知識グラフ、埋め込み検索、node2vec、疾患オントロジー、マウスモデル探索

疾患研究における動物モデル選定では、疾患概念に対応するマウス系統の探索と、その妥当性を裏付ける根拠整理に多大な労力を要する。本研究では、MONDO疾患概念を入力として理研BRCマウス系統候補をランキング提示し、根拠情報を付与する探索システムを提案する。遺伝子・マウス系統・HPO・MPを統合した知識グラフ(約95万トリプル)から無向グラフ(922,647エッジ)を導出し、node2vec埋め込み(73,217ノード、128次元)に基づき疾患ノードとマウスノードのコサイン類似度で候補を順位付けした。根拠は統合エッジ集合上の直接リンク(1-hop)と2-hop経路として提示する。語彙外クエリに対してはMONDO階層(祖先・子孫)によるfallbackを実装した。さらにStreamlit UI(開発中)で、node2vec/TransE/RotatEの比較、系統タイプ分布や候補集合の重なりを可視化する。既知モデルは唯一の正解集合とせず、健全性確認の補助指標として用いる。