講演情報
[I-OR10-02]自然言語処理人工知能モデルを応用したMarfan症候群のgenotype-phenotype correlation解析
○野木森 宜嗣1,2, 河島 裕樹2, 白神 一博2, 益田 瞳2, 八木 宏樹3, 武田 憲文3, 犬塚 亮2 (1.NTT東日本関東病院 小児科, 2.東京大学医学部附属病院 小児科, 3.東京大学医学部附属病院 循環器内科)
キーワード:
Marfan症候群、人工知能、大動脈解離
【背景】Marfan症候群はフィブリリン1の変異によって心大血管を含む全身の組織に異常を来す疾患で、その表現型は遺伝子型との関連が報告されている。一方で表現型との関連性が未知の変異が多く存在する。我々はフィブリリン1のアミノ酸配列を一種の言語と見なし、自然言語処理を行う人工知能モデルを適用することで変異タンパクが持つ情報を抽出し、表現型との関連を推測する試みを行ったので報告する。
【方法】東京大学医学部附属病院およびその関連施設でMarfan症候群を疑われてFBN1遺伝子の変異が確認された446症例を対象とし、このうち356症例をtraining dataset, 90症例をtest datasetとした。アミノ酸配列に関する情報と性別を入力とする人工知能モデルによって特徴を抽出し大動脈解離、気胸、水晶体亜脱臼のイベント発生に関する予後予測を行った。
【結果】Test datasetにおいて、大動脈解離、気胸、水晶体亜脱臼のイベント発生に関するcumulative dynamic area under the curveは60歳時点でそれぞれ0.792、0.799、0.678であった。既に報告されているgenotype-phenotype correlationの例としてハプロ不全やシステイン残基に関連した変異が挙げられるが、大動脈解離、気胸、水晶体亜脱臼の各イベント予測能について、上記の分類と今回のモデルの予後予測能を比較するとDeLongの検定によるp値はそれぞれ、0.030, 0.018, 0.001未満と今回のモデルで有意に優れていた。
【結論】自然言語処理人工知能モデルの利用により、Marfan症候群においてgenotype-phenotype correlationの検討が可能である。
【方法】東京大学医学部附属病院およびその関連施設でMarfan症候群を疑われてFBN1遺伝子の変異が確認された446症例を対象とし、このうち356症例をtraining dataset, 90症例をtest datasetとした。アミノ酸配列に関する情報と性別を入力とする人工知能モデルによって特徴を抽出し大動脈解離、気胸、水晶体亜脱臼のイベント発生に関する予後予測を行った。
【結果】Test datasetにおいて、大動脈解離、気胸、水晶体亜脱臼のイベント発生に関するcumulative dynamic area under the curveは60歳時点でそれぞれ0.792、0.799、0.678であった。既に報告されているgenotype-phenotype correlationの例としてハプロ不全やシステイン残基に関連した変異が挙げられるが、大動脈解離、気胸、水晶体亜脱臼の各イベント予測能について、上記の分類と今回のモデルの予後予測能を比較するとDeLongの検定によるp値はそれぞれ、0.030, 0.018, 0.001未満と今回のモデルで有意に優れていた。
【結論】自然言語処理人工知能モデルの利用により、Marfan症候群においてgenotype-phenotype correlationの検討が可能である。