講演情報
[1Yin-A-29]マルチモーダル創薬基盤モデルにおける未知タンパク質への外挿性の検証
〇伊東 駿一1,2、荒川 晶彦1、水谷 圭佑1 (1. 中外製薬株式会社、2. 京都大学)
キーワード:
創薬AI、基盤モデル、タンパク質言語モデル、マルチモーダル学習、外挿性・汎化性能
近年,創薬における基盤モデルの利用が進む中,タンパク質や化合物を統合学習したマルチモーダル基盤モデルが注目されている.しかし,創薬実務で重要となる未知 (OOD) のタンパク質に対する外挿性は十分に検証されていない.本研究ではBindingDB を用い,MAMMAL と,単一モダリティモデル(ESM-2,ChemBERTa)をCross Attention 等で統合したモデルを比較検証した.実験の結果,MAMMAL は学習時の損失(RMSE)において最も優れる一方,学習データに含まれないタンパク質ファミリーに対しては予測性能が著しく低下した.対照的に,単一モダリティモデルをCross Attention で統合した手法は,少パラメータながら物理化学的な相互作用を捉えることで,未知のタンパク質に対しても一定の予測性能を維持した.以上より,新規ターゲット予測が求められる実務においては,相互作用を考慮し単一モダリティモデルを組み合わせる手法が,汎用性と実用性の観点で優れている可能性が示唆された.
