講演情報
[1Yin-B-41]大規模言語モデルを用いた電子カルテデータの時系列解析と大腸がん治療の効果予測
〇坂根 亜美1、神谷 知里1、河口 拳士1、橋本 悠生2、堀口 裕正2、狩野 芳伸1 (1. 静岡大学、2. 国立病院機構)
キーワード:
電子カルテ、がん、言語モデル
本研究では,大腸がん患者7,257名の電子カルテデータ(検査値,薬物療法,患者基本情報)を用いて,次回の読影検査における治療効果(進行,安定,奏効)の予測に取り組んだ.時系列データの欠損値を補完するため,大規模言語モデル(LLM)を活用した時系列補間手法「TimeLLM」を導入し,4つのLLMと2種類のプロンプト構成を組み合わせて,12種類の補間データセットを構築した.予測手法として,XGBoostによる教師あり分類とGPT-OSSによるZero-shot分類(単一日入力,複数日入力)を比較した.XGBoostは2値分類(進行/非進行)で最大77.44%の精度を達成し,3値分類では精度が57.83%に達した.LLMでは,過去の診療経過を含む複数日入力が,単一日入力と比較して,3値分類でMacro F1を+12.0,2値分類で+7.8ポイント向上させ,XGBoostと同等の性能に到達した.さらに,XGBoost,LLM,基準日保持の3モデルによる加重平均アンサンブルで,2値分類のMacro F1がXGBoostと比較して+2.23〜3.23ポイント改善した.特徴量貢献度も臨床的に妥当な結果を示した.
