講演情報

[1Yin-B-41]大規模言語モデルを用いた電子カルテデータの時系列解析と大腸がん治療の効果予測

〇坂根亜美¹、神谷知里¹、河口拳士¹、橋本悠生²、堀口裕正²、狩野芳伸¹ (1. 静岡大学、2. 国立病院機構)

キーワード：

電子カルテ、がん、言語モデル

本研究では，大腸がん患者7,257名の電子カルテデータ（検査値，薬物療法，患者基本情報）を用いて，次回の読影検査における治療効果（進行，安定，奏効）の予測に取り組んだ．時系列データの欠損値を補完するため，大規模言語モデル（LLM）を活用した時系列補間手法「TimeLLM」を導入し，4つのLLMと2種類のプロンプト構成を組み合わせて，12種類の補間データセットを構築した．予測手法として，XGBoostによる教師あり分類とGPT-OSSによるZero-shot分類（単一日入力，複数日入力）を比較した．XGBoostは2値分類（進行/非進行）で最大77.44%の精度を達成し，3値分類では精度が57.83%に達した．LLMでは，過去の診療経過を含む複数日入力が，単一日入力と比較して，3値分類でMacro F1を+12.0，2値分類で+7.8ポイント向上させ，XGBoostと同等の性能に到達した．さらに，XGBoost，LLM，基準日保持の3モデルによる加重平均アンサンブルで，2値分類のMacro F1がXGBoostと比較して+2.23〜3.23ポイント改善した．特徴量貢献度も臨床的に妥当な結果を示した.

セッション詳細へ戻る