講演情報

[3F1-OS-8-06]女性がん患者SNS投稿からの治療内容・有害事象及び時系列情報抽出タスクに対する大規模言語モデルの性能評価

〇河口 佳典1、柳澤 友希1、土屋 雅美1、久村 颯海1、木﨑 速人1、今井 俊吾1、西山 智弘2、荒牧 英治2、上田 暢子3、淀川 知子3、堀 里子1 (1. 慶應義塾大学、2. 奈良先端科学技術大学院大学、3. 一般社団法人ピアリング)

キーワード:

大規模言語モデル、ソーシャルネットワークサービス、女性がん患者

大規模言語モデル(LLM)を活用して,SNS投稿から治療や有害事象を抽出する研究は,現時点で限定的である.本研究は,女性がん患者SNSコミュニティPeer Ringの投稿を対象に,非構造かつ文脈依存的な患者SNS投稿から,治療内容,有害事象,およびそれらの時系列情報を抽出する情報抽出タスクに対するLLMの有用性を検証することを目的とした.乳がん術前化学療法に用いられる治療名のいずれかを記述した99例(ユニークID)の患者による投稿100件を対象とし,GPT-4.1を用いて,治療および有害事象のイベントラベル,イベント内容,発生日,開始や終了といったイベントステータスを投稿内容に基づき自動抽出した.LLMによる抽出結果を人手アノテーション結果と比較し,Precision,Recall,F1-scoreにより性能評価を行った.その結果,時系列関連項目を含む全項目においてF1-score0.9以上が達成された.本研究は,女性がん患者が発信するSNS投稿から治療経過および有害事象の時間的推移を可視化するための基盤技術を提供し,その情報抽出タスクにおけるLLMの有用性を示唆するものである.