講演情報
[3J-04]大規模言語モデルを用いたマイクロブログからのイベント情報抽出に基づく人口変動予測
*増田 颯天1、豊田 正史2、吉永 直樹2 (1. 東京大学大学院情報理工学系研究科、2. 東京大学生産技術研究所)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
ソーシャルメディア、地理データ、行動データ、LLM
イベント会場周辺の人口変動は,その日のイベントの有無や種類によって大きく変化し,周囲に様々な影響を与えるため,その予測は重要な課題である.イベント会場における人口の予測には将来のイベント情報が必要となるが,過去の人口時系列データのみでは精度の高い予測が難しく,それに対してイベント会場と予測する日付に言及したマイクロブログ投稿の集合を入力に加えることで精度を改善する手法が提案されている.しかし,投稿に含まれる情報は多様であり,中には実際のイベントとは無関係なノイズとなるような投稿も含まれる問題や,様々なアーティストが利用するコンサート会場では予測精度が低いといった課題がある.本研究では,内容が多様であるマイクロブログ投稿から適切に特徴量を抽出するとともに結果の解釈性を向上させるために,大規模言語モデルによりマイクロブログ投稿集合からイベント情報を抽出し人口変動の時系列予測モデルに用いる手法を提案する.実験では混雑統計データとTwitterデータセットを用いて関東のイベント会場における24時間先までの人口予測を行い,その精度を調査した.