講演情報
[1H4-OS-5a-05]大規模言語モデルは誰を覚えているか
〇石原 祥太郎1 (1. 株式会社日本経済新聞社)
キーワード:
集合的記憶、暗記、大規模言語モデル、多言語バイアス
大規模言語モデル(LLM)が情報検索の主要な手段となりつつある中で,本研究はLLMがどのような人物を記憶しているかを実証的に検証した.具体的には40年以上の日英のWikipediaの訃報記録を収集し,複数の商用APIやローカルモデルに対して人物情報の想起を試みた.分析の結果(1)LLMは訃報記録に掲載された人物の全てを想起するわけではない(2)日本語版は英語と比べて想起成功率が顕著に低い(3)閲覧数の多い人物や,作家や俳優など文字列化されやすい職業ほど想起されやすい(4)訃報記録では男性が多くを占めるがLLMの想起成功率は女性の方が高い---といった知見が明らかになった.本研究はLLM時代の集合的記憶の在り方を議論する実証的な第一歩である.
