Presentation Information
[1H4-OS-5a-05]Who Do Large Language Models Memorize?
〇Shotaro Ishihara1 (1. Nikkei Inc.)
Keywords:
Collective Memory,Memorization,Large Language Models,Multilingual Bias
大規模言語モデル(LLM)が情報検索の主要な手段となりつつある中で,本研究はLLMがどのような人物を記憶しているかを実証的に検証した.具体的には40年以上の日英のWikipediaの訃報記録を収集し,複数の商用APIやローカルモデルに対して人物情報の想起を試みた.分析の結果(1)LLMは訃報記録に掲載された人物の全てを想起するわけではない(2)日本語版は英語と比べて想起成功率が顕著に低い(3)閲覧数の多い人物や,作家や俳優など文字列化されやすい職業ほど想起されやすい(4)訃報記録では男性が多くを占めるがLLMの想起成功率は女性の方が高い---といった知見が明らかになった.本研究はLLM時代の集合的記憶の在り方を議論する実証的な第一歩である.
