講演情報

16:40 〜 16:55

[1H4-OS-5a-05]大規模言語モデルは誰を覚えているか

〇石原祥太郎¹ (1. 株式会社日本経済新聞社)

キーワード：

集合的記憶、暗記、大規模言語モデル、多言語バイアス

大規模言語モデル（LLM）が情報検索の主要な手段となりつつある中で，本研究はLLMがどのような人物を記憶しているかを実証的に検証した．具体的には40年以上の日英のWikipediaの訃報記録を収集し，複数の商用APIやローカルモデルに対して人物情報の想起を試みた．分析の結果(1)LLMは訃報記録に掲載された人物の全てを想起するわけではない(2)日本語版は英語と比べて想起成功率が顕著に低い(3)閲覧数の多い人物や，作家や俳優など文字列化されやすい職業ほど想起されやすい(4)訃報記録では男性が多くを占めるがLLMの想起成功率は女性の方が高い---といった知見が明らかになった．本研究はLLM時代の集合的記憶の在り方を議論する実証的な第一歩である．

コメントの閲覧・投稿にはログインが必要です。ログイン

セッション詳細へ戻る