講演情報

[4Yin-B-19]タイポがCoT推論を壊す表層的・内部的要素の解明

〇福畠汐音¹、狩野芳伸¹ (1. 静岡大学)

キーワード：

大規模言語モデル、解釈可能性、Chain-of-Thought推論

大規模言語モデル（LLM）はタイポに対して脆弱であることが知られているが、そのような摂動がChain-of-Thought（CoT）推論を経てどのように誤答を引き起こすかは明らかにされていない. 本研究では、Attention-aware Layer-wise Relevance Propagation（AttnLRP）を用いて推論寄与トークンを特定し、選択的に摂動を適用することでCoT推論への影響を分析する．3つのベンチマークにおける5つのモデルを用いた実験により、タイポから誤答に至る2つの独立した経路が明らかになった：摂動はCoT推論過程の表面的なテキストまたは核心となる概念のいずれかを変化させることで回答を変える．

セッション詳細へ戻る