講演情報

[4Yin-A-23]因果性推論能力を向上させた大規模言語モデルの開発

〇林ひなた¹、小林一郎¹ (1. お茶の水女子大学)

キーワード：

大規模言語モデル、因果推論、思考の連鎖

本研究では，大規模言語モデル（LLM）の因果性に基づく推論能力の性能向上を目的として，LLMに因果性に基づくCoT（Chain of Thought）を用いた自己学習手法「causal-CoT」を構築した．親ノードと子ノードの因果性の高さを求めるためのr_causalという指標を導入し，causal-CoTを行う際の報酬を推論連鎖のr_causalの値の大きさと設定する．報酬に基づいて得られた推論の軌跡を学習に利用することで，LLMの推論性能を向上させることを目指した．数学問題のタスクを対象に，因果関係が高い推論の軌跡を集めた学習データで教師ありファインチューニングを行ったモデルを，CoTのようにstep by stepで出力させて実験を行った結果，提案手法は明確な性能向上を示さず，むしろ，ほんのわずかな性能低下が観測された．ただし，学習に利用したデータ数が少なく，有効性を判断するのは難しいため、今後学習に利用するデータ数を増やすことを目指す．

セッション詳細へ戻る