講演情報
[4Yin-A-23]因果性推論能力を向上させた大規模言語モデルの開発
〇林 ひなた1、小林 一郎1 (1. お茶の水女子大学)
キーワード:
大規模言語モデル、因果推論、思考の連鎖
本研究では,大規模言語モデル(LLM)の因果性に基づく推論能力の性能向上を目的として,LLMに因果性に基づくCoT(Chain of Thought)を用いた自己学習手法「causal-CoT」を構築した.親ノードと子ノードの因果性の高さを求めるためのrcausalという指標を導入し,causal-CoTを行う際の報酬を推論連鎖のrcausalの値の大きさと設定する.報酬に基づいて得られた推論の軌跡を学習に利用することで,LLMの推論性能を向上させることを目指した.数学問題のタスクを対象に,因果関係が高い推論の軌跡を集めた学習データで教師ありファインチューニングを行ったモデルを,CoTのようにstep by stepで出力させて実験を行った結果,提案手法は明確な性能向上を示さず,むしろ,ほんのわずかな性能低下が観測された.ただし,学習に利用したデータ数が少なく,有効性を判断するのは難しいため、今後学習に利用するデータ数を増やすことを目指す.
