Presentation Information
[4Yin-A-23]Development of a large language model with improved causal inference capabilities
〇Hinata Hayashi1, Ichiro Kobayashi1 (1. Ochanomizu University)
Keywords:
LLM,Causal Inference,Chain of Thought
本研究では,大規模言語モデル(LLM)の因果性に基づく推論能力の性能向上を目的として,LLMに因果性に基づくCoT(Chain of Thought)を用いた自己学習手法「causal-CoT」を構築した.親ノードと子ノードの因果性の高さを求めるためのrcausalという指標を導入し,causal-CoTを行う際の報酬を推論連鎖のrcausalの値の大きさと設定する.報酬に基づいて得られた推論の軌跡を学習に利用することで,LLMの推論性能を向上させることを目指した.数学問題のタスクを対象に,因果関係が高い推論の軌跡を集めた学習データで教師ありファインチューニングを行ったモデルを,CoTのようにstep by stepで出力させて実験を行った結果,提案手法は明確な性能向上を示さず,むしろ,ほんのわずかな性能低下が観測された.ただし,学習に利用したデータ数が少なく,有効性を判断するのは難しいため、今後学習に利用するデータ数を増やすことを目指す.
