The 40th Annual Conference of the Japanese Society for Artificial Intelligence, 2026

Presentation Information

[4Yin-A-23]Development of a large language model with improved causal inference capabilities

〇Hinata Hayashi¹, Ichiro Kobayashi¹ (1. Ochanomizu University)

Keywords:

LLM,Causal Inference,Chain of Thought

本研究では，大規模言語モデル（LLM）の因果性に基づく推論能力の性能向上を目的として，LLMに因果性に基づくCoT（Chain of Thought）を用いた自己学習手法「causal-CoT」を構築した．親ノードと子ノードの因果性の高さを求めるためのr_causalという指標を導入し，causal-CoTを行う際の報酬を推論連鎖のr_causalの値の大きさと設定する．報酬に基づいて得られた推論の軌跡を学習に利用することで，LLMの推論性能を向上させることを目指した．数学問題のタスクを対象に，因果関係が高い推論の軌跡を集めた学習データで教師ありファインチューニングを行ったモデルを，CoTのようにstep by stepで出力させて実験を行った結果，提案手法は明確な性能向上を示さず，むしろ，ほんのわずかな性能低下が観測された．ただし，学習に利用したデータ数が少なく，有効性を判断するのは難しいため、今後学習に利用するデータ数を増やすことを目指す．

Back to Session information