講演情報

[B1-01]自動評価モデルの評価信号によるマルチターン対話の重み付け指示チューニング手法

*夏賀 風波1、是津 耕司1 (1. 名古屋大学)

キーワード:

大規模言語モデル、マルチターン対話、重み付け指示チューニング、自動評価モデル、評価信号に基づく学習