講演情報

[3B-04]大規模言語モデルを用いた正確な出力長制御を伴う日本語要約生成

*伴 雄哉1、宮森 恒1 (1. 京都産業大学情報理工学部宮森研究室)
発表者区分:学生
論文種別:ショートペーパー
インタラクティブ発表:あり

キーワード:

LLM、文書要約、出力長制御、プロンプト、指示チューニング

本稿では,指定された出力長を正確に満たす日本語要約生成の問題に取り組む.要約において正確に出力長を制御することは,文字数制限が存在する実用的な場面で,限られたスペース内に必要な情報を過不足なく収め,適切かつ効果的な情報伝達を実現するために重要である.従来手法では,日本語の文字数を指定した要約生成において,指示した文字数どおりの出力を安定して得ることは困難であり,妥当な意味内容を保持した上で出力長を適切に制御することが課題となる.本稿では,日本語LLMで出力された要約文字数と指定文字数との差分を明示したプロンプトを再度日本語LLMに入力し,出力長が制約の文字数になるまで要約生成を繰り返す手法を提案する.実験では,さまざまな規模のモデルを用いて要約を生成し,元の文書文字数,指定文字数,要約内容の妥当性,反復回数の間にどのような関係があるかを明らかにする.