講演情報

[7B-02]強化学習の言語情報獲得に向けた文章ベクトル生成手法

*村上 遼太郎1、太田 学2、上野 史2 (1. 岡山大学工学部 情報・電気・数理データサイエンス系 情報工学コース 太田研究室 、2. 岡山大学 学術研究院環境生命自然科学学域)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

強化学習、自然言語、文章埋め込み、大規模言語モデル

強化学習(Reinforcement Learning)は,エージェントが試行錯誤を通じて最適な行動を学習する手法として,自動運転などの幅広い分野で研究されている.近年では,複雑な条件やルールを含む現実世界の課題への適用のために,大規模言語モデルを用いた強化学習の補助的なアプローチが注目されている.本研究では,強化学習の自然言語による情報の活用を目的とし,その基盤技術としてテキストデータの埋め込み処理に焦点を当てる.テキストベースの強化学習フレームワークに埋め込みモデルを適用して学習効率の比較実験をした.実験結果より,大規模言語モデルによる埋め込みモデルを使用することでテキストデータを高精度にエンベディングすることが可能になり,従来手法と比較して学習効率が向上した.