講演情報
[5G3-OS-37b-03]欲求指向知識とRAGを用いた対話ナビゲーションシステムのためのプロンプト圧縮手法
〇下間 宇晟1,2、チャクラボルティ シュデシナ1、森田 武史1,2、太田 葵2、浅田 真生2、江上 周作2、鵜飼 孝典2,3、濱崎 雅弘2 (1. 青山学院大学、2. 産業技術総合研究所、3. 富士通株式会社)
キーワード:
欲求指向の環境知識ベース、プロンプト圧縮、ナビゲーション、大規模言語モデル、検索拡張生成
本研究では、仮想環境や実世界でエージェントが環境と相互作用しながら行動するEmbodied AI分野における対話型ナビゲーションを対象とし、欲求指向知識とRetrieval-Augmented Generation(RAG)を用いたプロンプト圧縮手法を提案する。従来のLLMベース手法では、環境内の全知識をプロンプトに埋め込むため、オブジェクト数の増加に伴いプロンプト長が肥大化し、推論精度の低下やAPI利用コストの増大が課題であった。本研究では、マレーの欲求理論に基づく欲求指向の環境知識ベースを構築し、ユーザ要求に関連する欲求およびオブジェクトのみをRAGにより選択的に取得する手法を提案する。評価には家庭内シミュレータVirtualHomeを用い、OpenEQAに基づいて構築した対話型ナビゲーション用データセットにより、欲求推定およびオブジェクト推定の精度とプロンプト長を評価した。その結果、提案手法は従来手法と比較して、プロンプト長を大幅に削減しつつナビゲーション精度を向上させることを確認した。
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン
