講演情報

[3E-01]ReSHQ: クエリと仮想クエリの類似度によるリランキング

*福岡 啓人1、宮森 恒1 (1. 京都産業大学先端情報学研究科先端情報学専攻宮森研究室)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

情報検索、リランキング、仮想クエリ生成、言語モデル、RAG

本研究では,ラベル付きデータセットを必要とせず,言語モデルの内部知識に依存しにくいリランキング手法ReSHQを提案する.情報検索における従来手法HyDEは,InstructLMを用いてクエリと指示文に対する仮想文書を生成することで,より包括的に関連文書を取得できる点で優れている.しかし,検索性能の良し悪しが言語モデルの内部知識に依存しているという問題がある.提案手法ReSHQでは,文書からRAGを用いて仮想クエリを生成し,クエリとの類似度を算出して文書をリランキングする.これにより,言語モデルの内部知識に左右されにくい検索が期待できる.実験では,本手法および比較手法を用いて検索性能を検証した.その結果,ウェブ検索においてnDCG@10で言語モデルのパラメータが小さい場合でも,高い性能を達成することができた.