講演情報
[3E-04]密検索モデルのフレーズクエリ解釈能力の改善
*土戸 翔太1、加藤 誠1 (1. 筑波大学)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
検索モデル、評価・データセット、コーパス構築
本研究では、密検索モデルがフレーズクエリ(「" "」によって囲まれた複合名詞を含むクエリ)をどの程度解釈可能であるかを評価し,その性能を向上することを目的とする. 改善のための手法としては,既存の密検索学習用のデータセットにおいて,複合名詞が文書内に含まれるか否かを基準に正例・負例を再設定し、これによって密検索モデルを学習する方法を提案する. 実験では、MSMARCO Passageデータセットを用いて密検索モデルがクエリ構文を解釈できるかを評価した. 評価の結果、現在の密検索モデルはフレーズクエリに対して性能を発揮でき,また,提案手法による改善も見られた.