講演情報
[6L-04]多言語検索における質問クエリとキーワードクエリの性能評価
*松田 明梨1、加藤 誠1 (1. 筑波大学)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
情報検索、多言語検索、クエリ形式
本研究では,18言語を対象に,質問クエリとキーワードクエリの検索有効性を比較し,言語特性が検索有効性の差異に与える影響を検討した.実験には,語彙ベースの検索モデル(BM25)および大規模言語モデル(LLM)ベースの検索モデル(mDPR,mContriever)を使用した.BM25では,多くの言語においてクエリ形式の影響は限定的であった.一方,LLMベースの検索モデルでは,多くの言語においてキーワードクエリの検索有効性が質問クエリよりも低下する傾向が観察された.ただし,mDPRにおいて,低リソース言語に分類されるテルグ語やスワヒリ語では,キーワードクエリの検索有効性が質問クエリを上回った.この結果は,クエリ形式の影響が言語ごとに異なり,その要因として言語リソースの規模が関連する可能性を示唆する.