講演情報

[2E-02]Webサイト内URLを用いたColBERTによる文書検索の精度向上

*石川 敦也1、酒井 哲也1 (1. 早稲田大学基幹理工学部情報理工学科酒井研究室)
発表者区分:学生
論文種別:ショートペーパー
インタラクティブ発表:あり

キーワード:

情報検索、BERT、HTML

本研究では、Webコーパスに対してBERTベースの手法を用いて文書検索を実施した際に、得られるランキングの適合性を向上させる手法を検討する。このためのアプローチとして、通常は除去されることが多いWebサイト内URLを文書に残した状態で検索を行う。BERTベースの手法としてはColBERTを利用し、NTCIRが提供するユーザークエリと、そのクエリに対する手動による各文書の適合性判定結果を用いて、ERRおよびiRBUによってランキングの適合性を評価する。