講演情報
[5L-03]LLMによる未閲覧情報の提示のためのクエリと既知情報の対応関係に基づく動的プロンプト生成
*高橋 楊生1、下田 颯太1、堀川 達平1、北山 大輔1 (1. 工学院大学)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
大規模言語モデル、Web 検索支援、検索推薦
情報検索を行う際、クエリ推薦はユーザの検索の手助けになることが多い。しかし、推薦されるクエリは、ユーザにとって未知の情報かどうかを考慮していないことが多い。そのため既存のクエリ推薦では、ユーザがすでに調べたキーワードが推薦されてしまうことがある。そこで、本研究では大規模言語モデルを用いて、閲覧履歴からユーザの既知のトピックを予測させ、それをもとに適切な情報を提示する手法を提案する。まず、ユーザのWeb閲覧履歴の各Webページを主要な文による要約に変換する。その要約文を用いてWebページのクラスタリングを行い、ユーザの既知トピックとする。次にユーザが入力したクエリの検索結果をもとにクエリを表現する文を得る。クエリ文とクラスタの類似度を測り、既知の知識と現在調べようとしていることの対応関係を決定する。閲覧Webページの内容を対応関係に基づいて埋め込んだプロンプトを生成し、大規模言語モデルに与えることで未知の観点を出力させる。実験結果として、トピックとサブトピックの平均スコアは、クエリ履歴や主要文を用いない場合にスコアが高くなる傾向が見られた。特に、トピックの平均スコアではクエリ履歴を使用し、主要文を使用しない場合に高いスコアを得られることが分かった一方で、サブトピックの平均スコアにおいては、クエリ履歴を使用しない方がスコアが向上した。以上より、トピックやサブトピックを効果的に生成するためには、クエリ履歴や主要文の使い方が重要であり、広範なトピック生成にはクエリ履歴を使用しない方が有効である可能性が示唆された。