講演情報
[4E-02]観光地間比較のための多様な数値情報と比較表現の正規化
*植田 颯1、宮森 恒1 (1. 京都産業大学 情報理工学部 宮森研究室)
発表者区分:学生
論文種別:ショートペーパー
インタラクティブ発表:あり
論文種別:ショートペーパー
インタラクティブ発表:あり
キーワード:
観光地情報、数値情報、比較表現、変換、LLM
観光は,ストレス解消や幸福度の向上につながる点で人間生活において非常に重要な体験を提供する.したがって,次に訪れる観光地をさまざまな候補の中から自身に合った観点で効率よく比較し吟味できることの需要は高いと考えられる.観光地に関する情報は,公式サイトやSNS,口コミサイトなど異なるプラットフォームで人それぞれの自由な表現で発信されているため,それらを観光地間で比較するのは容易ではない.観光地に関する書き込みは,個人の嗜好に左右されること,季節や時間帯などで評価軸が変動すること,アクセスや料金などの評価基準が多岐に渡るといった特徴もあるため,ある観点での観光地間の比較を行うには,元の書き込みの文脈や単位を含む表現の違いを適切に揃える必要がある.
本稿では,Webサイトやレビューから観光地に関する数値情報や比較表現を抽出し,文脈や単位が異なる状況での表現を,指定された観光地間で比較可能な表現に変換する手法を提案する.具体的には,評価軸はユーザが指定した項目または比較元となる観光地の大きな特徴となる項目を選択する.定性的な比較情報は定量化を試み,LLMによる変換を行なった.実験では,複数の観光地に対して3種類の異なるプラットフォームからデータを収集し,従来手法および提案手法を用いた数値情報および比較表現の抽出・変換結果の妥当性を検証する.
本稿では,Webサイトやレビューから観光地に関する数値情報や比較表現を抽出し,文脈や単位が異なる状況での表現を,指定された観光地間で比較可能な表現に変換する手法を提案する.具体的には,評価軸はユーザが指定した項目または比較元となる観光地の大きな特徴となる項目を選択する.定性的な比較情報は定量化を試み,LLMによる変換を行なった.実験では,複数の観光地に対して3種類の異なるプラットフォームからデータを収集し,従来手法および提案手法を用いた数値情報および比較表現の抽出・変換結果の妥当性を検証する.