講演情報

[1H5-OS-5b-05]タイムスタンプに着目したレビューの有用性の検討

〇杉山 太一1、楊 鯤昊2、藤崎 樹3、植田 一博1 (1. 東京大学、2. 芝浦工業大学、3. 筑波大学)
[[オンライン]]

キーワード:

推薦システム、協調フィルタリング、レビューの時系列分析、社会的影響、データサンプリング

近年,UGCの爆発的増加により推薦システムの重要性が増しているが,多くの手法はレビューを静的な情報として扱っている.本研究では,レストランレビューの投稿時期(累積投稿率)に着目し,どの時期のデータが推薦において高い有用性を持つかを定量的に検証することを目的とした.手法として,Yelp Open Datasetの高価格帯店舗を対象に,レビューを投稿順に基づき分割し,特定の時期のデータのみを用いて協調フィルタリングモデルを構築した.分析の結果,最新に近い「情報飽和期」(累積投稿率70-95%付近)のデータは,全期間のデータを用いた場合と同等以上の高い推薦精度を記録した.一方で,開店直後よりやや遅れた時期である「初期変動期」(5-20%付近)では,他者の評価に追随するハーディング現象等の影響で精度が一時的に低下する傾向が確認された.また,全データを利用するよりも,質の高い特定のサブセットを選択的に利用する方が高い精度を維持できることも実証された.本研究の成果は,情報の時系列的なダイナミズムを考慮した効率的かつ高精度な推薦のためのデータ選別指針を提示するものである.