講演情報

[1G5-OS-13c-06]社会的関心の尺度として Wikipedia 閲覧数を利用した Web メディアの記事人気予測

羽根田 賢和1、〇大竹 孝樹2、塙 一晃2、樋口 泰地2、山口 学2 (1. 東北大学、2. 株式会社講談社 IT戦略企画室)

キーワード:

自然言語処理、Wikipedia、産業応用、出版

Web メディアにおいて記事のタイトルは PV(ページビュー)獲得を左右する極めて重要な要素である。機械学習技術を用いて記事タイトルの案から公開後の PV を予測することで、編集者がタイトル作成にかかる手間を削減したり、どのようなテーマの記事が PV が伸びやすいかの判断に活用したりすることが可能である。既存手法が静的なテキスト情報のみに基づくのに対し、本研究では、PV が芸能や国際情勢といった動的な社会的トレンドに大きく影響を受けるという性質に注目し、記事公開時の社会的関心という外部要因を考慮した PV 予測を目指す。具体的には、Wikipedia の日次閲覧数を社会的関心の代替指標とし、予測器の入力である記事タイトルに閲覧数上位のページタイトルを付加することで、記事公開時点の社会的関心を反映した予測を行う。Web メディアの実データを用いた評価実験により、提案手法が平均的な予測精度を安定して向上させたことを報告する。

コメント

コメントの閲覧・投稿にはログインが必要です。ログイン