Presentation Information
[5M3-GS-2h-05]Anomaly Analysis of Review Rating Time Series using Inter-Regime KL Divergence and Series Comparison via Multi-group Rank Statistics
〇Yuki Takeishi1, Kento Takai5, Zhou Lyuxuan2, Mai Kobayashi2, Masami Kimijima2, Yuki Yamagishi1,2,3, Joy Taniguchi1,4, Takahito Takabayashi2 (1. Shizuoka Institute of Science and Technology, 2. Ryohin Keikaku Co.,Ltd., 3. Hamamatsu University School of Medicine, 4. National Institute for Japanese Language and Linguistics, 5. Geniee Inc.)
Keywords:
Anomaly detection,Regime switching,Time Series Data Analysis
ECサイトのレビュー評点(例えば1~5点)のようなカテゴリカル時系列データでは,データマーケティングの観点において,評点分布の変化区間を捉えるだけでなく,各区間がどの程度特異かを定量化することが求められる.よって,本研究では,多項分布レジームスイッチングモデルを動的計画法とMDL基準で解く枠組みに,レジーム間の双方向KL情報量を用いた異常度スコアを導入する.
より詳細には,各レジームを他の全レジームと比較したKL情報量の総計を各レジームの異常度とし,さらにそれらレジーム異常度の総計について,レジーム数の多寡によるバイアスを排除するため,推定されたレジーム数によって補正し,各系列ごとで算出することによって,系列間での比較可能性を検討する.
加えて,特定の系列が全体の中で異常度の上位に偏在しているかを検証するため,各系列対その他(One-vs-Rest)における順位和検定を適用し,その結果をz-scoreとして算出する.これにより,各系列の商品における評価傾向の急激な偏りや安定性のある状態等の商品特性のプロファイリングが可能となり,意思決定に寄与することが期待される.
より詳細には,各レジームを他の全レジームと比較したKL情報量の総計を各レジームの異常度とし,さらにそれらレジーム異常度の総計について,レジーム数の多寡によるバイアスを排除するため,推定されたレジーム数によって補正し,各系列ごとで算出することによって,系列間での比較可能性を検討する.
加えて,特定の系列が全体の中で異常度の上位に偏在しているかを検証するため,各系列対その他(One-vs-Rest)における順位和検定を適用し,その結果をz-scoreとして算出する.これにより,各系列の商品における評価傾向の急激な偏りや安定性のある状態等の商品特性のプロファイリングが可能となり,意思決定に寄与することが期待される.
