講演情報
[5M3-GS-2h-05]レジーム間KL情報量によるレビュー評点時系列の異常度分析と多群出現順位統計量による系列比較
〇武石 悠希1、髙井 健人5、周 律旋2、小林 舞2、君島 真沙実2、山岸 祐己1,2,3、谷口 ジョイ1,4、高林 貴仁2 (1. 静岡理工科大学、2. 株式会社良品計画、3. 浜松医科大学、4. 国立国語研究所、5. 株式会社ジーニー)
キーワード:
異常検知、レジームスイッチング、時系列データ分析
ECサイトのレビュー評点(例えば1~5点)のようなカテゴリカル時系列データでは,データマーケティングの観点において,評点分布の変化区間を捉えるだけでなく,各区間がどの程度特異かを定量化することが求められる.よって,本研究では,多項分布レジームスイッチングモデルを動的計画法とMDL基準で解く枠組みに,レジーム間の双方向KL情報量を用いた異常度スコアを導入する.
より詳細には,各レジームを他の全レジームと比較したKL情報量の総計を各レジームの異常度とし,さらにそれらレジーム異常度の総計について,レジーム数の多寡によるバイアスを排除するため,推定されたレジーム数によって補正し,各系列ごとで算出することによって,系列間での比較可能性を検討する.
加えて,特定の系列が全体の中で異常度の上位に偏在しているかを検証するため,各系列対その他(One-vs-Rest)における順位和検定を適用し,その結果をz-scoreとして算出する.これにより,各系列の商品における評価傾向の急激な偏りや安定性のある状態等の商品特性のプロファイリングが可能となり,意思決定に寄与することが期待される.
より詳細には,各レジームを他の全レジームと比較したKL情報量の総計を各レジームの異常度とし,さらにそれらレジーム異常度の総計について,レジーム数の多寡によるバイアスを排除するため,推定されたレジーム数によって補正し,各系列ごとで算出することによって,系列間での比較可能性を検討する.
加えて,特定の系列が全体の中で異常度の上位に偏在しているかを検証するため,各系列対その他(One-vs-Rest)における順位和検定を適用し,その結果をz-scoreとして算出する.これにより,各系列の商品における評価傾向の急激な偏りや安定性のある状態等の商品特性のプロファイリングが可能となり,意思決定に寄与することが期待される.
