講演情報

[2L1-GS-10t-02]商品説明文を対象としたECRTMとLLMによる反復的トピック洗練に関する一考察

〇鷹羽 慧1、王 嘉翊1、楊 添翔2、邵 騰飛1、後藤 正幸1 (1. 早稲田大学、2. 慶應義塾大学)

キーワード:

トピックモデル、ECRTM、大規模言語モデル、トピック洗練、商品説明文

競合製品の位置づけを行う外部評価者にとって,既存のカテゴリ体系とは異なる観点から商品群を整理することは重要である.特に,機能的特徴や利用シーンといった意味的側面に基づく商品グルーピングは,ユーザの細かなニーズを捉える上で有用である.しかし,EC市場の拡大に伴い商品数が急増する中,意味的側面に基づく体系化を人手のみで行うことには限界がある.そのため,新たな分類軸を自動的に抽出する手法が求められている.このような課題に対し,意味的側面を直接含む情報源である商品説明文にトピックモデルを適用することが有用と考えられる.一方で,短文で語彙の多様性が高い商品説明文に対しては,従来の単語共起に基づくトピックモデルでは解釈性の低いトピックが生成されやすいという課題がある.そこで本研究では,Embedding Clustering Regularization Topic Model(ECRTM)と大規模言語モデルによるトピック洗練を反復的に統合した手法を提案する.実データを用いた評価実験を通じて,解釈性の高い分類軸を自動抽出できることを示し,外部評価者の商品群整理支援のための手法としての有効性を示す.

コメント

コメントの閲覧・投稿にはログインが必要です。ログイン