講演情報
[2Yin-B-10]大規模言語モデルからの知識蒸留による低コストな顧客怒り度推定システムの開発
〇山田 有沙人1、ジェプカ ラファウ1 (1. 北海道大学)
キーワード:
感情、感情強度、大規模言語モデル、機械学習
近年,テキスト対応の普及に伴い,カスタマーハラスメント対策として顧客の怒り検出が求められているが,日本語の専門データ不足が課題である.そこで本研究では,生データでは怒り度の弱・強両端が不足していた不満調査データに GPT-4o を用いて怒り度を付与し,さらに 5 段階の度合いに応じた言い換え生成と WRIME による補正を行い,分布の偏りを解消した教師データを構築した.続いて,実運用を見据え,複数の特徴表現と回帰モデルの組合せで低コスト推定器を評価した.その結果,SVM + TF-IDF は upper bound とした GPT-4o の直接推論と比べて精度が限定的だった一方,埋め込みモデルによる特徴表現へ変更することで推定精度の改善が確認できた.以上より,提案手法は推論時に高コストな LLM に依存せずとも,実運用を想定した実用的な怒り度推定に有用であることを示した.
