Presentation Information

[4M5-GS-2f-03]A Method for Improving Cross-Domain ABSA via Source-Domain Sentence Concatenation Augmentation

〇Sirui Sun1, Yuta Sakai1, Tengfei Shao1, Masayuki Goto1 (1. Waseda University)

Keywords:

Aspect-based Sentiment Analysis,Data Augmentation,Domain Adaptation,Structural Diversity

クロスドメインアスペクトベース感情分析は,ラベル付きデータが豊富なソースドメインの知識を,ラベルなしターゲットドメインへ転移させることを目的とした手法である.しかし,ソースドメインが文構造の単純なドメインであり,ターゲットドメインが複数の評価対象が密集した長文を含むドメインである場合,既存手法は深刻な汎化性能の低下を示す.特に,アスペクト-感情トリプレットの予測再現率の低下が課題となっている.ドメイン間の文章長の差異に対処するため,本研究ではソースドメインに基づくデータ拡張手法を提案する.具体的には,文の意味的な類似性でクラスタリングしたクラスタ内の複数文を結合する方法,並びに文構造の多様性を高めるためにランダムに文を結合する方法を提案し,比較検証した.文構造が比較的単純なレストランおよびラップトップレビューをソースドメインとし,ゲームレビューデータセットをターゲットドメインとした実験の結果,再現率とF1値の有意な向上が確認された.さらに,ソースドメインの特性によって最適なデータ拡張手法が異なる点を明らかにし,データセットの特性と拡張手法の関係について新たな知見を提供する.