講演情報

[2A-01]日本語におけるadversarial text生成手法の検討

*真壁 潤1、酒井 哲也1 (1. 早稲田大学基幹理工学部情報理工学科酒井研究室)
発表者区分:学生
論文種別:ショートペーパー
インタラクティブ発表:あり

キーワード:

adversarial text、adversarial example

本研究では、日本語でのadversarial textの生成方法について、新たな手法を提案する。提案手法は文章中の重要語を特定し、重要度が高い単語に対してSynonyms(類義語),Homophones(同音異義語),Radicals(偏と旁に分解),Similar-Shapes(形の似た単語),Typoglyceima(並び替え)という5つの手法を適用し、original textからの変化が大きいものを採用するものである。
攻撃対象とするモデルは日本語感情分析モデルである。モデルへの評価と人間への評価を実施しており、モデルへの評価はoriginal textとadversarial textのラベルとスコアの変化にて評価を行った。人間への評価はadversarial textが人間にどのように認知されるのかという調査するため、アンケートを用いて評価を行った。