講演情報
[8B-03]単語の意味情報付与による文書分類法TextGCNの分類精度向上
*西尾 彰悟1、井上 裕貴1、猪口 明博1 (1. 関西学院大学)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
文書分類、Graph Neural Network、TextGCN、シソーラス、単語の意味情報
電子文書をその内容に基づいてクラスに分類する文書分類問題が注目されており,スパム検出やニュースフィルタリングなど幅広く応用されている.文書分類の精度向上には,文書の特性を捉える潜在表現ベクトルの獲得が重要であり,近年ではニューラルネットワークを用いた手法が多く研究されている.その中でも,文書集合をグラフとして表現するTextGCNは,単語の共起情報を活用して文書を分類する手法であり,LSTMやfastTextを上回る分類性能であることが報告されている.しかし,TextGCNが主として活用しているのは単語の共起情報であり,単語の意味情報を利用しておらず改善の余地をもつ.本研究では,この課題に対処するため,TextGCNに単語の意味情報を付与し,単語の共起情報と意味情報を独立に学習し,それらの統合する学習モデルを提案する.TextGCNに単語の意味情報を付与する具体的な方法として,シソーラスを用いて単語間の類似度を活用する.これにより,文書分類精度の向上を目指す.