Presentation Information

[4Yin-A-37]Transfer Learning Approaches for Sequential Sentence Classification in Japanese Abstracts

〇Kazuhiro Yamauchi1, Waka Yasuo1, Marie Katsurai1 (1. Doshisha University)

Keywords:

Sequential Sentence Classification,Transfer Learning,Scholarly Document Processing

学術論文の抄録における逐次文分類(SSC)には,ドメイン固有のラベル付きデータが必要であり,手動アノテーションによる作成にはコストがかかる.本研究では,転移学習により,コンピュータサイエンス(CS)分野における効果的な日本語SSCが実現可能かどうかを検証する.新たに日本語CSデータセット(900件)を構築し,英語CSデータからの言語間転移と日本語医学データからの言語内転移を比較した.実験の結果,転移性能には言語類似性よりもドメイン類似性の方が寄与することが明らかになった.これは,対象ドメインデータが不足している場合でも,他言語の既存データセットをSSCに活用できることを示している.