講演情報

[3E-03]文の類似度による被引用文特定手法の改良

*佐川 俊輔1、金澤 輝一2、上野 史3、太田 学3 (1. 岡山大学工学部工学科情報・電気・数理データサイエンス系情報工学コース太田研究室、2. 国立情報学研究所コンテンツ科学研究系、3. 岡山大学学術研究院環境生命自然科学学域)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

学術論文、引用解析、被引用文特定

学術論文では通常多数の参考文献が引用されており,被引用論文中の被引用箇所の内容を把握することは学術論文を理解する上で重要である.しかし,参考文献は多いため,これには大きな労力と時間が必要となる.西海らは,学術論文中の引用を示す文である引用文の被引用箇所にふさわしい一文である被引用文を特定するために,文の類似度とExtractive QAによる被引用文特定手法を提案した.本稿では,西海らが提案した被引用文特定手法を改良する.改良手法では,引用文と被引用文の類似度を算出し,類似度の差の閾値を利用して適切な被引用文を特定する.実験では,CL-SciSumm Shared Taskで提供されたテストデータと評価プログラムを使用して,被引用文特定の精度すなわち正解の被引用文と特定した文の一致状況のMicro-F1を算出する.実験の結果,西海らの手法のMicro-F1が0.1636だったのに対し,改良手法ではMicro-F1が0.1675となった.