講演情報

[4G-03]表画像を入力とする表構造解析手法の分析と改良

*納田 朋享1、金澤 輝一2、上野 史3、太田 学3 (1. 岡山大学工学部工学科情報・電気・数理データサイエンス系情報工学コース太田研究室、2. 国立情報学研究所コンテンツ科学研究系、3. 岡山大学学術研究院環境生命自然科学学域)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり

キーワード:

表構造解析、表認識、電子図書館、表画像

学術論文では実験結果や統計情報がよく表にまとめられるため,表を自動解析できれば表からグラフへの自動変換や表情報の集約などに活用できる.そのため,表構造解析の研究が行われており,とりわけ汎用性の高さから表画像解析の研究に関心が集まっている.そこで本稿では,Yeらの表画像を入力とする表構造解析の改良手法を提案する.Yeらの手法では,表構造解析をセルの特定,トークン検出,トークン認識,トークンのセルへの割り当ての4つに分割することで,入力された表画像に対応するHTMLコードを出力する.本稿では,追加学習および推定された表構造の列数を利用した後処理を行うことで,これを改良する.実験では,ICDAR 2021 Competition on Scientific Literature Parsing (ICDAR2021-SLP)のテスト用データの表画像を用いて表構造解析精度を評価し,ICDAR2021-SLPで提案された他の手法等と比較した.その結果,追加学習により表構造解析精度の指標であるTEDSの値が0.9590から0.9597へ0.0007上昇した.しかし,後処理を追加したときは表構造解析精度の変化はみられなかった.