講演情報

[1Yin-A-24]深層学習OCRを用いた在留カード文書画像からの情報抽出と構造化

〇伊藤千恵¹、馮一峻¹ (1. 第一工科大学工学部情報・AI・データサイエンス学科)

キーワード：

深層学習ベースOCR、文書画像理解、情報抽出、身分証明書解析

本研究では、深層学習OCRを用いて在留カード文書画像から主要情報を自動抽出し、構造化データとして出力する情報処理手法の設計および評価を行った。近年、留学生数の増加に伴い、大学における在留カード確認業務の効率化が求められている。本研究では、テンプレートに依存しない柔軟な情報抽出を実現するため、Vision-Language Model を用いた深層学習ベースOCRと意味推論を組み合わせた処理パイプラインを構築した。抽出結果に対して正規表現およびルールベース整形処理を適用し、CSV／JSON形式の構造化データを生成した。スキャン画像20枚およびスマートフォン撮影画像11枚を用いた評価の結果、在留カード番号、氏名、生年月日など7項目で90～100%の高い正解率を達成した。一方、住所項目については文字誤り率（CER）を用いて詳細に分析し、文字レベルでは一定の認識性能が得られることを確認した。本手法は、制度変更やレイアウト変化に柔軟に対応可能な身分証明書情報抽出基盤として有用である。

コメントの閲覧・投稿にはログインが必要です。ログイン

セッション詳細へ戻る