Presentation Information

[1H01]A VLM-based Parsing Method for Nuclear-related Document

Zixuan HE1, *Yuta TAKIHANA1, Kazuyuki DEMACHI1 (1. UTokyo)

Keywords:

Nuclear Maintenance,Document Parsing,Information Extraction,Artificial Intelligence

本研究では、先端的な視覚言語モデル(Vision-Language Model, VLM)を用いて原子力関連文書を解析する手法を開発した。提案手法は、複雑な表データや図表を高精度に認識し、LLM が扱いやすい構造化データへ変換する点に特徴がある。従来の OCR 技術より柔軟かつ高品質なデータ前処理が可能となり、今後の検索拡張生成(Retrieval-Augmented Generation、RAG)システムにおける情報取得精度向上に寄与する。