Presentation Information

[2H5-OS-2b-04]Construction of Text Embeddings for Flexible Cross-Document Correspondence Extraction in Financial Documents

〇Kenji Hiramatsu1, Tomoki Ito2 (1. IFIS JAPAN LTD., 2. National Institute of Information and Communications Technology)

Keywords:

Natural Language Processing,Financial Documents,Embedding

金融実務家や事業会社のIR担当者にとって、決算短信などのIR資料やアナリストレポート等を用いた時系列比較や他社比較といった「複数の金融文書間における比較分析」は極めて重要な業務である。
この比較分析には売上高や利益の変動といった浅いレイヤーにおける定量的な情報の比較だけでなく、M&Aにおける買収戦略の違いや技術開発における注力領域の差異といったやや深いレイヤーに表れる本質的な比較も含まれる。
このような背景のもと本研究では複数の金融文書から対応する文やパラグラフの柔軟な抽出・対応付けを可能にする埋め込み表現の構築手法を提案する。
本手法によりLLMを利用する手法と比較して、低い計算コストで類似・対応事例の抽出が可能となる。
さらに本研究の応用として、抽出された情報を利用者が直感的に把握できる文書間比較可視化システムを構築し、その有効性を検証する。