講演情報
[5Yin-A-27]クラスタリングとLLM定量評価による有価証券報告書からの企業特徴情報の抽出
〇奥川 雄一郎1、田中 憲光1、長尾 友美1、勝野 晃弘1、河田 博昭1 (1. NTT株式会社)
キーワード:
企業特徴情報抽出、有価証券報告書、クラスタリング
本研究では,有価証券報告書「事業の状況」を対象に,企業にとって「固有」かつ「重要」な文を抽出する枠組みを提案する.kNN距離に基づく固有度と,LLMによる重要度を独立に定量化し,積モデルにより統合した.人手評価との比較の結果,重要度は有意な正の相関を示した一方,固有度は負の相関を示し,単純な積による統合は整合しなかった.固有性と重要性は異なる構造を持つことが示された.
