[1E4-GS-9-02]構文解析情報を用いたテキストからの数値情報の抽出
〇黒土 健三1、森本 康嗣1、佐藤 美沙1、柳井 孝介1(1. 日立製作所 研究開発グループ)
キーワード:
自然言語処理、データマイニング、固有表現抽出
ビジネス上の意思決定の支援をめざした情報抽出技術を検討した。本報告では技術動向に関する判断支援を行うシステムを目標とし,論文から物性値に関する数値情報の抽出に取り組む。物性値の抽出にあたっては数値と項目名を組みにして抽出した。数値については単位を伴わない数値の抽出を検討した。手法として,係り受け構造に基づくパターンマッチによる抽出を利用して項目名と数値の組みを抽出する方法を用いた。英語論文を対象とした評価を行い,本手法の有効性を確認した。
