講演情報
[18a-PA1-7]材料論文における数式・記述子の自動抽出および構造化
末松 知恵1、〇穴澤 俊久1、門平 卓也1、源 聡1 (1.物質・材料研究機構)
キーワード:
数式抽出、材料論文、グラフデータベース
材料科学分野の技術文書には多くの数式が含まれるが,変数の意味や単位といった情報が非構造的に記載されているため,文献横断的な活用は容易ではない。本研究では,大規模言語モデルを用いて吸着材料論文から数式と記述子を自動抽出・構造化し,数式を数値計算可能な SymPy 形式で表現するとともにグラフデータベース化することで,数式に基づく知見の参照・再利用に向けた基盤を構築した。
