講演情報
[8p-P11-11]LLMを使った材料開発(III):科学論文からの材料データ抽出
〇岡 博之1、石井 真史1 (1.NIMS)
キーワード:
大規模言語モデル、科学論文、材料データ抽出
大規模言語モデル(LLM)を用いて、科学論文からの材料データの自動抽出を検討した。LLMにはGoogleが開発したGemma 3を用いた。Gemma 3では画像も扱えるため、論文の本文と散布図からのデータ抽出を検討した。抽出は次の3ステップで検討した:①論文の本文からすべての試料名の抽出、②各試料の作成条件と物性値の抽出、③散布図からのデータ抽出。本発表ではこれらの詳細について報告する。