講演情報
[15p-S2_204-7]材料科学文献からの化合物合成方法抽出
〇中岡 宏徳1、乾 孝司2 (1.住友金属鉱山、2.筑波大学)
キーワード:
テキストマイニング、自然言語処理
材料研究分野において研究成果は論文や特許などのテキスト媒体として発表され、膨大な知識とデータが蓄積されているが、テキストは非構造化データであるため十分に活用されていないのが現状である。本研究では電池材料文献から合成方法を抽出し、テキストデータを構造化する手法について検討した。Bidirectional Encoder Representations from Transformers(BERT)とGenerative Pre-trained Transformer (GPT)をベースとした抽出モデルを訓練し、両モデルにより実用的な精度で合成方法を抽出した。
