講演情報
[16p-K505-11]大規模言語モデルによる論文からの試料情報データ自動提案技術の開発
〇間藤 智也1、髙田 悠1、熊谷 将也3,4、桂 ゆかり1,2,3 (1.物材機構、2.筑波大、3.理研、4.さくらインターネット)
キーワード:
マテリアルズ・インフォマティクス、大規模言語モデル、データベース
Materials Informatics (MI)の発展には、現場の材料研究を反映した大規模データセットが不可欠である。特に、高性能材料の製法や特性を含む複雑な実験データを効率的に収集するため、我々はStarrydata2というシステムを開発し、約1万論文・8万試料分の収集に成功。さらに、外部の大規模言語モデルを活用し試料情報の抽出を効率化。講演では開発成果と今後の展望を紹介する。