講演情報
[22a-52A-8]Starrydataにおける大規模論文データ収集の半自動化AIシステムの開発
〇間藤 智也1、熊谷 将也2,3、高田 悠1、桂 ゆかり1,2,4 (1.物材機構、2.理研、3.さくらインターネット(株)、4.筑波大学)
キーワード:
マテリアルズ・インフォマティクス,生成AI,GPT
Starrydataは論文のプロット画像からデータを収集し、現在までに12,400本の論文から74,000試料、180,000カーブのデータを集約しています。データの自動抽出とデータクレンジング効率を向上させるため、StarryDigitizerにスプライン補間機能を追加、ChatGPTをWebシステムに組み込み、Starrydata Visualizerとデータ解析基盤も構築しました。