講演情報

10:30 〜 10:45注目講演

[22a-52A-5]大規模言語モデル用材料分野ベンチマーク作成とそれによるChatGPT・Bardの評価

〇吉武道子¹、鈴木雄太²、五十嵐亮¹、牛久祥孝¹、長藤圭介³ (1.オムロンサイニエックス、2.大阪大学、3.東京大学)

自然言語処理,材料科学,モデル評価

材料科学の大学教科書の問題をベースに材料科学分野に特化したベンチマークの作成を行い、ChatGPT3.5、ChatGPT4、Bard（試用版）の評価を行った。