講演情報

[22a-52A-5]大規模言語モデル用材料分野ベンチマーク作成とそれによるChatGPT・Bardの評価

〇吉武 道子1、鈴木 雄太2、五十嵐 亮1、牛久 祥孝1、長藤 圭介3 (1.オムロンサイニエックス、2.大阪大学、3.東京大学)

キーワード:

自然言語処理,材料科学,モデル評価

材料科学の大学教科書の問題をベースに材料科学分野に特化したベンチマークの作成を行い、ChatGPT3.5、ChatGPT4、Bard(試用版)の評価を行った。