講演情報

[D-12A-09]大規模言語モデルを用いたマルチモーダルなモデルの人の動作に関する画像キャプション生成の評価

○福永 一生1、Maulana Muhammad Farhan1、緒方 公一2 (1. 熊本大学大学院自然科学教育部、2. 熊本大学大学院先端科学研究部)
PDFダウンロードPDFダウンロード

キーワード:

画像キャプション生成、大規模言語モデル、マルチモーダルAI