講演情報

[D-20-06]視覚言語モデルにおける埋め込みの整列を強化する事前学習の検討

○川村 聡志1、山本 康平1、泊口 万里子1、玉井 秀明1 (1. 沖電気工業)
PDFダウンロードPDFダウンロード

キーワード:

視覚言語モデル、マルチモーダル、アラインメント