講演情報

[D-12-30]視覚言語モデルを活用した画像キャプション生成の整合性向上

◎貝津 俊一1、中村 和晃1 (1. 東京理科大)

キーワード:

画像キャプション生成、Dense Captioning、視覚言語Groundingモデル