講演情報

[A2-01]視覚言語モデルはどこまで経路を辿れるか?-経路の逐次的追跡能力を探る

*戸崎 友輔1、宮森 恒1 (1. 京都産業大学)

キーワード:

視覚的経路追跡、多段階視覚推論、途中推論過程、視覚言語モデル、ベンチマークデータセット