講演情報

[4B-04]Q-Frame: A Plug-and-play Question-related Frame Extraction Approach for Long Video Question Answering

*Li Zhi1、Wan Yanan1、Niu Hao1、Vizcarra Julio1、多屋 優人1 (1. KDDI総合研究所)
発表者区分:一般
論文種別:ショートペーパー
インタラクティブ発表:あり

キーワード:

Multimodal Large Language Model、Long Video Question Answering、Memory Network

閲覧にはパスワードが必要です