講演情報
[4B-04]Q-Frame: A Plug-and-play Question-related Frame Extraction Approach for Long Video Question Answering
*Li Zhi1、Wan Yanan1、Niu Hao1、Vizcarra Julio1、多屋 優人1 (1. KDDI総合研究所)
発表者区分:一般
論文種別:ショートペーパー
インタラクティブ発表:あり
論文種別:ショートペーパー
インタラクティブ発表:あり
キーワード:
Multimodal Large Language Model、Long Video Question Answering、Memory Network