講演情報

[B-7-33]VLMにおける分割KVキャッシュ制御方式

◎和田 健史郎1、奥田 兼三1、馬場 宏基1、君島 直樹1、林 健太朗1、武田 知典1 (1. NTT)

キーワード:

大規模言語モデル、画像言語モデル、トランスフォーマー、KVキャッシュ、プレフィル、ネットワーク内計算