講演情報
[1A-01]大規模言語モデルの層間注意スコア分散を用いた動的なトークン選択層決定手法
*谷口 令1、肖 川1,2、董 于洋3、小山田 昌史4、鬼塚 真1 (1. 大阪大学、2. 名古屋大学、3. SB Intuitions、4. NEC)
発表者区分:学生
種別:ロングペーパー
インタラクティブ発表:あり
種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
Transformer、Attention、高速化、Prefill
Transformer、Attention、高速化、Prefill