講演情報

[A1-01]大規模言語モデルの層間注意スコア分散を用いた動的なトークン選択層決定手法

*谷口 令1、肖 川1,2、董 于洋3、小山田 昌史4、鬼塚 真1 (1. 大阪大学、2. 名古屋大学、3. SB Intuitions、4. NEC)

キーワード:

Transformer、Attention、高速化、Prefill