講演情報
[9B-01]Attentionスコアの分布類似性を用いた大規模言語モデルの動作異効率化および省メモリ化
*谷口 令1、肖 川1,3、小山田 昌史2、董 于洋2、鬼塚 真1 (1. 大阪大学大学院情報科学研究科、2. 日本電気、3. 名古屋大学)
発表者区分:学生
論文種別:ロングペーパー
インタラクティブ発表:あり
論文種別:ロングペーパー
インタラクティブ発表:あり
キーワード:
LLM、効率化、Transformer、Attention、省メモリ
LLM、効率化、Transformer、Attention、省メモリ