講演情報

[3GPM2-04]Transformers Learn Nonlinear Features In Context: Nonconvex Mean-field Dynamics on the Attention Landscape

〇キム ジュノ1,2、鈴木 大慈1,2 (1. 東京大学、2. 理化学研究所)

閲覧にはパスワードが必要です