Presentation Information

[3FAM-01]Infinite-Width Limit of a Single Attention Layer: Analysis via Tensor Programs

〇酒井 真菜1,2、唐木田 亮3、今泉 允聡1,2 (1. 東京大学、2. 理化学研究所、3. 産業技術総合研究所)