WHAT DOES IT MEAN TO BE A TRANSFORMER? INSIGHTS FROM A THEORETICAL HESSIAN ANALYSIS
· 6 min read
논문 정보
- 제목 (Title): WHAT DOES IT MEAN TO BE A TRANSFORMER? INSIGHTS FROM A THEORETICAL HESSIAN ANALYSIS
- 저자 (Authors) 및 소속 (Affiliations):
- Weronika Ormaniec (ETH Zürich)
- Felix Dangel (Vector Institute)
- Sidak Pal Singh (ETH Zürich)
- 학회 또는 저널명 (Conference or Journal Name): International Conference on Learning Representations (ICLR) 2025
- 제출일 또는 발행일 (Submission or Publication Date): 2025년 3월 17일 (v2 기준)
- DOI (Digital Object Identifier): 제공되지 않음.
- 기타 식별 가능한 정보: - 연구 분야: 딥러닝 이론, 최적화 - arXiv ID: arXiv:2410.10986v2 [cs.LG]