"Neural Networks" 태그로 연결된 1개 게시물개의 게시물이 있습니다.

WHAT DOES IT MEAN TO BE A TRANSFORMER? INSIGHTS FROM A THEORETICAL HESSIAN ANALYSIS

2024년 1월 1일 · 약 6분

경북대학교 컴퓨터학부 소프트웨어테스팅연구실 담당교수

제목 (Title): WHAT DOES IT MEAN TO BE A TRANSFORMER? INSIGHTS FROM A THEORETICAL HESSIAN ANALYSIS
저자 (Authors) 및 소속 (Affiliations):
- Weronika Ormaniec (ETH Zürich)
- Felix Dangel (Vector Institute)
- Sidak Pal Singh (ETH Zürich)
학회 또는 저널명 (Conference or Journal Name): International Conference on Learning Representations (ICLR) 2025
제출일 또는 발행일 (Submission or Publication Date): 2025년 3월 17일 (v2 기준)
DOI (Digital Object Identifier): 제공되지 않음.
기타 식별 가능한 정보: - 연구 분야: 딥러닝 이론, 최적화 - arXiv ID: arXiv:2410.10986v2 [cs.LG]