본문으로 건너뛰기

"Neural Networks" 태그로 연결된 1개 게시물개의 게시물이 있습니다.

모든 태그 보기

WHAT DOES IT MEAN TO BE A TRANSFORMER? INSIGHTS FROM A THEORETICAL HESSIAN ANALYSIS

· 약 6분
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 담당교수

논문 정보

  • 제목 (Title): WHAT DOES IT MEAN TO BE A TRANSFORMER? INSIGHTS FROM A THEORETICAL HESSIAN ANALYSIS
  • 저자 (Authors) 및 소속 (Affiliations):
    • Weronika Ormaniec (ETH Zürich)
    • Felix Dangel (Vector Institute)
    • Sidak Pal Singh (ETH Zürich)
  • 학회 또는 저널명 (Conference or Journal Name): International Conference on Learning Representations (ICLR) 2025
  • 제출일 또는 발행일 (Submission or Publication Date): 2025년 3월 17일 (v2 기준)
  • DOI (Digital Object Identifier): 제공되지 않음.
  • 기타 식별 가능한 정보: - 연구 분야: 딥러닝 이론, 최적화 - arXiv ID: arXiv:2410.10986v2 [cs.LG]