본문으로 건너뛰기

"Alphago" 태그로 연결된 1개 게시물개의 게시물이 있습니다.

알파고

모든 태그 보기

Mastering the game of Go with deep neural networks and tree search

· 약 6분
David Silver
Google DeepMind 연구원
Aja Huang
연구원
Chris J. Maddison
연구원
Arthur Guez
연구원
Laurent Sifre
연구원
George van den Driessche
연구원
Thore Graepel
연구원

논문 정보

  • 제목: Mastering the game of Go with deep neural networks and tree search
  • 저자: David Silver 외 (Google DeepMind)
  • 학회/저널: Nature
  • 발행일: 2016-01-28
  • DOI: 10.1038/nature16961
  • 주요 연구 내용: 바둑판의 국면을 평가하는 가치망(value network)과 다음 수를 선택하는 정책망(policy network)이라는 두 개의 심층 신경망을 몬테카를로 트리 탐색(MCTS)과 결합한 새로운 접근법을 제안함. 신경망은 인간 전문가의 기보를 이용한 지도 학습과 알파고 자체 대국을 통한 강화 학습의 조합으로 훈련됨.
  • 주요 결과 및 결론: 개발된 프로그램 알파고(AlphaGo)는 다른 주요 바둑 프로그램들을 상대로 99.8%의 압도적인 승률을 기록했으며, 당시 유럽 챔피언이었던 판후이 프로 2단을 5대 0으로 이김. 이는 컴퓨터 프로그램이 정식 크기의 바둑판에서 인간 프로 기사를 상대로 거둔 최초의 승리임.
  • 기여점: 인간 전문가의 기보를 활용한 지도 학습과 자체 대국 기반의 강화 학습을 결합한 혁신적인 신경망 훈련 파이프라인을 구축함. 심층 신경망을 통해 바둑의 복잡한 국면 평가와 수 선택 문제를 해결하고, 이를 효율적으로 몬테카를로 트리 탐색과 통합하여 인간 최고 수준의 기력을 달성함.