게임의 제왕 알파제로의 등장

사이언스 제공

국제학술지 ‘사이언스’는 7일 정육면체 위 3개 면에 바둑과 체스, 한국의 장기와 닮은 일본의 쇼기 게임이 동시에 진행 중인 모습을 표지에 실었다. 독학으로 이 세 가지 게임을 섭렵해 최강의 자리에 오른 구글의 새 인공지능(AI) 알파제로의 등장을 알린 것이다.

구글의 딥마인드 연구진이 새로 내놓은 알파제로는 2016년 등장해 이세돌 9단을 이기며 최강의 바둑 AI로 등극한 ‘알파고’는 물론 알파고를 제압한 2017년형 AI인 알파고제로를 제압했다. 특히 이번 알파제로는 범용이라는 수식어가 붙었다. 바둑을 넘어 다른 종류의 게임도 스스로 통달할 수 있다. 때문에 바둑을 뜻하는 ‘고’가 이름에서 빠졌다.

알파제로는 여러 게임의 규칙을 스스로 파악한다. 사전에 입력한 기보를 통해 학습하는 기존 AI와 달리 특정 게임에 대한 지침이나 사전 정보 없이 학습을 진행한다. 연구진은 논문에서 알파 제로는 인간 지식 도움 없이 게임 룰만 입력하면 스스로 성장하는 AI“라며 “하나의 알고리즘으로 바둑, 체스, 쇼기 등을 모두 독파했다”고 설명했다. 가상의 상대와 게임을 반복해 스스로 빅데이터를 구축하며, 이를 통해 끊임 없이 성장한다.

알파제로는 각 종목에서 기존의 AI를 격파하는 데는 많은 시간이 필요하지 않았다. 2016년 쇼기 대회에서 우승한 AI ‘엘모(Elmo)’는 2시간, 2017년 체스 챔피언을 차지한 AI ‘스톡피시(Stockfish)‘는 4시간만에 따라잡았다. 가장 애를 먹은 알파고 제로를 이기기 까지는 30시간이 걸렸다.

알파고제로과 알파제로에 차이에 대해 연구진은 “알파고 제로는 지금까지 해왔던 게임에서 가장 승률이 높았던 가상의 선수를 상대로 훈련한다”며 “하지만 단 하나의 신경망인 알파제로는 점점 강해지는 자신을 상대로 게임을 한다”고 설명했다. 알파제로가 알파고 제로보다 더 빠르게 최강의 적과 반복적으로 마주하며, 실력을 높일 수 있다는 것이다.

딥마인드의 다음 목표는 모든 보드게임은 물론 현실의 다양한 문제에 적용하는 것이다. 데이비드 실버 딥바인드 연구원은 “같은 시스템을 보드게임 뿐아니라 신약 개발이나 설계 작업 에 적용할 수 있는지 알아볼 계획”이라고 말했다.

(원문: 여기를 클릭하세요~)

Related

Leave a Reply Cancel reply