알파고 능가하는 AI ‘알파 제로’ 나왔다

입력 : ㅣ 수정 : 2018-12-07 07:29

폰트 확대 폰트 축소 프린트하기
딥마인드, 연구 결과 ‘사이언스’ 발표
게임 법칙만 알려주면 스스로 능력 개발
‘범용 인공지능 연구’ 중요한 이정표 기대
구글 딥마인드 제공

▲ 구글 딥마인드 제공

인간 최고수들을 잇따라 격파한 바둑 인공지능(AI) ‘알파고’를 뛰어넘는 ‘알파 제로’가 공개됐다. 알파 제로는 교과서나 기보, 대국 상대 없이 게임 법칙을 아는 것만으로도 모든 보드게임을 익히고 기존 알파고 버전을 압도하는 능력을 갖추고 있다는 게 특징이다. 특히 바둑만을 대상으로 한 ‘알파고’ 시리즈들과 달리 하나의 알고리즘으로 체스, 쇼기(일본장기) 같은 다른 보드게임들에도 적용할 수 있는 ‘범용 AI 연구의 중요한 이정표’가 될 것으로 기대되고 있다.

구글 딥마인드 창업자이자 최고경영자(CEO)인 데미스 허사비스를 포함한 13명의 연구자는 ‘자가학습을 통해 체스, 쇼기, 바둑을 마스터할 수 있는 범용 강화학습 알고리즘’이라는 제목의 논문을 세계적인 과학저널 ‘사이언스’ 7일자에 발표했다.

알파 제로는 알파고 제로와 마찬가지로 빅데이터 학습이 필요 없을 뿐만 아니라 이전 딥마인드에서 개발한 AI들에 붙어 있던 ‘고’(Go, 바둑)라는 단어가 빠진 것에서 알 수 있듯이 여러 종류의 게임에서도 활용할 수 있는 AI의 가능성을 보여 주고 있다는 평가를 받고 있다.

알파 제로는 2016년에 체스 AI 챔피언 자리에 오른 ‘스톡피시’를 4시간 만에 꺾었고 쇼기에서는 2시간 만에 2017년 쇼기 AI 챔피언 ‘엘모’를 뛰어넘었다. 스톡피시와 엘모는 입력된 빅데이터를 바탕으로 최적의 수를 검색해 내는 방식이지만 알파 제로는 사람의 두뇌처럼 심층신경망 기술로 데이터를 스스로 쌓아 가면서 승률을 높이는 좋은 수가 어떤 것인지 빠르게 찾아내는 방식을 활용하고 있다.

바둑에서 알파 제로는 이세돌 9단에게 완승을 거둔 ‘알파고 리’를 30시간 만에 가볍게 이긴 것으로 알려졌다. 특히 알파 제로보다 앞선 버전으로 바둑 AI 중 최강이라는 알파고 제로와의 대국에서도 61%의 승률을 거뒀다고 연구진은 밝혔다.

데이빗 실버 딥마인드 연구원은 “최근 AI 기술의 발달로 체스나 장기, 바둑처럼 엄청나게 많은 경우의 수가 나올 수 있는 보드게임을 쉽게 정복할 수 있는 알고리즘이 나오게 된 것”이라며 “AI 개발의 다음 과제는 전략시뮬레이션 게임처럼 여러 사람이 동시에 참여하는 멀티플레이어 비디오게임을 정복하는 것”이라고 말했다.

한편 딥마인드는 지난 2일 멕시코 칸쿤에서 열린 단백질 구조예측 학술대회에 ‘알파 폴드’라는 AI를 이용해 생명의 기본 분자인 단백질의 3차원 형태를 예측하는 데 성공하기도 했다. 알파 폴드는 43개 단백질 중 25개의 구조를 정확히 예측해 98개 팀 중 1등을 차지했는데 2등 팀은 43개 중 3개의 구조밖에 예측하지 못한 것으로 알려졌다. 유용하 기자 edmondy@seoul.co.kr
2018-12-07 9면
페이스북 트위터 카카오스토리 밴드 블로그

/

서울Eye - 포토더보기