[IT 신트렌드] 스타크래프트에 도전하는 AI/추형석 소프트웨어정책연구소 선임연구원

입력 : ㅣ 수정 : 2017-10-09 22:53

폰트 확대 폰트 축소 프린트하기
추형석 소프트웨어정책연구소 선임연구원

▲ 추형석 소프트웨어정책연구소 선임연구원

2016년 3월 이세돌 9단과의 대국으로 잘 알려진 인공지능(AI) ‘알파고’를 개발한 구글 딥마인드는 새로운 도전 과제로 스타크래프트 인공지능 개발을 언급했었다.

바둑과 스타크래프트의 가장 큰 차이점은 지능적 의사결정의 시점이다. 바둑은 일정 시간 안에 상대와 번갈아가며 돌을 놓는 방식으로 진행되는 반면 스타크래프트는 실시간으로 행동을 결정해야 한다. 또 바둑은 상대의 정보가 모두 공개되지만 스타크래프트는 전략의 노출 여부가 의사결정에 중요한 영향을 미친다.

따라서 성공적인 스타크래프트 인공지능 개발은 또 다른 관점에서의 혁신을 시사한다. 이에 딥마인드는 지난 8월 스타크래프트2 기반의 게임 인공지능 개발 환경 ‘SC2LE’(StarCraft Ⅱ Learning Environment)를 공개했다.

게임은 인공지능이 필수적인 분야이다. 게임 인공지능은 가상의 상대가 되어 사람과 대결한다는 점에서 방법론적인 측면에서도 게임 산업의 수요에 의해 발전됐다. 그동안 게임 인공지능 개발은 규칙에 의거한 기초적인 접근이 일반적이었다. 하드웨어 자원의 한계로 고성능 게임 인공지능을 구현한다는 것 역시 걸림돌로 작용했기 때문이다.

하지만 규칙 기반의 게임 인공지능은 사람에게 패턴이 노출될 경우 무용지물이 된다. 이를 극복하기 위한 방편으로 게임 인공지능이 정보를 습득하는 범위를 조정하는 전략이 있다. 예를 들면 1인칭 슈팅게임(FPS)에서 인공지능이 상대가 어디에 있는지의 정보를 인지한다면 난도가 급격히 올라간다. 그러나 이것은 사람과 유사하게 학습해 행동하는 인공지능이라고 볼 수 없다.

이번에 공개된 스타크래프트2 인공지능의 차별점은 기존의 규칙 기반의 접근이 아닌 학습 기반의 접근이다. SC2LE는 강화학습 기반의 인공지능 개발 환경이다. 강화학습은 알파고의 자체 대국에 활용된 기술로 전략에 따른 보상을 통해 학습하는 방법이다.

실제로 스타크래프트2 인공지능은 매우 복잡한 기능을 수행해야 한다. 게임 안에서 자원을 수집하고, 건물을 짓고, 전투유닛을 생산·제어하며, 상대방의 정보를 토대로 전략을 수정하는 등의 복잡한 사항들을 실시간으로 결정해야 한다. 이를 위해 SC2LE는 학습을 위한 6만 5000여개의 게임 리플레이 정보를 제공하고 향후 50만개까지 공개한다고 밝혔다.

또 스타크래프트2 제작사인 블리자드의 개발 도구를 연동하는 환경 ‘PySC’도 마련했다. SC2LE는 많은 연구자들이 자유롭게 참여할 수 있는 공개 환경을 제공함으로써 인공지능의 또 다른 진화를 알리는 출발점이 될 것이다.

스타크래프트 인공지능과 인간 챔피언의 대결이 기다려지는 것도 이 때문이다.
2017-10-10 25면
페이스북 트위터 카카오스토리 밴드 블로그

/

    건강나누리캠프

서울Eye - 포토더보기