'인간' 이세돌과 'AI' 알파고, 오는 3월 세기의 바둑 대결

2016. 1. 28. 09:39
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[OSEN=강필주 기자] 오는 3월 인간과 컴퓨터 인공지능(AI)이 벌이는 '세기의 대결'이 펼쳐진다. 

구글의 '딥마인드(DeepMind)'는 27일(현지시간) 구글의 인공지능 프로그램 알파고(AlphaGo)가 유럽 바둑 챔피언 중국계 프로기사 판 후이 2단을 지난 10월 영국 런던으로 초청, 대국을 벌인 결과 5승무패의 성적으로 승리를 거뒀다고 밝혔다. 판 후이는 12세에 바둑에 입문, 유럽 바둑대회에서 3회 우승한 천재 바둑 기사로 알려져 있다.

이에 딥마인드는 "컴퓨터 프로그램이 프로 바둑기사를 최초로 이긴 순간이었다. 경기에 대한 상세한 내용은 과학잡지 '네이처'에 게재된 논문에서 찾아볼 수 있다"면서 "오는 3월 알파고는 궁극적인 도전을 맞이하게 된다. 바로 전설적인 바둑 기사 이세돌 9단과의 대국이다. 이세돌 9단은 지난 10년 동안 세계 최고의 바둑 기사로 인정 받아 왔다"고 덧붙였다. 

이에 이세돌 9단은 "구글 딥마인드의 인공지능이 아주 강하고 더 강해졌다는 이야기를 들었다"면서 "그렇지만 이번에는 결국 내가 이길 것으로 확신한다"고 말했다.

'인간' 이세돌과 '인공지능' 알파고의 대국은 3월 8일부터 15일까지 5판 3선승제로 펼쳐진다. 

딥마인드는 지난 2014년 1월 구글이 인수한 인공지능(AI, Artificial Intelligence) 분야 기업이다. 영국 런던에 본사를 둔 딥마인드는 업계 최고의 엔지니어, 과학자, 연구원들을 보유하고 있으며, 이들은 머신러닝과 시스템 신경과학(systems neuroscience) 분야의 기술을 활용해 강력한 범용 학습 알고리즘을 구축하고 있다.

그 동안 바둑은 인공지능이 넘지 못할 산이었다. 전 세계 4000만 명 이상이 즐기고 있는 바둑의 경기 규칙은 간단하다. 바둑판 위 흰돌, 혹은 검은돌을 번갈아 놓으며 상대편의 돌을 들어내거나 빈 공간을 둘러싸서 ‘집’을 만들면 된다. 

하지만 사실 바둑은 굉장히 복잡한 게임다. 돌을 놓는 위치에 있어 엄청난 경우의 수가 존재하기 때문이다. 이는 우주에 있는 원자의 수보다 많으며, 체스와 비교할 때 경우의 수가 10의 100제곱 이상 많은 것으로 알려졌다. 때문에 이런 복잡성은 컴퓨터가 바둑을 두는 것을 아주 어렵게 만들었다. 인공지능 연구자에게는 매력적인 도전이기도 했다. 

컴퓨터가 마스터한 최초의 게임은 1952년의 ‘삼목놓기’(‘틱택토’라고도 불림)였다. 그 후 1994년에는 체커를 마스터했고, 1997년에는 딥 블루 컴퓨터가 체스에서 승리를 거뒀다. 컴퓨터의 활약은 보드게임에서 그치지 않았다. IBM의 왓슨(Watson) 컴퓨터는 2011년 ‘제퍼디(Jeopardy)’에서 우승했고, 2014년에는 딥마인드가 자체 개발한 알고리즘이 픽셀 입력값만으로 아타리(Atari) 사의 여러 게임을 플레이하는 방법을 학습했다. 하지만 바둑은 지금까지 인공지능 연구자들을 계속 좌절시켰다. 컴퓨터의 바둑 실력은 아마추어 기사 수준에 불과했다.

모든 가능한 위치에 탐색 트리(search tree)를 구성하는 전통적 방식의 인공지능은 바둑에서만큼은 빛을 발하지 못했다. 그래서 딥마인드는 다른 접근방식을 취했다. ‘알파고’라는 시스템을 구축했다. 이는 고급 트리 탐색과 심층 신경망(deep neural network)을 결합한 것이다. 이 신경망은 수백만 개의 신경세포와 같은 연결고리를 포함하는 12개의 프로세스 레이어를 통해 바둑판을 분석한다. ‘정책망(policy network)'이라고 부르는 하나의 신경망이 다음 번 돌을 놓을 위치를 선택한다. ‘가치망’(value network)이라고 부르는 또 다른 신경망은 승자를 예측한다.

딥마인드에서는 전문가가 플레이하는 게임으로부터 3000만 개의 움직임에 대해 신경망을 훈련시켰다. 이로써 57%의 확률(과거 기록은 44%입니다)로 사람의 움직임을 예측할 수 있게 되었다. 알파고는 실제 대국에서 사람을 이기기 위해 자체 신경망 간에 수천만 회의 바둑을 두고, 강화 학습이라는 시행착오 프로세스를 사용해 연결고리를 조정함으로써 스스로 새로운 전략을 발견하는 법을 학습했다. 이를 위해서는 강력한 컴퓨팅 능력이 필요했기 때문에 구글 클라우드 플랫폼을 폭넓게 활용했다.

그 후 알파고는 실제 대국에 투입돼 테스트에 나섰다. 먼저 인공지능 연구의 선봉에 있는 최고의 바둑 프로그램들과 알파고 사이의 토너먼트를 진행했다. 결과는 알파고가 총 500회 대국 중 단 한 번을 제외하고 모두승리했다. 그 다음이 바로 판 후이였다. 

딥마인드는 블로그를 통해 "바둑을 마스터함으로써 인공지능의 큰 도전 과제 중 하나를 해결하게 되어 매우 감격스럽다. 하지만 이 성과가 큰 의미를 가지는 이유는 알파고가 바둑의 규칙을 하나하나 직접 입력하여 개발된 전문가 시스템(expert system)이 아니라 일반적인 머신러닝 기술을 사용하여 스스로 바둑에서 이기는 법을 파악했다는 것"이라고 설명했다. 

이어 딥마인드는 "게임은 인공지능 알고리즘을 빠르고 효율적으로 개발하고 시험해볼 수 있는 좋은 플랫폼이지만 우리는 궁극적으로 이 기술들을 중요한 현실 세계의 문제에 적용하기를 원한다"면서 "알파고에 사용된 방법들은 모두 범용성을 갖고 있기 때문에 언젠가 기후 모델링, 복합성 질환 분석 등 오늘날 사회의 어렵고 골치 아픈 난제들을 해결하는 데 쓰이기를 기대해 본다. 앞으로 인공지능 기술을 활용해 어떤 문제들을 해결할 수 있을지 정말 기대가 된다"고 의미를 부여했다. /letmeout@osen.co.kr

[사진] 이세돌. /한국기원 제공

[2015 프로야구 스카우팅리포트][요지경세상 펀&펀][Copyright © OSEN 무단전재 및 재배포 금지]

Copyright © OSEN. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?