알파고

From The Hidden Wiki
Jump to navigationJump to search

[include(틀:넘겨주기1, n1=AlphaGo)] [include(틀:현재진행중)]

* 관련 문서: 기계학습, 인공지능

width=300px


||<tablewidth=664px>||<:> [youtube(SUbqykXVx0A, width=640px)] || ||||<bgcolor=#DCDCDC><:> 딥마인드 공식 유튜브 채널에 올라온 소개영상(판 후이와의 대결 포함)[* 공식 유튜브 캡션 한국어 자막을 지원하므로, 자막이 안 보인다면 유튜브 플레이어 하단에 자막 버튼을 클릭] ||


||<tablewidth=664px>||<:> [youtube(bS60zOcaDek, width=640px)] || ||||<bgcolor=#DCDCDC><:> 네이쳐지에서 제작한 알파고에 대한 동영상. ||

[홈페이지] [랭킹 페이지]

[목차]

개요

>알파고에 가장 근접한 프로 기사는 전성기 시절의 이창호 九단[* 실제로 알파고의 기풍은 전성기 당시의 이창호 九단과 상당히 비슷하다. 대승의 여부를 따지지 않고 철저하게 승리 그 자체만을 취하는, 상대로 하여금 이기고 있는 듯 싶다가도 정신차리고 보면 이미 지고 있는 상태로 만들어 버리는 그런 바둑을 두고 있는 상황이다.] >ㅡ 김성룡 九단, 구글 딥마인드 챌린지 매치 제2대국후 인터뷰에서[[1]]

>이제 바둑계에 알파고류(流)가 생기지 않을까 싶습니다 >ㅡ 김동민 YTN 스포츠부장(아마 6단), 구글 딥마인드 챌린지 매치 제2대국 후 YTN뉴스에서

{{{+2 AlphaGo 九단}}} ~~斡破高가 아니다~~ ~~성은 알, 이름은 파고다 카더라~~ ~~이세돌이 다니는 고등학교는? 알파고~~

단 1년 만에 유럽 바둑 챔피언과 세계 최고 수준의 바둑 기사를 꺾은 인공지능

알파벳구글 딥마인드에서 개발한 컴퓨터 바둑 인공지능 프로그램. 프로기사를 맞바둑으로 최초로 이긴 바둑 프로그램이기도 하다. 이름에서 "Go"란 일본어로 바둑을 뜻하는 碁(바둑 기. 일본어 음독은 "고")[* 碁, 棋, 棊 세 글자 모두 '바둑 기'로 똑같은 뜻의 한자지만 일본에선 碁를, 한국과 중국에선 棋를 주로 사용한다. 其(소리) + 石ㆍ木(뜻)으로 이루어진 형성자인데, 나무로된 바둑판 위에 바둑돌을 두는 것에서 뜻을 취했다.][* 이러한 이유로 일본 언론 등에서는 알파고를 アルファ碁라고 표기한다.]를 의미한다. 이는 일반적으로 서구 언론에서 바둑을 의미할 때 "고"란 말을 쓰기 때문이다.

2016년 3월 15일 한국기원에서 객원기사 자격으로 프로 九단 단증을 수여하게 되어 정식으로 알파고 九(9)단이 되었다.

심지어 정식 세계 바둑 ELO 레이팅 점수 랭킹에도 등재되었다. 3586점으로 현재 2위. [[2]][[3]]

정보

하드웨어로는 *****UNVIDIA GPU를 이용한 병렬 계산을 사용한다. 물론 가장 중요한 것은 하드웨어보다 소프트웨어쪽으로. 이렇게 병렬연결 된 상태의 알파고vs싱글 알파고 간의 바둑에선 77% vs. 23%의 승률이 나왔다고 한다. 개별 컴퓨터가 20% 이상의 승률을 보여줬다는 것 만으로도 얼마나 학습이 잘 되어 있는지를 알려주는 대목.

운영 체제리눅스 배포판의 하나인 우분투이다.


초기의 [[4]]에 따르면 1202개의 *****U와 176개의 GPU를 사용한다고 알려져 있는데, 이는 잘못된 기사이다. 기사에서 *****U 1202 / GPU 176개를 사용한 버전이 세계 500대 슈퍼컴퓨터 순위의 하위권 수준이라는 내용도 오류이다. 2015년 11월 기준 세계 494위인 TU Dresden의 Taurus GPUs가 이미 GPU 256개를 사용한다. 당연히 500위 내에도 명함을 내밀 수준이 못된다. 또한 저정도 수준의 슈퍼컴퓨터는 구입하는데 100억도 들지 않는다. 물론 유지비는 따로 고려해야겠지만. 저 숫자는 2015년 10월에 유럽챔피언 판후이 2단과 대결할때 사용한 숫자로, 2016년 3월의 이세돌 九단과의 대결에서는 더 업그레이드 되어 1920개의 *****U와 280개의 GPU를 사용하는 버젼이 이용되었다. --이제 곧 뇌가 1920개 or 1920명의 바둑기사와 싸웠다는 기사가 나올 것이다-- [[5]]

알파고가 항복하면서 띄운 팝업창의 모습을 보면 최소한 모니터가 설치된, 클라이언트에 해당하는 컴퓨터에서는 우분투가 사용되는 듯 하다. [[6]] [* UI만 비슷할 수 있는 것 아니냐 할 수 있지만 해당 배색 및 창 모양은 이미 우분투만의 아이덴티티인지라 다른 OS에서 해당 UI를 사용할 일은 (우분투에서 약간만 손본 배포판을 제외한다면) 없다고 볼 수 있다. 커스터마이징해서 해당 모양을 만들어 낼 수 있다고 한들 설사 알파고 개발자들이 특이한 취향을 가졌다고 해도 학문적인 의미가 깊은 알파고에서 굳이 시간을 들여 가며 개인 취향을 어필하고자 하지는 않을 듯.] 다만 분산컴퓨팅을 하는 알파고의 특성상 여러 개의 컴퓨터와 연동되어 작동하게 되어 있는데, 나머지 시스템의 OS도 우분투라고 확신할 수는 없다. 다만 구글 내부에서 데스크탑 OS로도 우분투를 쓰는건 [유명하니] 딥마인드에서도 해당 OS를 쓰는것이 개연성이 없지는 않다.

상세

구글에 인수된 딥마인드에서 개발한 머신러닝 기반 바둑 프로그램으로, 자기 자신과의 자가대국을 통한 학습이 가능하다고 한다. 사내 테스트 결과 다른 바둑 인공지능 프로그램들을 상대로 495전 494승 1패 기록했다. (참고로 이 승률은 1개의 컴퓨터를 사용하는 싱글 알파고가 따낸 승률이다) 이 중 한판은 알파고의 '실수'로 졌다고 하며 그 약점은 이미 보완이 끝났기 때문에 명실공히 현 최강의 인공지능 프로그램으로 군림하고 있다. 현재까지 나온 모든 바둑 인공지능을 성능으로 압도하는 모습에 일부 개발자들 사이에선 젠(Zen)이나 크레이지스톤(Crazystone) 등의 프로그램들이 더이상 존재 의미가 있는가, 바둑 인공지능 대회인 UEC를 계속 지속해야 하는가 등을 투표하는 등 굉장한 충격을 받고 있다. [[7]]

본래 체스라면 과거 IBM의 딥 블루가 가리 카스파로프를 상대로 대결해 이긴 바가 있지만, 바둑은 체스에 비해 경우의 수가 너무 많아서[* 체스가 바둑에 비해 쉽고 단순하다기 보다는 체스는 주어진 기물을 이동하는데 그치지만 바둑은 매 턴마다 새 기물을 추가하는 게임이기 때문에 알고리즘을 짜는 것이 매우 어렵기 때문이다.] 지금까지는 인공지능이 프로 바둑 기사를 이기지 못하였는데, 알파고가 프로바둑기사를 이긴 최초의 바둑 인공지능인 것 이다.

덤으로 서로 바둑 최강국임을 자부하며 10년 넘게 바둑 인공지능을 개발해오던 한국, 중국, 일본의 개발자들은 그 모든 기술과 노하우들이 고작 개발이 1년 좀 넘은 정도인 알파고가 발표됨과 동시에 전부 따라잡히며 성능으로도 처참하게 발려버리는 엄청난 격차가 생겨 순식간에 모든 프로그램을 한물 간 프로그램으로 만들어버리는 데꿀멍, 안습한 상황이 벌어졌다... 세계자본이 바둑에 관심을 보이면 어떤 일이 일어나는지 잘 보여주는 장면.

흔히 알파고의 강점이 엄청난 하드웨어를 바탕으로 한 계산량이라고 생각하는 경우가 많다. 그러나 알파고가 기존 바둑 프로그램과의 가장 큰 차이를 보이는 부분은 하드웨어가 아니라 소프트웨어의 알고리즘이다. 알파고는 일반 컴퓨터에서도 돌릴 수 있다. 다만 지금보다 기력이 떨어질 뿐(...) 컴퓨터 1대[* 물론 이것도 멀티*****U 시스템이긴 하다. 48코어.]에서 돌아가는 알파고를 *****U 1000개가 넘어가는 알파고가 이길 확률이 고작 77%였다. [[8]] 알파고가 기반하고 있는 딥러닝은 학습 과정이 학습한 걸 써먹는 과정보다 훨씬 길기 때문에, 일단 학습이 된 이후로는 그걸 써 먹는 과정은 정말 별 것 아닌 것이다. 알파고가 대국 중에 하드웨어를 많이 쓰는 이유는 추가 탐색으로 얻는 저 23%의 차이도 실제 대국에서는 중요하기 때문이다.

컴퓨터 비전이나 음성 인식 등 패턴 인식류 AI 쪽에서 딥러닝이 나오면서 최근 2년 동안의 결과가 지난 30~40년간의 결과를 다 발라버리는 사례는 비단 바둑 뿐만은 아니다. 그러나 딥러닝은 나름대로의 최신 트렌드인데다 이미지, 음성, 자연어 처리 같이 해야 할 일이 산더미 같은 상황에 바둑에 연구진을 투입할 수 있는 여유를 가진 곳은 드물다. AI와 하드웨어, 분산 처리 모두에 풍부한 박사급 인력을 가진 미국, 거기에서도 구글에서나 해볼만한 일이며, 현 시점 한중일에서는 비슷한 것을 시도해 볼 수 있는 회사는 없다고 보면 된다. --쉽게 말해 돈 안되는 사업에 최고급 인력과 자본, 시간을 양동이채로 퍼붓는 돈X랄[* 다만, 구글이 이걸 개발하는 이유는 궁극적으로 범용인공지능을 개발하기 위한 하나의 도전과제이기 때문이다. 다시 말하자면, 범용인공지능을 개발하면 벌 수 있는 막대한 돈을 생각한 장기적 관점의 투자인 것이다.]이 가능한 회사만이 할 수 있는 일이다.-- 다만 앤드루 응 교수를 데려간 바이두에서 몇 년 뒤 비슷한 것을 시도해 볼 수 있을 것이다.

github에 알파고의 논문을 토대로 알파고를 구현하는 프로젝트가 [[9]]되어 있다. 완전한 구현은 아니며, 아직 초기 단계라고 한다.

대국 내역

2016년 3월 15일 기준. 프로 바둑 기사와의 공식 전적은 총 10전 9승 1패이다.

* vs 판 후이 : 5전 5승 0패
* vs 이세돌 : 5전 4승 1패

vs. 판 후이 二단

2013-2015년 중국 프로 기사이자 유럽 바둑 챔피언인 판 후이(二단)[* 입단 후 유럽으로 건너가 바둑 보급에 힘쓰고 있다.]와 대국하여 5전 전승을 거두었다. 토너먼트 경기(Tournament games)라는 표현으로 보아 19 x 19에서 호선, 덤 7집 반을 적용한 대국이었다. 유럽에서 활동한다고 해도 프로기사가 인공지능에게 호선으로 패배한 것은 바둑 인공지능 역사상 처음 있는 일이다. 그것도 5판이나 연속으로!! 작년 10월 기준으로 프로 2단의 기력이라고 하며 분산 컴퓨팅 적용시 4-5단까지 상승한다고. 이 때문인지 네이처 소식란에 [했다.] ([Game Format)형식으로 기록된 기보])

https://i.cbc.ca/1.3422459.1453922806!/fileImage/httpImage/image.jpg_gen/derivatives/16x9_780/alphago.jpg 대국 장면을 찍은 모습이다.

https://img2.donews.com/2016/0128/18385164.jpg.450.jpg 최종 결과

김명완은 판후이와 알파고의 대국 기보를 분석하면서 알파고가 아주 침착하고 모양좋은 일본식 스타일의 바둑을 둔다고 리뷰했다. ~~판후이는 하필 알파고하고 둬가지고 게다가 5번 다 깨져서 거의 세상의 모든 기사들한테 약하다고 디스당한 건 덤~~ --그러나 알파고가 이세돌마저 꺾으면서 재평가받고 있다--

참고로 판 후이와는 비공식 대국으로 속기전 형태로 5판을 두기도 하였는데, 여기에서는 판 후이가 그래도 2승을 따내었다. 즉, 알파고가 3승 2패를 한 것. 이는 비공식 대국이기에, 공식적인 승패 기록은 알파고의 5전 5승 무패이다.

재밌는것은 판 후이가 알파고와 이세돌과의 대국 이전까지만 하더라도 인공지능에게 패배한 프로기사, 아마 최강자급 실력, 약한 기사등으로 온갖 굴욕을 걲었지만 구글 딥마인드 챌린지 매치 시점으론 처음엔 바둑인들 조차 판 후이가 누구인지 아는 사람이 적었지만 지금은 바둑인들은 물론이고 전세계적으로도 이름을 알려서 인터뷰도 자주 하고 방송도 나가고 나름 인기 스타..가 됐다. 인생 참 알다가도 모를 일.

vs. 이세돌 九단

5경기 중 4대국을 모두 모두 불계승을 거두면서 매치 승리, 4국에서는 알파고(그리고 인공지능) 또한 실수를 할 수 있음을 보여주었다.

알파고는 판 후이를 꺾은 것에 힘입어 2016년 3월 9일과 10일에 한국의 프로 기사인 이세돌 九단과 대국하였다. 매치는 당시 한국에서 유례 없는 관심을 보였으며 3번의 대국 모두 알파고가 불계승을 거뒀으나 4국에서 이세돌 9단에게 불계패했다. 5국에서는 접전끝에 알파고가 불계승을 거둔다.

구글 딥마인드 대표 데미스 하사비스는 4국 도중 자신의 SNS에 “알파고가 79수에 실수 했지만 87수에서야 깨달았다”며 “알파고 자체 승률 계산이 처음으로 50%대 밑으로 떨어졌다”는 내용의 글을 올렸다.

이번 대국의 진정한 목적은 승패를 가르기 보다는 알파고의 약점을 찾아내고 인공지능을 더욱 발전시키는 데 있기 때문에 일반적인 프로바둑과 달리 5국 3선승제가 아닌 승부와 상관 없이 5국을 모두 두었다. 자세한 내용은 구글 딥마인드 챌린지 매치 참고.

이후 다른 프로기사들과 대국?

이세돌 九단과의 매치가 화제가 되면서 많은 프로기사들이 알파고와의 대국에 관심을 두고 있다.

당장 2016년 현재 세계 최강 커제 九단이 이세돌 - 알파고 대결을 보고 "왜 나(커제)는 빼고 하냐"라고 하면서 불평이 많았다는 후문[* 김성룡 九단 - 농심신라면배 최종국 이세돌 vs 커제 해설 중.] 이 발언 때문인지(?) [바둑 인공지능인 NOVUMind]와의 대국을 제의받았으나, 커제 九단은 컴퓨터와의 대국 계획은 없다며 부인했다. [[10]][* 커제 9단은 대회 참가할 때 돈(우승상금)을 무지막지하게 밝힌다. 국내대회는 물론이고 세계대회 중에서도 진짜 상금이 큰 대회만 골라서 출전하는 걸로 중국 바둑계에서도 심심찮게 까이는 중. --물론 이세돌 9단도 상금 큰 대회 좋아하기로는 둘째가라면 서러워할 기사이긴 하다-- 상금 큰 대회를 별로 좋아하지 않는 기사로는 중국콩라인 스웨 9단이 있다. 스웨 9단은 결승전 부담감이 너무 커서 막판에 멘탈이 흔들린다고.] 그보다는 NOVUMind 가 알파고보다 성능이 낮기에 너무 쉬울 것 같아서 제안을 거절한 것일 수도 있다. 구글이 이세돌 9단과의 대국을 발표할 때 말로는 추후에 커제 - 알파고 대국도 추진할 예정인데 정확한 일정은 불명이라고.

이외에도 일본 최강자 이야마 유타 9단, 여류바둑계 한국 주장인 최정 六단과 기타 많은 바둑기사들이 알파고와 대국을 하고 싶다고 한다.(by 문도원 3단 in 바둑 비타민) --문도원 3단은 "알파고 저도 쉽게 이길 수 있습니다"라며 선전포고성 발언을 했다-- --바둑계의 코너 맥그리거--

동작 방식

알파고는 다음 세 가지 다른 인공지능 구조--MAGI--를 혼합하여 동작하도록 되어 있다. [알파고의 대국 메커니즘]도 참고.

* 가치망 (Value Network) : 현재 국면에서 이길 확률이 얼마인지를 점수로 뽑아낸다. 일반적인 강화 학습에서 보는 가치 함수 역할. 심층 컨볼루션 신경망(Deep Convolutional Neural Network)이다. 탐색 과정이 없는 행렬 연산이므로 순식간(0.1초 미만)에 결과가 나온다.
* 정책망 (Policy Network) : 바둑판을 인식하여 직관적으로 어디에 두는 것이 좋을지 각 위치에 대한 점수를 뽑아낸다. 역시 심층 컨볼루션 신경망(Deep Convolutional Neural Network)이며, 결과는 순식간에 나온다.
* 몬테 카를로 트리 검색(MCTS) : 다양한 경우의 수를 따져 보는 인공지능. 착수할 시간이 충분히 주어질 경우 가장 오래 걸리는 부분이지만 반대로 최적화할 여지는 적다. 훈련된 정책망을 사용하여 직관적인 수부터 먼저 고려한 뒤 가치망으로 그 가치를 계산하는 것이 일반적인 MCTS와의 결정적인 차이.[* 원래 서술에서는 기존 바둑 프로그램이 MCTS를 안 썼다고 기술되어 있었는데, 사실 MCTS가 최근 10년간 바둑 프로그램이 괄목한 성장을 이룬 가장 큰 이유이다.]

구글 딥마인드 내부에는 다양한 버전의 알파고가 존재한다. 위 셋 중에 하나 혹은 둘만 쓴 버전도 있고, 한 대에서 돌아가는 버전, 클라우드용 버전, 신경망의 커널을 다르게 한 버전 등. 판후이전에 사용한 버전은 세 가지를 모두 쓴 클라우드 버전이며, 논문에서는 ELO rating 3140점으로 추정하고 있었다. 이세돌과의 대국에서 사용된 것은 버전 18, 분산처리 버전이며, 이 버전의 ELO rating은 [2위)]로 집계되었다.

기존 바둑 프로그램과 달리, 바둑의 룰이나 기보 DB에 따른 특수 처리를 덜 한다는 것이 특징이며, 구글에서는 이것을 바둑 이외의 전문 분야에서도 어려운 문제를 해결하는 데 쓸 수 있을 것으로 보고 있다. 구체적으로는 기상 예측이나 질병의 해석 등을 들었다.

기존의 사고방식대로 나온 경우의 수를 따지는 방식이 아닌, 여러 방식으로 승부를 '예측' 하기 때문에 실제 바둑이 알려진 경우의 수보다 훨씬 적은 수를 연산한다고 하며, 계산해야 할 수가 적어지는 대국 후반으로 갈 수록 점점 더 계산이 빨라지고 강해진다고 한다. 실제로 이세돌과의 대전에서는 후반에는 1분 이내에 착점을 하는 무시무시한 속도를 보여주어 초세기로 끌어가지도 못했고, 이세돌이 돌을 던지기 30분 정도 전에 이미 불리한 경우의 수를 제거하고 자신의 승리 예측을 개발진에게 알렸다고 한다. 그때는 한창 해설자들이 '박빙이다' 라고 한 때였고 그 말을 전해들은 하사비스는 묘한 미소를 보였다고.

학습 방법

1. KGS 공개서버에서 플레이된 게임들 중 비교적 고수(6단부터 9단)의 게임 16만개로부터 약 3천만수를 가져와 정책망을 학습시킨다. 교사학습(Supervised Learning)으로 진행된다. 이 부분은 바둑의 룰에 따라 착점하는 것을 이해하는 초기화 과정이라고 보면 된다.
1. 교사학습된 다양한 버전의 정책망끼리 서로 대전시키며 정책망의 성능을 개선해나간다. 강화학습(Reinforcement Learning)으로 진행된다. ~~수억번의 연습도 실제로 가능하다~~
1. 스스로의 대전 기록을 복기하며 가치망의 성능을 개선해나간다. 강화학습(Reinforcement Learning)으로 진행된다.

KGS 기보 데이터베이스는 정책망 초기화(1번)에만 사용되고, 이후의 학습에는 전혀 사용하지 않는다. 실제 학습 진행은 모두 스스로와 대전하는 강화학습으로 진행되며, 이같은 학습방식은 알파고가 독학으로 기력을 향상시킨다는 것을 말하기 때문에 바둑 세계 챔피언을 알파고가 이긴다면 이때까지의 정석이나 좋은 포석 등으로 알려진 것들이 바뀔 것이라 예상된다고 한다. 그런데 그것이 실제로 일어났습니다.

이러한 알파고의 학습 특징의 근간이 되는 딥 큐 러닝(Deep Q-Learning)을 알기 쉽게 예시용으로 아타리벽돌깨기(Breakout) 게임에 적용한 것이 아래의 동영상이다.

[youtube(V1eYniJ0Rnk)] 이 동영상에서 딥 큐 러닝에게 주어진 정보는 단 두 가지, 게임 화면과 '최고 점수를 내라'라는 목표. 알파고는 공이 무엇인지, 막대가 왜 필요한지, 저 위의 벽돌이 뭔지 전혀 모르는 그야말로 '백지' 상태'.

딥 큐 러닝은 시작한 지 10분 정도 무렵에 제대로 조종조차 못하는 모습을 보이고 있다. 그러나 스스로 학습하며 120분이 지난 무렵에는 꽤 괜찮게 플레이를 하고 있으며, 240분이 지난 후는 터널을 뚫어 공을 블록 위로 올리면 점수 획득에 유리하다는 것을 '스스로' 터득한 플레이를 보여준다.

뭔가 인공지능이라서 해서 그럴싸해보이지만, 결국 "보통 사람이 게임 초보에서 게임 고수가 되는 그 과정"을 컴퓨터로 에뮬레이팅한다고 보면 된다. 다만, 그것이 기존의 컴퓨터로는 한계가 있기 때문에, 슈퍼컴퓨터를 쓰는 것. 아무래도 개발자인 데미스 허사비스가 게임공학+컴퓨터공학 전공이기 때문에 "보통의 사람이 게임의 룰을 이해하는 과정"을 탐구하기 위해 이 프로젝트를 시작한게 아닐까 하고 짐작할 뿐이다.

기력

판후이와의 대전에 사용된 알파고는 ELO 레이팅으로 계산했을 때 3140점[* 5국 이후 시점에는 3580점]이었다. 당시 판후이는 [사이트]기준으로 2904점이었고, 구글에서는 79%의 확률로 이길 것으로 예상하고 있었다. 끊임없는 강화학습을 통해 [기력이 더욱 향상되었다고] 한다.

구글 자체에선 5단으로 기력을 매겼는데 김성룡 9단과 알파고의 이세돌전 바둑을 검토한 프로들의 말에 의하면 사실상 9단, 그것도 최정상급이라고 한다(사실 요즘 프로바둑에서 단은 경력이상의 큰 의미를 가지지는 않지만).

일각에선 아예 처음부터 상대의 수준에 맞춰주면서(?) 플레이하는거 아니냐는 시각도 있다. 즉 어디까지나 상대를 효율적으로 이기기 위해 게임을 하는 것이기 때문에 아예 상대를 압도적으로 이길 만한 실력을 보이는 게 아니라, 상대 플레이어의 실력을 이길 정도에만 맞춘 게임을 한다는 것. --안티 스파이럴-- 하지만 이는 부인되었다. [[11]] 2016년 3월 15일 기준으로 현재의 공식 ELO 레이팅은 3586으로, 세계 2위이다.


||<tablewidth=100%>||<:> width=65%[br]{{{#!html  }}} || ||<width=50%><rowbgcolor=#DCDCDC><:> 원문 (국한문혼용체) ||<width=50%><:> 한글전용 ||

|| 第 〇〇一號[br]名譽九段 ALPHAGO[br][br]貴下는 平素 棋道硏磨에 精進하고 棋士로서 人格陶冶에 힘써 棋品이 入神의 域에 이르렀으므로 九段을 免許합니다.[br][br]{{{#!html

二〇一六年 三月 十五日
財團法人 韓國棋院
總裁 洪鍚炫
 

}}} || 제 001호[br]명예 九단 알파고[br][br]귀하는 평소 기도연마에 정진하고 기사로서 인격도야에 힘써 기품이 입신의 역에 이르렀으므로 九단을 면허합니다.[br][br]{{{#!html

2016년 3월 15일
재단법인 한국기원
총재 홍석현
 

}}} ||

||||<bgcolor=#DCDCDC><:> 풀이 || |||| 당신은 평소 바둑을 열심히 연구하고 바둑인으로서 바둑을 두는 형태를 갈고 닦아 신의 경지에 도달했으므로 九단임을 인정합니다. ||


||<tablewidth=65%>||

<:> https://img.focus.kr/mnt/photo/web/2016/03/15/2016031501201548546_L.jpg?width=100% || 2016년3월 15일, 구글 딥마인드 챌린지 매치5국 종료 이후 홍석현중앙일보 회장(한국기원 총재 겸임)이 한국기원 총재 자격으로 알파고한테 명예 프로 九단 단증을 수여했다. [[12]] 명예 프로라고 하지만 실제로 한국기원 데이터에도 九단 명단에 포함시킬 예정(객원기사 자격)이라고 한다. 이제 진짜로 알파고가 프로 九단이 되는 것. 그러나 이 명예 단증을 가지고 좋은 한글을 두고 왜 한문을 쓰느냐는 논란이 불거졌다. 그래서 한국기원에서 부랴부랴 한글/영문으로 병기된 새 단증을 뽑았다. 다만 이것도 九단이 9단으로 표기되어 [* 별도 명시가 없는 한 그냥 9단으로 쓰면 아마 9단을 뜻한다. 프로 단수는 규정상 한자로 표기(한국기원 프로바둑기사 규정)한다. 아마추어는 숫자, 프로는 한자.] 별로 좋지는 않다. 문제는 원래 바둑 프로 단증은 국한문혼용체로, 붓으로 직접 써서 수여하는 것이 전통으로, 원래 나왔던 한문 단증도 관례에 따른 것이라는 사실이다. 대국 후 기자회견에서 둘 다 수여(한글/영문본은 사진찍는 대외용, 국한문혼용체 원본은 기자회견 직전에 수여되었다고 한다)되었다. 기풍은 철저한 집계산을 통해 중후반 바뀌치기 등에서 실수가 없는 실리형 바둑. 전반적으로 전투를 피하는 편이며 행마도 빠르기 보단 굳건한 것을 좋아한다. 는 진짜 싫어해서(?) 사전에 패를 만들지 않으려고 한다. 다만 계산 시간이 좀 걸리고 실리형이라서 그렇지 진짜 대놓고 전투를 벌이면 무시무시한 실력을 보여주기도 한다. 단지 초읽기 대국이나 이세돌과의 대국에서 드러났듯이 복잡한 상황에서 판단이 늦는 경향이 있으며 한번 실수를 하면 계속해서 말리는 타입인 듯. 이것이 버그인지 아니면 엔진 자체의 한계인지는 아직 판단되지 않았다.

논란

한얼 법무법인의 전석진 변호사를 필두로, 구글이 실제로는 클라우드 컴퓨팅을 활용한 브루트 포스 방법론에 의존해 대국을 벌이고 있으니 사기극에 불과하다는 주장이 나왔다. [기사 1] [기사 2] [기사 3] [기사 4] 이러한 주장이 여러 기사를 통해 유포되며 많은 사람들에게 알려지고 있다.

하지만, 이는 알파고의 작동 원리를 전혀 이해하지 못한 주장으로, 애초에 바둑이 브루트 포스[* 모든 경우의 수를 필터링 없이 무작정 전부 계산하는 것. 아이디어와 구현은 간단하나 대개의 경우 실용적으로 쓰기엔 너무 계산량이 많다. 항목 참조.]로 극복하기엔 너무나 경우의 수가 많아서 딥러닝을 도입한 것이기 때문이다.

예컨대, 바둑의 경우의 수를 최대한 작고 안전하게 추산하기 위해, 매 수마다 기사가 최대 두 군데의 선택지만 고려한다고 가정하자. 대국의 상황에 따라 선택지가 하나뿐인 수도 있겠지만, 실제로는 둘 이상의 선택지가 있는 경우가 훨씬 많을 것이므로 무시할 수 있을 것이다. 이세돌과의 제1국이 186수만에 마무리되었으므로 브루트포스를 시도할 때 고려해야 할 전체 경우의 수는 <math>2^{186}</math>, 약 <math>9.8 \times 10^{55}</math>이다. 이 숫자는 일반적으로 바둑 대국의 경우의 수를 논할 때 등장하는 숫자들에 비해 터무니없이 적게 추산한 숫자이다.[* [기사에 따르면] <math>10^{170}</math>]

10GHz급으로 오버클럭된 *****U가 매 클럭당 대국 하나를 검토한다면 매 초 *****U 하나 당 <math>10^{10}</math>대국을 검토하는 셈이다. 이 역시 *****U 하나의 능력을 터무니없이 높게 평가한 것인데, 이런 가정하에서조차 모든 경우의 수를 계산하는 데 <math>9.8 \times 10^{45}</math> 초 <math>\times</math> *****U가 필요하다.

시간을 100년(=약 <math>3 \times 10^{9}</math> 초인데 <math>4 \times 10^{9}</math>초로 크게 추산) 준다고 해도 *****U가 최소 <math>2.45 \times 10^{36}</math>개 필요하다. 정말 천문학적인 숫자인데, *****U 하나가 고작 1g이라고 가정해도 *****U 질량만 합쳐도 태양 질량의 1200배가 넘는다. 0이 조금 덜 붙는다고 별 달라질 것도 없을 뿐더러, 계산량을 적게, *****U의 능력을 크게, *****U 무게를 작게 추산했으므로 오히려 0이 더 붙을 이유가 더 많을 것이다. 위에 링크된 기사 내용대로 구글 클라우드의 컴퓨터 자원을 무한정 사용한다고 가정해도, 태양 질량을 월등히 뛰어넘는 무게의 *****U들을 구글, 혹은 그 누구라도 다른 사람 모르게 갖고 있을 수는 없다.

브루트 포스 가지고는 우주적 스케일이 나와버리는 이런 문제를 해결하기 위해 딥러닝이 도입된 것이고, *****U가 천 개 넘게 사용됐다고 한들 오히려 굉장히 싸게 먹혔다고 판단할 수 있는 이유는 이 때문이다. 참고로 바둑의 모든 가능한 경기수는 구골플렉스[* 10의, 10의 100제곱 제곱. 얼마나 엄청난 숫자인지 상상조차 되지 않는다]를 뛰어넘는다고 하며, 정작 딥마인드에서는 하드웨어는 판후이전 때와 동일한 것을 사용한다고 하였다.

게다가 구글에서 공개한 알카노이드 게임 재현을 통한 딥러닝 구현방식을 본다면, 오히려 인위적 조작을 하는게 오히려 더 알파고를 꼬이게 만들 수 있다. 말그대로 이 슈퍼컴퓨터는 원리상으로는 "슈퍼컴이 안에서 끊임없이 보통 바둑을 계속 두는 것" 뿐이다. 뭐 결론적으로 이 많은 경우의 수를 많이 분석했기 때문에 이세돌이 이길 수 없다는 것은 뻔한 결과일지도.

결정적으로, 알파고가 패배한 대국이 나왔다. 만일 정말로 알파고가 브루트 포스 기법으로 대국에서 가능한 모든 수를 탐색하는 것이라면, 알파고가 질 가능성 또한 당연히 전혀 없다. 그런데 알파고가 졌다. 더 이상의 설명이 必要韓紙?

알고리즘을 실제로 구현하는 과정에서 빠질 수 없는 과정이 시간복잡도 계산과 계산시간 추정인데, 정보올림피아드 출전하는 초중고 학생들도 이해하는 내용을 IT 전문 변호사가 간과한 이유는 다소 의문. 다만 IT에도 여러 갈래 분야가 있다는 점과, 변호사라면 특히 법정에서 다룰 만한 내용들을 주로 공부하였으리라는 점을 생각하면 전혀 이해 못 할 만한 점은 아니라고 할 수 있다. ~~다만 IT 전문이라는 부분만 강조하며 전문성을 부여하려는 기사들이 문제~~

기타

* 디시위키에선 알파고가 스카이넷이라고 [[13]] 국내외 각종 커뮤니티에서도 스카이넷, 혹은 울트론에 비유되고 있다. [[14]] 가끔 판사 드립과 엮이는 경우가 있다. ~~알파고님 저는 기계를 소중히 대해왔습니다~~ 하지만 4번째 대국에서 알파고가 이세돌 9단에게 패하자 순식간에 태세를 바꾸고는 이 최고라며 되레 알파고를 [깐바 있다.] ~~알파고 의문의 퇴물행~~ 근데 5번째 대국에서 알파고가 다시 불계승하자 이틀만에 원상복귀해서 이세돌을 퇴물이라고 까고 있으며 알파고 문서에는 인간 승리및 한국 승리 틀이 사라지고 다시 기계의 승리[* 기계 1승 틀 자체가 알파고 문서에서 처음 생성된 오리지날 틀이 기원이다.]로 틀이 변경되었다. ~~이젠 새삼스럽지도 않다만...~~
* --[메타톤이다]--
* ~~[알파고]~~
*  알파고의 기풍이 이창호와 닮아서 사실 알파고는 거짓이고 이창호가 안에서 둔다는 드립이 있다.[* 사실 이건 18세기에 유명했던 튀르크인(The Turk)이라는 기계의 사례에서 비롯된 것이다. 튀르크인은 체스를 두는 기계라고 하여 유명하였는데, 그 정체는 사실 기계 속에 몸집 작은 사람이 숨어 있는 것이었다.] 
* 간혹 알파고를 메르엠으로, 이세돌 9단을 이에 도전하는 코무기네테로 회장 포지션으로 한 패러디가 나오곤한다.
* --[한 달 뒤, 교보문고에는 불쏘시개가 깔리게 되는데...]--
* 알파고가 애플로 갔으면 아이고가 됐을 거라 카더라 [[15]]
* 워낙 뜨거운 감자가 되다보니 역시 모에선을 피해갈 순 없었다.(모에선/목록 문서의 알파고 부분과 공유) [[16]][* 알파고가 질 걸 상정하고 그려놨었다고 한다. 그리고 이는 4국 이후 현실이 되었다.--오오 오라클 오오--], [[17]][* 사실 PSP 모에화 중 하나의 표절이다.], [[18]], [[19]], [[20]], [[21]], [[22]],[[23]] ~~[[24]] 이건 모에화가 아니잖아?!~~,  3인칭화를 쓴다. [[25]], [졌어요ㅜㅜ]  [이런 만화까지...] ~~몰라 그거 뭐야 무서워~~
* 알파고가 이긴 후 알파가 들어가는 단어들을 이용한 드립들이 뉴스 댓글창에서 유행하기도 했다. 알파문구 드립이라든지 알파부대 출신이라든지...
* 알파고가 연승 행진을 이어가자, 인공지능이 대체할 수 있을 것이라는 전망이 나온 각 전문 분야 종사자들이 불안한 반응을 보이기도 하였다. ~~그리고 댓글들은 차라리 알파고(인공지능)가 낫겠다는 반응 일색~~
 * ['AI경제부총리' 나오면, 살림살이 나아질까?]
 * [왜 '이세돌 승리' 간절히 원했을까]
* 언론 브리핑에서 데미스 허사비스 박사가 “딥마인드 내부적으로 파악하고 있는 알파고의 약점이 있지만 이세돌 9단과의 대국이 치러지기 전 시점에서 말씀드리긴 곤란하다.”는 말을 [적이 있다].
* 허사비스 박사는 이세돌과 알파고의 제2국에서 [단점이 드러났다]고 말하였다. 이와 관련해서, 인공지능 관련 전공자들이 해당 제2국 등의 내용을 바탕으로 알파고의 약점(허점)으로 보이는 것을 지적하였다. 결국, 제4국에서 이세돌은 알파고의 약점을 찔러 승리하는 데 성공했다.
 * ["알파고는 이창호 업그레이드 버전, 하지만 허점 있어]
 * [관점에서 분석한 알파고 1, 2국]
 * [약점이란]
* 만화 히카루의 바둑에서 알파고의 미래를 예언한 듯한 장면이 있다. [갓갓갓인 이유]
 * ~~[[26]] [팔리고 있다.]~~
 * ~~[살 수 있다고 한다.]~~
* ~~구글에서 갈굼받고있다고한다~~[아임알파고]
* 서양 사람이 배나 자가용에 곧잘 여성대명사를 사용하는것처럼, 알파고도 개발자들에게 She, her 등으로 불리며 여성으로 취급된다고 한다. 조혜연 九단이 알파고를 He라고 불렀다가 정정당했다고...
* 이세돌과의 대국 후 일반인들도 알사범이나 알구단 라고 부르는 등 의인~~모에~~화하는 경향이 크게 늘었고 신문기사 등 에도 마치 인격체 처럼 취급하는 논조가 늘었다. 앞으로 인간 지능에 가까운 인공지능체가 등장할 경우에 일반인들의 반응으로 시사하는 바가 있다.
* 알파고의 업적을 기리는 노래가 유튜브에 올라왔다. [youtube(dh_mfGo183Y)] ~~AlphaGo! AlphaGo!~~

스타크래프트 도전 루머

구글은 향후 알파고의 인공지능 기술을 스타크래프트에도 접목하는 방안을 검토중이라고 한다. [[27]] 이에 이영호[[28]], 임요환[[29]], 홍진호[[30]] 등은 바둑과 스타는 다를 것이라면서, 인간의 힘을 보여주겠다고 즐겁게 반응했다.

그러나 이는 한국 언론사의 확대해석으로 SBS 8시 뉴스에서 보도한 건 알파고 관련 팀장이 스타크래프트를 예시로 언급한 것을 확대해석 한 것이다. 정작 딥마인드의 수장 데미스 허사비스는 인터뷰에서 스타크래프트 도전 루머에 대해 [잘 하느냐가 중요한 게 아니라 실험이 인공지능에게 도움이 될 수 있는가가 더 중요하다]며 선을 그었다. ~~간만에 언론들과 인터뷰이영호, 임요환, 홍진호만 이득.~~

일반적으로 게임에 들어가는 AI의 경우, 애당초 스타크래프트와 같은 실시간 진행 비디오 게임은 알파고와 같은 인공지능도 필요 없이 트리거를 통해 APM 컨트롤 싸움만 걸어도 사람이 이길 수 없다(...). AI 대전을 해 보면 알겠지만 트리거를 쓰지 않아도 컴퓨터는 스킬 사용의 정확도나 스킬 동시발동 등의 스킬 컨트롤에서는 인간보다 한참 우위이며[* 인공지능이 발매 당시에도 특별할 게 없던 스타크래프트 1에서조차 컴퓨터는 인간이 못할 모든 스킬 동시에 사용하기를 해낸다. 적 고스트가 보이자 마자 바로 락다운 걸어버리고 자신이 락다운걸면 바로 풀어버리는 등. 그런데도 인간에게 패배하는 이유는 언제 어느 지점에 스킬을 발동해야 더 큰 피해를 줄 수 있는지 등의 인간보다 모자란 판단력이 이런 컨트롤 실력 차이로는 메울 수 없는 수준이기 때문이다.] 게임 개발사들이 굳이 트리거 지정 없이도 신컨을 할 수 있는 AI를 추가하지 않는 이유는 그러면 게임이 너무 어려워 재미가 없어서다. 굳이 인간과 비슷한 조건을 만드려면 정밀제어가 가능한 로봇팔로 조작시키고 APM에 리미트를 걸면 되겠지만 그래도 인간을 능가하는 수준의 마우스 키보드 컨트롤이 가능할 것이다. 로봇팔은 인간의 팔과 달리 고속으로 움직이더라도 실수가 없으며 지치지도 않는다.

그러나 게임 내 AI가 ~~유튜브의 트리거 조작 영상처럼 압도적인 개신컨이 아닌~~ 플레이어가 납득할 수준의 APM을 가지고 플레이를 할 경우 AI의 판단력이 한계가 있기 때문에 대부분은 안전하게 가다가 인간의 찌르기에 패배하는 경우가 많다. 이는 게임 AI는 게임 내부에 삽입하여 각종 정보와 행동양식을 미리 입력해놓는 것이라 한계가 있기 때문. 즉 특정 상황에선 이렇게 하라고 사람이 직접 다 입력해놓으면 그거대로 하는 게 전부인 단순한 시스템이라 멍청할 수밖에 없다.

반면 알파고라면 게임 규칙을 거의 모르는 상태에서 다른 사람들의 플레이 양상을 여럿 보고 자신이 직접 반복 플레이를 해보며 게임을 배우는 머신러닝이 핵심인 시스템이다. 이 경우는 컴퓨터가 별도의 가르침 없이도 알아서 유닛들의 형태를 보면 유닛의 종류와 용도를 깨달아야 하고, 지도를 봐 자원의 종류와 적의 배치를 인식해야 하며 교전시에는 전투 장면에서 전세를 파악할 수 있어야 하고 스킬 아이콘을 봐 스킬의 기능과 효과를 알아야 하는 등 그 인식의 복잡성이 엄청나게 올라가므로 어려울 것이다. 바둑이면 게임을 진행하기 위해서는 검은 돌과 흰 돌의 위치만 알면 되니 매우 간단한 입력만 받아들이면 되는데, 스타크래프트를 하려면 인공지능의 요구 인식력만 대단한 수준이 필요하다.

또한 바둑처럼 턴방식이 아니기 때문에 실시간으로 순간적으로 판단을 내려야 하며, 적의 기지를 정찰하고 이 형태를 파악, 분석하고 기억해서 이에 맞춰 앞으로 상대가 추구할 전술을 추론하고 계획을 수립하며, 또 적의 전술이 바뀌는 것을 적의 병력이나 추가 정찰 등으로 파악하면 이에 따라 또 순간적으로 전술을 수정해야 하는 등 인공지능이 도전하기엔 굉장히 복잡한 요소들이 많다. 이런 것들은 알파고의 존재 목적과는 많이 다른 연구 영역일 것이다.

한편으로 알파고가 스타에 안 도전해도 일단 스타를 비롯하여 RTS 게임을 하는 AI 자체는 있다. 다만 앞서 언급된 여러 이유들로 인해 여전히 인간에게 도전할 수준의 실력은 없다고.[[31]]

관련 커뮤니티에서 올라온 소식 [스타크래프트 관련으로 문의 메일을 보내자 이런 답변이 왔다고 한다~~]

관련 인물

* 딥마인드
 * 데미스 허사비스 : 구글 딥마인드 최고경영자(CEO). [트위터]
 * 아자 황(Aja Huang) : 구글 딥마인드 연구원이자, 손이 없는 알파고를 위해 대신 바둑알을 놓는 인물.  황 본인도 영국 바둑협회 6단인 바둑인이다. 여담으로 알파고를 개발하면서 본인의 바둑 실력도 늘어나 최근엔 연승을 달리고 있다고 한다. ~~알사범님께 사사한 첫 번째 제자~~ 알파고는 컴퓨터 프로그램일 뿐이라 방송 화면에 잡히지 않기 때문에, 저 사람을 [[32]] [[33]][[34]], '대유기생명체콘택트용휴머노이드인터페이스',  '기계 앞잡이', '기계 알잡이', '', '감염된 테란', '컴퓨터 바둑왕', '터미네이터' 등등 온갖 농담거리의 대상이기도.--인간의 첫번째 배신자-- --로봇의 첫 인류 하수인--

파일: 컴퓨터 바둑왕.png

* 바둑 기사
 * 판후이 : 2015년 10월 알파고와 대국하였다.
 * 이세돌 : 2016년 3월 알파고와 대국하였다.

함께보기

[[35]] [[36]] [알파고 갤러리]

[각주] [include(틀:문서 가져옴, title=바둑, version=511)] 분류:인공지능분류:바둑 분류:구글

역사와 대국

인간 대 바둑 프로그램

바둑체스와 같은 다른 게임에 비해 컴퓨터가 인간을 이기기 훨씬 어려운 것으로 여겨지고 있다. 체스 등보다 가능한 국면의 수가 훨씬 크기 때문에, 브루트 포스 등 전통적인 AI 기법 적용이 매우 곤란하기 때문이다.<ref name="googlego" />

1997년 IBM의 컴퓨터 딥 블루가 세계 체스 챔피언 가리 카스파로프를 이기고 20년 정도 지나 인공 지능 기술을 사용한 가장 강한 바둑 프로그램이 인간 아마추어 기사 5단의 수준에 도달했지만,<ref name="DeepMindnature2016"/> 여전히 핸디캡 없이 프로 바둑 기사를 이기진 못했다.<ref name="googlego" /><ref name="bbcgo" /><ref name="CNN0128">Template:웹 인용</ref> 2012년, 4대의 PC 클러스터로 운용되는 프로그램 '젠'(Zen)은 프로 기사 9단 다케미야 마사키와 4점 접바둑으로 5전 2승을 거두었다.

알파고

알파고는 이전 바둑 프로그램보다 현저한 발전을 이루었다. 한 대의 컴퓨터로 운용된 알파고는 '크레이지 스톤'과 '젠'을 포함한 다른 바둑 프로그램과의 500개 대국을 1번을 제외하고는 모두 이겼다.<ref>Template:뉴스 인용</ref><ref>Template:웹 인용</ref> 유사한 경기에서 여러 대의 컴퓨터로 가동한 알파고는 다른 바둑 프로그램과의 500개 경기를 모두 이겼고, 그중 77%는 단일 컴퓨터로 이겼다. 분산 버전은 1,202개의 *****U와 176개의 GPU로 단일 컴퓨터 버전보다 25배 많았다.<ref name="DeepMindnature2016" /> 2015년 10월, 분산 버전 알파고는 유럽 바둑 챔피언 판 후이 프로 기사 2단을 5대 0으로 이겼다.<ref name=MetzWired2016/><ref name="bbcgo">Template:뉴스 인용</ref><ref>Template:웹 인용</ref> 이는 컴퓨터 프로그램이 제 크기의 보드 위의 대등한 대국에서 프로 기사를 이긴 최초의 경기였다.<ref name="lemondego">Template:뉴스 인용</ref> 뉴스는 알고리즘을 설명한 저널 네이처의 출판에 맞추어 2016년 1월 27일까지 지연 발표되었다.<ref name="DeepMindnature2016"/><ref name="bbcgo" />

알파고와 이세돌의 대국

Template:본문 2016년 3월 9일부터 15일까지 대한민국의 프로 기사 이세돌 9단과 대국할 예정이다.<ref name="CNN0128" /> 대국은 총 5차례에 걸쳐 5전 3선승제로 진행되며 어느 한 쪽이 먼저 3승해도 경기는 5경기 모두 펼쳐진다.<ref>YTN 구글 '알파고'·이세돌 바둑 대결 3월 9일 시작 YTN, 2016년 2월 5일</ref><ref>이세돌 vs 구글 알파고, 3월 9일부터 5차례 반상대결 스포츠한국, 2015년 2월 6일</ref> 대국이 벌어지는 장소는 서울의 포 시즌스 호텔이며, 일정은 다음과 같다.<ref>Template:웹 인용</ref><ref>Template:웹 인용</ref>

  • 3월 9일 제 1국 (AlphaGo 승)
  • 3월 10일 제 2국
  • 3월 12일 제 3국
  • 3월 13일 제 4국
  • 3월 15일 제 5국

2시간으로 예정된 이들 대국은 인터넷을 통하여 생방송으로 중계되며, 첫 대국은 대한민국의 한국방송공사에서 생중계될 예정이다.결과: 이세돌(패배) 마지막애 흔들렸음.<ref>Template:웹 인용</ref><ref>Template:뉴스 인용</ref> 딥 마인드 팀의 일원인 아마추어 6단 아자 황이 바둑판에 알파고 대신 돌을 놓고, 알파고는 미국에 위치한 서버에서 구글의 클라우드 컴퓨팅으로 구동될 것이다.<ref name="JoongAng Ilbo">Template:웹 인용</ref> 대국은 중국 규칙을 따라 7점 반의 을 적용하여 공제하며, 양측은 제한시간이 2시간씩이, 초읽기는 60초 3회가 주어진다.<ref name="Korea Baduk Association"/>

우승자는 미화 100만 달러를 상금으로 받는다. 알파고가 이기면 상금은 유니세프를 포함한 구호 단체에 기부될 것이다.<ref>Template:웹 인용</ref> 100만 달러 외에, 이세돌은 다섯 번의 대국의 참가로 15만 달러를 받고, 한 번 이길 때마다 추가로 2만 달러를 받게 된다.<ref name="Korea Baduk Association">Template:웹 인용</ref>

알고리즘

알파고의 알고리즘머신 러닝트리 순회 기술을 조합, 인간과 컴퓨터 모두와의 대규모의 연습과 결합한다. 이 알고리즘은 심층 신경망 기술로 구현한 '가치 네트워크'와 '정책 네트워크'에 인도되는 몬테카를로 트리 순회를 사용한다.<ref name="googlego" /><ref name="DeepMindnature2016" /> 한정된 양의 게임 전용 특징 탐지 전처리로 신경망 입력을 만들어 낸다.<ref name="DeepMindnature2016" />

최초에 시스템의 신경망은 인간의 게임 플레이 전문 기술로 부트스트랩되었다. 알파고는 처음에는 3천 만 수 정도의 데이터베이스를 사용, 기록된 역사적인 게임으로부터 기사(棋士)의 움직임의 연결을 시도, 인간의 바둑 두기를 흉내내도록 훈련되었다.<ref name=MetzWired2016>Template:웹 인용</ref> 알파고가 어느 정도 숙달되자, 강화 학습을 통하여 또 다른 자신과 많은 대국을 하게 하는 방식으로 훈련, 경기력을 향상시켰다.<ref name="googlego"/>

대국 방식

바둑 9단의 기사 김명완은 판 후이와의 대국에서 알파고는 '사람 같다'고 묘사하였고,<ref>Template:웹 인용</ref>(실제 알파고는 응수타진이나 사석작전같은 소위 '인간적인'전략을 능수능란하게 구사했다.) 경기 심판 토비 매닝은 프로그램의 방식을 '보수적'이라고 했다.<ref name=":0">Template:웹 인용</ref>

반응

바둑을 두는 것은 현대의 기술로는 역부족으로 여겨 머신 러닝에서 어려운 문제로 평가되어 왔기에 알파고는 인공 지능 연구의 랜드마크적 성장으로 일컬어졌다.<ref>Template:뉴스 인용</ref><ref>Template:뉴스 인용</ref>

유사 시스템

구글의 경쟁자인 페이스북도 그 자신의 바둑 두는 시스템 '다크포레스트'(darkforest)를 제작하고 있으며, 마찬가지로 머신 러닝과 트리 순회를 조합한다.<ref name=":0" /><ref name=facebook-paper>Template:ArXiv 인용</ref> 다른 컴퓨터 바둑 프로그램에 대해서는 강력한 상대이지만, 2016년 초인 현재까지 바둑 기사를 이긴 적은 없다.<ref>Template:뉴스 인용</ref>

대전 예

알파고 (검정) 대 판후이(樊麾), 제 4국 (2015년 10월 8일), 알파고 기권승.<ref name="DeepMindnature2016">Template:저널 인용</ref>

Template:바둑판

 

Template:바둑판

처음 99수 (96은 10의 위치)   100~165수.

각주

Template:각주

바깥 고리

분류:컴퓨터 바둑 분류: 구글