지구별에서 - Things Old and New :: 알파고의 태풍이 지나간 뒤

달력

82019  이전 다음

  •  
  •  
  •  
  •  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

알파고의 태풍이 지나간 뒤

 

엊그제로 알파고의 태풍이 휩쓸고 지나갔다.  

 

많은 사람들이 많을 것을 느꼈을 것이다.         두 살짜리 알파고는 한 살만 더 먹으면 어떤 프로도 대적할 수 없는 강자로 자랄것이다.   

 

그 다음은 어떻게 될 것인가?  

 

이 물음에 대한 답도 미지요 미완이다.     과연 인공지능은 인간을 능가할 것인가

 

알파고는 바둑을 사람과는 달리 둔다.  그것은 알파고를 설명한 논문을 보면 안다.

 

 

 

 

Nature 지는 세계 최고의 과학 저널이다.  여기에 논문이 실리면 그 영향인수(impact factor)는 가장 높은 값을 받는다.

물론 다른 여러 인수도 포함되지만 그표지에 논문이 올라 간다는 것은 여간 영예가 아니다.

또 바둑판이 그림으로 올라 왔다는 것만 봐도 바둑계에서는 축하할 만한 일이다.

 

 

 

 

이세돌, Demis Hassabis,  David Silver  세사람이 단상에 올라 기자들의 질문에 답했다.  

 

 

 

왼쪽 부터 이세돌, Demis Hassabis, David Silver 다.

 

 

Demis Hassabis 는 DeepMind 의 CEO 이고 David Silver 는 AlphaGo 팀의 팀장이다.  정월에 나온 Nature 지의 논문의 저자순을 보면 팀원 구성과 그 역할을 대강 짐작할 수 있다.

 

 

 

 

팀장 David Silver 가 제일 먼저 나와 있다.

논문에서 제일 먼저 나오는 경우 First Author 라고 하고 논문에 가장 기여한 사람을 말한다.

알파고 팀원 중에 서울에 온 사람이 몇인지 모르지만

David Silver, Aja Huang, Chris Maddison, Thore Graepel 은 Garlock 와 Redmond 가 해설하는 Google 의 Youtube 에 나와서  AlpahGo에 대한 설명을 해 주었고 Aja Huang 은 이세돌 9단의 앞에 앉아 AlphoGo 의 손이 되어 준 사람이다.  David Silver는  Redmond 의 제 3국 해설장에 나와서 AlphaGo 는 Aja Huang 과 둘이서 연구프로젝트로 시작한 것이라고 말했다.  그래서 이 논문에서 Aja Huang 이름이 두번째 나오지만 별표 주석으로 공동 제 1 저자라고 밝히고 있다.  DeepMind 의 CEO 인  Demis Hassabis 가 제일 뒤에 나오는 것은 그는 연구에 직접적으로 참여 하지 않았지만 연구를 지원하고 관리했다는 뜻이다.  그래서 저자가 20 명이나 되는 논문은 그 순서로 각자의 공헌의 정도와 성격을 파악할 수 있다.

 

 

 

인공지능이나 알파고에 대해서 일반사람들은 잘 모른다.  그러니까 기자들의 질문은  자꾸 엉뚱하고 바보스럽게 들린다.

 

알파고는 사람과 완전히 다른 바둑을 둔다.  사실 사람이 바둑을 둘 때 어떤식으로 뇌가 작동하는지 모르기 때문에 사람의 뇌를 그대로 컴퓨터위에서 재현한다는 것은 불가능하다.

 

여기까지 글을 쓰다말고 열흘이 지났다. 

 

글도 시의라는 것이 있어 한 번 지나가면 그 글의 의미가 희석된다. 

 

그래도 알파고에 대한 관심은 식지 않은 것 같아 글을 이어 쓰기로 했다.

 

사람과 알파고의 바둑 두는 방식의 가장 큰 차이점은 알파고는 몬테칼로 기법을 쓰고 사람은 몬테칼로를 하지 않는다는 것이다. 

 

몬테칼로란 무엇인가?

 

몬테칼로 기법을 잘 아는 일반 사람은 별로 없을 것이다.    Monte Carlo는 모나코의 도시 이름이고 Las Vegas 가 알려지기 훨씬 이전에 도박이 허용되는 도시로 일찍암치 자리 잡았다.

 

몇년전 Las Vegas 방문기를 썼을 때 내가 Monaco 의 Monte Carlo 방문기를 간략히 올린 일이 있다.

 

 

2014/01/27 - [해외여행기/미국 LA 와 라스베이거스 2014] - 죄악의 도시(City of Sin) 에 오다

 

그 글의 내용이 된 2010/06/30 - [해외여행기] - 10년전의 유럽여행 - 볼쯔만 묘비 찾아 가는 길

 

아래의 사진이 나와 있다.  거의 반평생 몬테칼로 기법 개발에 바친 내가 Monte Carlo 역사에서 감개 무량한 사진을 한장 찍었다.

 

 

 

 

 

Monte Carlo 역에서

2000년 7월 6일

 

 

Monte Carlo 기법이란 도박과 직접 관련이 없지만 최초로 이 기법을 도입한 것은 1940년대 원자탄을 개발할 때 해석적 방법으로 풀수 없는 물리 문제를 풀기 위해 도입한 수치해석 기법이다.    확률론을 이용하기 때문에 도박을 연상하여 Monte Carlo 란 이름을 부친 것이다.

 

내 학문적 생애는  통계물리를 연구하는데 바쳤는데 그 반은 Monte Carlo 기법을 써서 통계물리 연구를 했다.  내가 1994년도 서울시 문화상을 탈 때 내 제자 교수가  그 추천문에 이 부분의 공헌을 적었다.  그래서 그 상패에도 몬테칼로 시늉내기(simulation)기법의 연구에 공헌했다는 글귀가 적혀 있다.

 

 

 

 

 

1994년도 서울시 문화상 기초과학부분 상패

 

 

 

 

 

몬테칼로 기법을 설명하기 위해서  가장 알기 쉬운 보기를 들자면 원주율 pi 를 셈하는 두가지 기법이라 할 수 있다.

 

원주율 파이를 셈하는데  유명한 아이작 뉴톤은  아래와 같은 무한 급수를 끌어내어 계산법을 제시했다.

 

 

 

 

이 급수의 항을 계속 더해 가면 파이를 얼마던지 정확히 계산할 수 있었다.

 

그러나 만약에 이 공식을 모르고 pi를 계산하여야 한다면 다른 방법이 없을까?

 

A.  바늘 하나로 π를 셈한다.
 

여러분은 바늘 하나만 던져서 π를 알아 낼 수 있다면 믿겠습니까?   쪽마루나 타일이 깔린 바닥에 바늘을 던져 바늘이 평행선에 닿는 횟수를 세어서 π를 셈할 수 있습니다.  쪽마루나 타일 바닥이 없으면 종이에 같은 간격으로 평행선을 긋고 바늘을 떨어뜨리면 됩니다.  바늘의 길이를 L (cm),  평행선의 간격을 d(cm) 라고 합시다.   d는 바늘 길이 보다 길게( d> L) 잡습니다.  N번 떨어 뜨려 바늘이 평행선에 걸치는 횟수를 Nh 라 합시다.  그러면

                                  π = 2LN/(dNh)       (1)

로 셈할 수 있습니다.  

 

이 것은 내가  쓴 물리로 배우는 플래시 의 19강  19. 뷔퐁의 바늘 - 몬테칼로 기법의 원조  에서 옮겨 온 문장이다. 

 

 

그 강좌에 가 보면 바늘을 던지는 플래시 시늉내기를 직접 해 볼 수 있다.

 

사람과 알파고의 차이는 사람은 뉴톤의 공식을 써서 파이를 셈하고 알파고는 몬테칼로 기법을 써서 다음 한 수의 착수점을 찾는 것이다.

 

위의 논문도 알파고의 몬테칼로 롤 아웃(roll out)에 대해 개략적 이야기만 하고 있기 때문에 정확한 알고리즘을 알 수 없다.  다만 몬테칼로는 표본추출(sampling  뷰퐁의 바늘의 경우 던지는 횟수)의 횟수가 많을 수록 정확도가 올라가기 때문에 엄청난 컴퓨터의 리소스(자원)를 요구한다.   사람의 머리로는 몬테칼로 자체가 불가능한 것이다.

 

컴퓨터의 리소스가 소위 무어의 법칙(18개월 마다 배가한다는)에 따라 증가하면 그 성능은 몇년안에 몇백배가 된다. 

( 2014/12/31 - [일상, 단상] - 지수함수가 선형함수를 넘어 서는 교차점에서 - 2014 년을 보내며  )

 

그러면 알파고의 정밀도도 그 법칙에 따라 올라 갈 것이다.   

 

여기 까지 읽은 독자는 섬뜩한 느낌을 가질 것이다.  인공지능이 인간의 능력을 넘어서 안간을 지배하는 날이 오지 않을까?

 

이 물음의 답은 내가 작년에 읽은 미치오 카쿠 교수의 "마음의 미래" 의 몇 페이지를 여기에 클립해 오는 것으로 대신하려 한다.

 

 

 

 

 

 

 

 

 

일독을 권할 만큼 잘 쓴 책이다.

또 한글 번역도 근래에 보기 드물게 훌륭하다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Posted by Satsol 샛솔

댓글을 달아 주세요

  1. 경천  댓글주소 수정/삭제 댓글쓰기 2016.03.28 11:01

    원주율 파이 구하는 것과 확률론인 몬테칼로 기법과의 상관관계를 잘 모르겠습니다..

    • Satsol 샛솔  댓글주소 수정/삭제 2016.03.28 16:39 신고

      사람과 몬테칼로 기법을 쓰는 알파고를 비유적으로 말한 것입니다. 즉 원주율을 뉴턴의 공식을 써서 셈하는 것을 사람이 바둑 두는 방식으로 비유 하면 알파고는 뷰퐁의 바늘 던지기식으로 원주율을 셈하는 것과 비유된다는 것입니다. 뷔퐁의 바늘은 흔히 몬테칼로 기법의 원조라 불리고 있습니다. 제가 쓴 "물리로 배우는 플래시" 제 19강에 자세히 설명해 놨습니다.