전체기사 최신뉴스 GAM 라씨로
KYD 라이브
KYD 디데이
산업 ICT

속보

더보기

[세돌-한돌/구글-NHN] 한돌 실력은? 알파고 근접했지만

기사입력 : 2019년12월17일 15:29

최종수정 : 2019년12월17일 15:29

알파고 성장 경로 답습...'알파제로' 수준까지 접근
데이터 양과 질에서 구글과 차이 뚜렷

[편집자] '바둑판의 풍운아' 이세돌 9단이 현역에서 물러납니다.  상대의 의표를 찔러 난전을 즐겼던 승부사. 평범을 거부했기에 인공지능(AI)을 극복한 세계 유일의 기사. 은퇴 이벤트도 이목을 집중시킵니다. AI와 의 재대결. 구글 '알파고'와 대결후 3년9개월만입니다. 국내 기술진이 만든 '한돌'과 세 판을 둡니다. 종합뉴스통신 뉴스핌이 '세돌과 한돌의 대결'을 두 가지 측면에서 조명합니다. 인간과 AI의 두뇌싸움이란 측면과 알파고(구글)와 한돌(NHN)의 AI기술 대결입니다.  

[서울=뉴스핌] 김지완 기자 = 이세돌 9단 은퇴대국 상대 인공지능(AI) '한돌' 실력은 알파고 최종버전 '알파제로'에 근접한 것으로 나타났다. 다만 구글 알파고와 NHN 한돌 사이를 구분짓는 확실한 '격차'가 존재한다는 게 전문가들의 평가다.

한돌은 10개월간의 개발 기간을 거쳐 지난 2017년 12월 '한돌' 버전 1.0을 출시했다. 이후 두 번의 판올림을 거치며 3.0버전까지 출시됐다.

출시 1주년을 맞은 지난해 12월 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단과 국내 바둑 랭킹 1위 신진서 9단과의 대국에서 연이어 승리를 거뒀다. 올해 8월 중국 산둥성에서 열린 '2019 중신증권배 세계 인공지능(AI) 바둑대회'에선 3위를 달성했다.

<사진=이형석 사진기자>

◆ 한돌, 알파고 성장 경로 그대로 답습...'알파제로' 수준 근접

한돌은 알파고 성장 경로를 그대로 따랐다. 이창율 NHN 게임AI팀장은 "한돌 1.0은 인간 기보를 사용해서 기력을 끌어올렸고, 2.0부턴 사람 기보 없이 자가 대국만으로 기력을 향상시켰다"며 "3.0에선 자가 대국 속도를 좀 더 빠르게 할 수 있도록 평가 과정을 없앴다"고 밝혔다.

그는 "그 결과 한돌 1.0은 프로기사를 상대로 60%의 승률을 보였다"며 "한돌 2.0은 1.0에 비해 90%의 승률로 개선됐다. 버전 3.0은 2.0에 대해 80~90% 승률을 기록했다"고 설명했다.

알파고 제로(Zero) 역시 인간의 기보에 의존하는 지도학습 없이, 바둑 규칙만으로 스스로 학습하며 기력을 끌어올렸다. 학습 36시간 만에 알파고 리(Lee)의 수준을 능가했다. 72시간 만에 알파고 리와 대국에서 100승에 이를 때까지 패배가 없었다. 40일 후 알파고 마스터와 대국에선 100전 89승 11패를 기록했다.

이에 한돌이 알파고 최종버전 '알파제로(Alpha Zero)' 수준에 근접했다는 분석이다. 

알파제로는 점점 강해지는 자신과의 게임을 반복하면서 스스로 빅데이터를 구축하는 단계에 올라섰다. 알파고는 '판(Fan)' → '리(Lee)' → '마스터(Master)' → '제로(Zero)' → '알파제로(Alpha Zero)' 순으로 발전했다. 이세돌 9단과 승부를 겨뤘던 버전은 '알파고 리'.

이스트소프트 AI연구소의 수석연구원은 "알파고 각 버전의 기술이 공개되고, 이를 바탕으로 개발된 여러 바둑 인공지능들의 경쟁을 통해 기술이 발전하고 있다"며 "한돌은 최강으로 알려진 알파고 제로와 알파 제로에서 사용한 머신러닝 기술을 적용했다. 우리 인공지능 수준은 미국과 중국에는 다소 뒤지지만 사용하는 기술은 격차가 크지 않다"고 진단했다.

NHN 측은 딥러닝의 보편적 방식인 '하이퍼파라미터(Hyperparameter, 직접 세팅하는 값)'를 사용해 동시 학습을 진행했다고 전했다. 아울러 학습 속도를 높일 수 있는 최신 트렌드의 다양한 학습법을 많이 적용했다고 밝혔다.

이창율 NHN 게임AI팀장은 "알파고는 프로기사 9단하고만 대국을 했고, 은퇴를 해서 정확한 기력을 모른다"면서도 "하지만 논문을 기준으로 봤을 때, 한돌은 '알파고 리'는 넘어섰고, 알파고 제로나 알파제로 사이로 본다"고 평가했다. 

구글 알파고는 2017년 10월 네이처에 '인간 지식 없이 바둑을 마스터하기', 지난해 12월 사이언스에 '자가학습을 통해 체스, 쇼기, 바둑을 마스터할 수 있는 범용 강화학습 알고리즘'을 각각 게재했다.

◆ 몬테카를로 기술 적용에선 알파고만큼 성과 못내..."데이터 차이만큼 실력차이 날 것"

다만 구글과 NHN 사이에 넘볼 수 없는 차이, '격차'는 존재한다.

한돌에도 알파고에서 쓰였던 '몬테카를로 트리 탐색(Monte Carlo tree search, MCTS)' 기술이 그대로 적용됐지만, 성과에선 차이를 보였다. MCTS는 상대방과 한번씩 번갈아 가면서 두는 바둑에서 실시간으로 자신과 상대의 가장 좋은 수를 시뮬레이션하면서 최적의 수를 찾는 방법이다.

이창율 팀장은 "알파고는 MCTS에 자가대국으로 만든 기보를 더해 다음 수에 대한 예측과 승리 확률을 높였다"면서 "우리도 MCTS를 놓고, 딥러닝/UCB(Upper Confidence Bound, AI 강화학습 방법 중 하나) 등의 알고리즘들을 실험 해봤지만, 성능이 그렇게 좋아지진 않았다"고 말했다.

그는 "다만 한돌엔 여러 사람이 의논해 좋은 수를 내는 것과 비슷한 '앙상블 추론(Ensemble Inference)'과 통계를 이용한 시뮬레이션으론 어느 정도 성능 개선이 나타났다"고 설명했다.

인공지능 성능을 판가름 짓는 데이터 양과 질에서도 구글에 비해 NHN은 한 수 아래란 평가다. 

소프트웨어업체 인공지능을 담당중인 한 개발자는 "인공지능은 학습에 필요한 데이터와 장비의 규모가 성능을 좌우한다"면서 "한돌이 규모의 경제가 있는 미국·중국만큼 성능을 끌어올리는데 어려움이 있었을 것"이라고 분석했다.

또 다른 인공지능 개발자는 "알파고 알파제로 수준의 데이터를 한돌은 확보하지 못했다"며 "데이터 질적 수준과 양에서 구글과 NHN 차이는 뚜렷하다. 그 차이만큼 알파고와 한돌의 실력 차이가 존재할 것"이라고 평가했다.

 

swiss2pac@newspim.com

[뉴스핌 베스트 기사]

사진
버핏, 하락장에 옥시덴털 등 주식 더 샀다 [뉴욕=뉴스핌] 김민정 특파원 = '오마하의 현인' 워런 버핏의 버크셔 해서웨이가 이번 주 뉴욕증시 하락 장세 속에서 그동안 꾸준히 매수해 온 옥시덴털 페트롤리엄의 지분을 추가 매수했다. 20일(현지시간) CNBC에 따르면 버크셔는 890만 주의 옥시덴털 지분을 4억500만 달러(약 5860억 원)에 매수했다. 이번 지분 인수는 지난 17일과 18일, 19일에 걸쳐 이뤄졌다. 이번 매수로 버크셔가 보유한 옥시덴털의 지분은 28%로 확대했다. 버핏 회장은 하락장에 주식을 저렴하게 산 것으로 보인다. 옥시덴털의 주가는 이번 달 들어 10% 하락해 연초 이후 24%의 낙폭을 기록 중이다. 전날 옥시덴털의 주가는 52주래 최저치를 기록하기도 했다. 버크셔 해서웨이의 워런 버핏 회장 [사진=블룸버그] 옥시덴털은 버크셔가 보유한 주식 중 6번째로 규모가 크지만, 버핏 회장은 완전한 인수설을 부인했다. 버크셔가 옥시덴털을 추가 매수한 것은 지난 6월 이후 이번이 처음이다. 현재 버크셔가 보유한 옥시덴털의 가치는 120억 달러에 이르지만 투자 전문매체 배런스는 옥시덴털 투자로 버크셔가 10억 달러의 손실을 보고 있을 것으로 추정했다. 같은 기간 버크셔는 북미 최대 위성 라디오 사이러스XM 지분 500만 주를 1억1300만 달러에 샀다. 사이러스XM은 올해 60%나 급락해 현재 10여 년간 가장 낮은 수준에서 거래되고 있다. 최근 투자자들은 회사가 2025년 실적 전망치를 하향 조정하면서 주식을 공격적으로 매도했다. 도메인 등록 서비스업체 베리사인의 지분 23만4000주를 약 4500만 달러에 사들였다. 현재 버크셔는 이 회사의 지분 13%를 보유 중이다. 이로써 지난 3거래일간 버크셔가 매수한 지분은 최소 5억6000만 달러에 달한다. mj72284@newspim.com 2024-12-21 00:55
사진
달러/원 환율 1,450원 돌파...15년래 최고 [서울=뉴스핌] 고인원 기자= 19일 달러/원 환율이 1450원도 돌파하며 15년 6개월 만에 최고치를 기록했다. 올해 마지막 연방공개시장위원회(FOMC) 정례 회의에서 미국 연방준비제도(Fed)가 예상대로 기준 금리를 0.25%포인트 인하했으나 내년 기준 금리 인하 속도를 줄일 가능성을 시사한 여파다. 연준은 18일(현지 시각) 이틀간 연방공개시장위원회(FOMC) 정례 회의를 마치고 기준 금리를 4.25~4.50%로 0.25%포인트(%p) 인하한다고 밝혔다. 이로써 연준은 9월과 11월에 이어 이달까지 세 번의 회의에서 연속으로 기준 금리를 내렸다. 연준은 별도로 공개한 경제 전망 요약(SEP)에서 내년 말까지 금리 인하 폭을 0.50%p로 제시했다. 이는 9월 1.00%p를 기대한 것에서 크게 축소된 수치다. 이 같은 예상대로면 연준은 내년 0.25%p씩 총 두 차례 금리를 낮추게 된다. 매파적인 연준의 내년 금리 전망에 이날 미 달러화는 2년 만에 최고 수준으로 올라섰고, 달러/원 환율은 한국 시간 19일 오전 6시 50분 기준 1453원으로 1450원도 넘어섰다. 이는 지난 2009년 3월 이후 약 15년 만에 최고치다. 지난 2017년 도널드 트럼프 당시 대통령이 제롬 파월 당시 연방준비제도(Fed) 이사를 차기 의장으로 지명했다. [사진=블룸버그] koinwon@newspim.com 2024-12-19 06:58
안다쇼핑
Top으로 이동