전체기사 최신뉴스 GAM
KYD 디데이

[인간 vs 인공지능]알파고 데이비드 박사 "인간의 모방 아닌, 이기는 것이 우리 목표"

기사입력 : 2016년03월08일 15:39

최종수정 : 2016년03월12일 13:41

구글 알파고의 학습 비법은 '심층 신경망'과 '트리 탐색'

[뉴스핌=이수경 기자] "알파고(AlphaGo)가 흥분을 가져다주는 이유는 기계가 더 높은 수준으로 지식을 쌓아갈 수 있다는 기대에 부응하기 때문이다. 인간이 입력한 정보만 수행하는 것에 그치는 것이 아니라, 기계가 스스로 학습해서 인간과 같은 사고(思考)를 하게 만드는 것이 알파고의 최종 목표다." - 데이비드 실버 구글 딥마인드 리서치 사이언티스트 

미래창조과학부가 주최하고 소프트웨어정책연구소가 주관하는 '성큼 다가온 인공지능' 컨퍼런스가 8일 경기창조혁신센터에서 개최됐다. 

이날 데이비드 실버 구글 딥마인드 리서치 사이언티스트가 '심층 신경망과 트리 탐색을 이용한 바둑 게임 마스터하기'라는 주제로 발표에 나섰다. 

알파고는 지난 2014년 구글이 인수한 인공지능 기업 딥마인드에서 개발한 인공지능 컴퓨터로, 실버 박사는 알파고 프로젝트 팀 리더를 맡고 있다. 

구글 알파고 프로젝트 팀 리더를 맡은 데이비드 실버 박사가 8일 경기창조경제혁신센터에서 열린 '성큼 다가온 인공지능' 컨퍼런스에 참석했다. <사진=이수경 기자>

알파고의 학습 원리에 대해 실버 박사는 "무작위 대입을 통해 모든 경우의 수를 계산하는 '딥블루'와는 달리 알파고는 자가학습을 통해 지식체계를 구축해나간다"며 "남은 경기 내용을 미리 여러 번 진행해 미래를 예측하며, 선별적인 시뮬레이션을 통해 가장 성공적인 수를 찾는 것이 알파고의 특징"이라고 말했다. 

데이비드 실버 박사는 "알파고는 탐색의 최적화를 위해 정책망과 가치망이라는 2종류의 신경망을 구축했다"고 설명했다. 

'정책망'은 이길 가능성이 큰 후보군 위주로 탐색 너비를 줄여준다. 승률이 가장 높은 전략만 추려주는 것. '가치망'은 승자를 예측하며 탐색의 깊이를 줄여준다. 가상으로 게임을 플레이하지 않고도 승자를 예측할 수 있게 해주는 셈이다. 

이 신경망을 구축하기 위해 알파고는 3000만개의 바둑 기보를 '지도학습'했다. 5단 이상의 프로 전문기사가 바둑을 두는 방식을 교본삼아 4주 동안 스스로 학습한 것이다. 이후 자가대국(강화학습)을 통해 신경망을 정교하게 구축했다. 그 결과 인간이 두는 바둑의 수를 예측하는 정확도가 43%에서 57%로 높아졌다.  

실버 박사는 "지도학습을 통해 알파고가 기보를 스스로 학습할 수 있도록 하고 강화학습으로 스스로 학습을 통해 시행착오를 거쳐 승률을 높일 수 있도록 했다"며 "낮은 수준의 기보를 학습했다고 해서 알파고 학습 수준이 낮아지는 것은 아니고 최적의 탐색 알고리즘을 탐색하는 방향으로 학습 수준을 높이는 데 주력했다"고 말했다. 

특정 바둑 기사의 기보 스타일이 기계학습에 영향을 미치느냐는 질문에 실버 박사는 "아니다"라고 선을 그었다. 그는 "알파고가 바둑을 학습하기 위해서는 최소 수십만 개의 기보가 필요하다"며 "특정 기사의 기보를 소량 학습한다고 해서 알파고의 학습 결과에 큰 영향을 미치지는 않는다고 생각한다"고 설명했다. 

실버 박사는 "인간이 당면한 다양한 과제들을 하는 데 밑거름이 되도록 하는 데 알파고가 이바지하고자 한다"며 "구글 딥마인드에서 향후 고려하고 있는 것은 개개인의 의료 데이터를 학습해서 최적화된 치료법을 제공하는 맞춤형 의료 서비스 등이 있다"고 말했다. 

마지막으로 실버 박사는 "우리의 목표는 인간의 행동을 모방하는 것이 아니라 인간을 이기는 것"이며 "다양한 변수가 있어서 누가 이길지는 알 수 없지만, 개인적으로는 알파고가 이기길 기대하고 있다"고 밝혔다. 

 

[뉴스핌 Newspim] 이수경 기자 (sophie@newspim.com)

[뉴스핌 베스트 기사]

사진
오광수 낙마로 본 정권 인사 수난사 [서울=뉴스핌] 이재창 정치전문기자 = 인사는 만사다. 인사를 잘하면 지지율 상승과 함께 국정 동력을 확보할 수 있다. 반대로 인사가 망사가 되면 지지율이 떨어져 국정 운영에 어려움을 겪을 수 있다. 역대 대통령은 조각에서 난맥상을 보이며 후보자들의 잇따른 낙마로 애를 먹었다. 거의 예외가 없었다. 매 정권마다 초기 인사에 대한 비판적인 조어가 등장했다. 이명박 정부의 고소영(고려대·소망교회·영남), 문재인 정부의 캠코더(캠프·코드·더불어민주당), 윤석열 정부의 서오남(서울대·50대·남성)이 대표적이다. 국민에게 감동을 주는 인사와는 거리가 멀었다. 국민의 싸늘한 시선에 직면했다.  [서울=뉴스핌] 이재명 대통령이 12일 서울 서초구 한강홍수통제소에서 열린 수해 대비 현장 점검 회의에서 발언하고 있다. [사진=대통령실] 2025.06.13 photo@newspim.com 이재명 정권도 예외는 아니다. 이재명 대통령의 인사에서 첫 낙마자가 나왔다. 이 대통령은 지난 13일 오광수 대통령실 민정수석비서관의 사의를 수용했다. 지난 8일 임명된 지 닷새 만이다. 공직기강 확립과 인사 검증을 담당하는 민정수석이 낙마한 게 더 아플 수밖에 없다. 인사 검증 작업에 차질이 생길 경우 인선이 늦어질 수 있다. 박근혜 정부는 조각에 52일 걸렸고, 문재인 정부는 195일 만에 조각을 완성했다. 윤석열 정부는 조각에 181일이 소요됐다. 강유정 대통령실 대변인은 이날 오전 브리핑을 통해 "오 수석이 어젯밤 이 대통령에게 사의를 표명했다"며 "이 대통령은 공직기강 확립과 인사 검증을 담당하는 민정수석의 중요성을 감안해 오 수석의 사의를 받아들였다"고 했다. 오 전 수석은 검찰 '특수통' 출신으로 이 대통령의 사법연수원 18기 동기다. '검찰 개혁'의 특명을 부여받았으나 대출 및 부동산 차명 관리 의혹이 잇따라 제기돼 결국 낙마했다. 이 대통령은 사법 개혁 의지와 국정 철학을 이해하는 인사로 조속한 시일 내에 차기 민정수석을 임명할 예정이지만 인사에 신중을 기할 수밖에 없게 됐다. 자연스레 인사 검증 기준이 높아질 가능성이 높다. 그렇지 않아도 제안을 받는 인사 열에 일곱 정도는 스스로 "검증 통과를 자신할 수 없다"며 손사래를 치는 것으로 전해졌다. 인사가 더 어려워질 수 있다. 오 전 수석에 이어 추가 낙마자가 나오면 치명타가 될 수 있다. 자칫 임기 초반 인사로 어려움을 겪었던 전 정권의 전철을 밟을 수도 있다. 여당 내에서 자성의 목소리가 나온 이유다. 김용민 민주당 원내정책수석부대표는 이날 KBS 라디오에서 "여당 의원의 일원으로서 집권 초기에 이런 문제가 불거진 것에 대해 국민의 눈높이에 맞지 못한 부분이 있었다면 사죄드린다"고 말했다. 인사 수난사는 역대 정권에서 되풀이됐다. 이명박 정부는 2008년 2월 발표한 1차 조각에서 남주홍 통일부 장관 후보자, 박은경 환경부 후보자, 이춘호 여성부 장관 후보자가 인사청문회 과정에서 부동산 투기와 위장 전입 의혹에 휘말려 낙마했다. 박근혜 정부의 초대 내각 인사도 이명박 정부의 닮은꼴이었다. 김용준 국무총리 지명자는 부동산 투기와 아들 병역 면제 의혹이 불거져 지명 5일 만에 자진 사퇴했다. 김종훈 미래창조과학부 장관 후보자와 김병관 국방부 장관 후보자, 황철주 중소기업청장 내정자도 스스로 물러났다. 2014년 6월에는 사의를 밝힌 정홍원 총리 후임으로 지명한 안대희(고액 수임 전관예우 논란), 문창극(역사관 논란) 후보자가 잇따라 낙마했다. 문재인 정부 조각 과정도 순탄치 않았다. 안경환 법무부 장관 후보자는 불법 혼인신고 사건 등으로 사퇴했다. 조대엽 고용노동부 장관 후보자, 이유정 헌법재판소 재판관 후보자, 박성진 중소벤처기업부 장관 후보자도 인사청문회 과정에서 각종 논란이 불거지면서 낙마했다. 윤석열 정부도 다르지 않았다. 김인철 사회부총리 겸 교육부 장관 후보자를 비롯해 정호영·김승희 보건복지부 장관 후보자, 송옥렬 공정거래위원장 후보자가 낙마했고, 박순애 사회부총리 겸 교육부 장관은 35일 만에 학제 개편 논란 등으로 사퇴했다. 역대 정부에서 낙마자가 속출한 것은 인사 검증 시스템이 부실한 것이 원인이지만 대통령의 오기 인사도 한몫했다. 대통령이 특정 인사를 고집하면 주변에서 누구도 강하게 반기를 들기 어렵다. 결국 주요 보직에 임명되거나 지명된 뒤 논란이 불거져 낙마하는 악순환이 되풀이됐다. leejc@newspim.com 2025-06-14 06:00
사진
李대통령, 대북 전단 처벌대책 지시 [세종 = 뉴스핌] 김범주 기자 = 이재명 대통령이 14일 대북 전단 살포와 관련해 예방과 사후 처벌에 대한 대책을 관련 부처에 지시했다. 대통령실 강유정 대변인은 서면 브리핑을 통해 이 대통령이 이같이 지시했다고 밝혔다. 지난 13일 이재명 대통령이 경기도 연천군 육군 25사단 비룡전망대를 방문해 장병들을 격려하고 있다/사진=이재명 대통령 인스타그램 이날 새벽 강화도에서 민간 단체가 북한 지역으로 전단을 살포한 것이 확인되면서 내린 지시로 파악됐다. 강 대변인은 "이재명 정부는 접경지역 주민의 일상과 안전을 위협하고 한반도의 군사적 긴장을 고조시킬 수 있는 불법적인 대북 전단 살포는 중단돼야 한다는 입장을 밝혔다"며 "정부가 입장을 밝혔음에도 이를 위반한 데 대한 상황을 엄중히 인식하고 있다"고 밝혔다. 이 대통령의 지시로 오는 16일 통일부 주관으로 유관 부처 회의를 열어 대북 전단과 관련한 종합 대책을 논의할 예정이다. 한편 대북 전단을 살포한 민간 단체와 개인에 대해서는 법 위반 여부를 따져 조치하겠다는 방침도 밝혔다. 이 대통령은 전날 접경지역 주민 간담회에서 통일부의 대북 전단 불법 살포 자제 요청에 '이를 어기고 대북 전단 살포 행위를 할 경우 처벌하겠다'는 취지의 입장을 밝힌 바 있다. wideopen@newspim.com 2025-06-14 19:50
안다쇼핑
Top으로 이동