전체기사 최신뉴스 GAM 라씨로
KYD 디데이
증권·금융 VC

속보

더보기

[김정호의 4차혁명 오딧세이] 세종대왕과 인공지능

기사입력 : 2019년07월29일 08:00

최종수정 : 2019년08월06일 19:36

김정호 교수.

브리태니카 백과사전은 빅데이터 보고

1980년대 필자가 고등학생 때 같은 반 친구의 집 중에서 ‘브리태니커(Britannica) 백과사전’ 전집이 있는 학생이 있었다. 그 브리태니커 백과사전은 1768년에 영국에서 처음 발간되었고, 현재까지 이어져 오는 백과사전들 중 가장 오래되었다. 이 사전에 등재되어 있는 항목만도 12만 개가 넘으며, 원본의 단어를 이루고 있는 개수가 무려 4400만 개이다. 그러나 인터넷이 발전하면서 그 영향력이 감소하였고, 마침내 인쇄본의 생산중단이 결정되었다.

그 때 브리태니커 백과사전은 미국 중산층 서재의 필수요소였고 한국에서는 경제적 여유가 있고 자녀의 교육에 관심이 높은 일부 가구에 보급되었다. 가정에서의 지적 관심과 지원의 상징이었다. 방대한 분량의 백과사전으로 영어로 되어 있었고, 그림이 아주 자세히 있었던 기억이 난다. 반면 필자의 집에는 두께만 10센티 되어 보이는 ‘의학 대 백과사전’이 있었다. 가끔 열어 보고 훑어 보면서 시간을 보낸 기억이 난다. 이렇게 백과사전은 가정에서 혹은 도서관에서 자료에 대한 조사와 공부도 되고 무심결에 열어 보면서 어떤 분야에 상식이 생기고 새로운 분야에 관심이 가기도 한다. 백과사전은 지적 호기심의 자극제였다. 지금은 두꺼운 전집인 백과사전을 인터넷 검색기, 네어버, 구글, 위키디피아가 이를 대체하고 있다.

다르게 보면 백과사전이 바로 ‘빅데이터’이다. 인류의 유산과 지식이 여기에 담겨있는 바야흐로 빅데이터의 보고이다. 문자가 발명되고, 활자가 보급되면서 급속히 많은 빅데이터가 책으로 축적되었다. ‘성경’과 ‘불경’도 여기에 포함된다. 이런 문자와 책으로 표현된 빅데이터로 인공지능이 학습을 한다면 인공지능의 성능이 한층 더 향상되고 정밀해 진다. 더 똑똑해 진다. 특히 책 속의 빅데이터가 디지털화되면 송신, 저장, 프로세스가 쉽게 된다. 당연히 인공지능 알고리즘으로 처리가 되고, 입력이 되고, 출력이 된다. 지금은 인공지능이 주로 인터넷에 올라온 사진과 동영상과 텍스트로로 학습을 하지만 미래에는 인류 역사상 가장 큰 축적물인, 바로 책으로 학습을 할 날이 곧 올 수도 있다.

세종대왕과 인공지능

고려 시대부터 시작한 ‘과거 제도’는 관리의 임명제도이다. 공평한 선발 시험을 통해 우수한 ‘신하’를 구하기 위한 자원을 확보한다는 의도의 제도이다. 하지만 한편으로는 한문으로 시험을 본다는 것은 중국어의 소통 능력과 문서 작성 능력을 시험하는 제도라고 볼 수 있다. 조선의 국가 이념인 성리학 수준을 테스트했다는 의도도 같이 있다. 하지만 백성에서 듣고 읽고, 쓸 수 있는 문자를 발명한 ‘한글의 방명’은 우리 역사상 가장 중요하고 대단한 업적이다. 이렇게 세종대왕이 발명한 ‘한글’은 백성들에게 문맹을 퇴치한다는 백성을 사랑하는 ‘애민’ 정신이 깃들어 있다.

1446년 조선시대 세종대왕이 ‘한글’을 새로 창제해 반포하고 훈민정음을 발간했다. 이때 훈민정음은 크게 '예의'와 '해례'로 나누어져 있다. 최근 ‘해례” 상주본 소장자가 "1천억원을 받으면 국가에 헌납하겠다"는 뜻을 밝혀 논란이 됐다. 이러한 소동과는 별개로 ‘한글’은 4차 산업혁명 시대의 ‘빅데이터 보물 창고’로 재 발견되고 있다. 한글이 없으면 우리 고유의 문자도 없고, 빅데이터도 없고, 문화 자주권도 없다. 600년 전에 한글을 창제할 때, 빅데이터와 인공지능 시대를 예감하기는 어려웠다. 만약 훈민정음 해례 상주본에서 빅데이터나 인공지능이 언급되어 있다면 그 가치는 1천억원이 아니라 수백 조원을 불러도 아깝지 않은 문화재가 되었을 것이다.

훈민정음은 오늘날 4차 산업혁명 시대의 관점에서 보면 빅데이터이고, ‘한글’은 우리말 빅데이터가 가능하게 한 원천이다. 이렇게 한글은 ‘한글 기반 빅데이터’ 의 가능성을 만들었다. 세종대왕이 한글 기반 빅데이터 시대를 준비했다고 이야기를 하고 싶다. 한글이 있어서 스마트폰 입력이 되고, 컴퓨터 자판이 생기고 그 결과 우리가 매일 매순간 쓰고 있는 문자, 텍스트, 작품, 책 전체가 디지털로 변환되고, 그 결과 우리 정신의 축적물인 한글 빅데이터의 축적이 가능하다. 세종대왕이 다시 한번 우리를 위해 배려하고 있는 것이다. 그것도 4차 산업혁명 시대에 더욱 그렇다.

빅데이터 플랫폼의 3요소. [출처=KAIST]

빌게이츠가 생각한 빅데이터

마이크로소프트를 창업한 빌게이츠가 최근에 창업에 대해서 말한 적이 있다. 빌 게이츠는 만약 오늘 자신이 새 회사를 차린다면 컴퓨터에 읽는 법을 알려주는 인공지능(AI) 회사를 할 것이라고 밝혔다. 다시 말해 ‘책을 읽는 인공지능 기계’를 창업하고 싶다고 한다. CNBC 등 주요 외신에 따르면 빌 게이츠는 워싱턴에서 열린 ‘워싱턴 경제 클럽’ 행사에서 이같이 언급했다고 한다. 그는 “내 배경을 고려할 때 나는 컴퓨터에 읽는 법을 가르치는 것이 목표인 AI 회사를 시작할 것”이라며 “그러면 그 컴퓨터는 이 세계의 모든 기록된 지식을 흡수하고 이해할 수 있을 것”이라고 말했다. 빌 게이츠는 이어 “이 분야는 AI가 아직 진전을 이루지 못한 영역”이라며 “우리가 그 목표를 달성하면 파급효과는 굉장할 것”이라고 덧붙였다.

이 의미는 빌 게이츠는 인류의 유사이래 축적한 책에 담겨져 있는 빅데이터의 가능성을 높게 평가한 것이다. 민일 우리가 미래에 전세게 도서관에 보관된 수 백가지 언어로 표현된 책 모두 읽어 들이고, 디지털화 하고, 저장해서 빅데이터로 만들고, 결국 이를 인공지능 학습을 위한 빅데이터로 입력으로 한다면 인공지능 컴퓨터는 완전히 모든 분야에서 ‘천재 인공지능’으로 탄생한다.

이렇게 인공지능 컴퓨터가 책을 읽기 위해서는 책 각각 한 페이지씩 사진으로 읽거나, 스캔해서 읽거나 하면서 한 장 한 장 넘기면서 읽고, 디지털 데이터 형식으로 저장해야 한다. 문제는 현재의 기술로 이러한 입력 작업에 시간이 너무 오래 걸릴 가능성이 높다. 빛의 속도로 빠르고, 방대한 분량을 처리하고, 값싼 책 읽기 기계가 필요하다. 책 한 권을 리더기 위에 놓으면 1밀리초 내에 모두 스캔할 수 있는 3차원 스캐너가 필요하다. 혹은 도서관 서가 전체를 1초에 스캔하며 더 좋다. 사진이나 영상은 스마트폰이 이러한 난관을 해결해 주었다. 이러한 기능을 가진 기계가 등장하면 완전 또 다른 빅데이터를 얻게 되고, 4차 산업혁명과 인공지능 시대가 한 단계 더 나아가게 된다. 이렇게 새로운 빅데이터를 확보하기 위해서는 신기술이 필요하다. 여기에 벤처 창업 기업이 탄생한다.

더 훗날 미래에 책 다음으로 인공지능을 위한 빅데이터의 원천은 아마 ‘인간의 뇌와 인체’가 된다. 그 인간의 뇌와 인체 속에 담긴 모든 인간의 데이터가 또 다른 값어치 높은 빅데이터가 된다. 그러려면 인간과 인간의 뇌를 읽는 기계가 필요하다. 책 읽는 인공지능 기계의 개발보다 더 긴 시간이 더 걸릴 전망이다.
2017년 5월 16일 마이크로소프트 창업자인 빌 게이츠가 14개의 시리즈 트윗을 통해 취업 준비생들한테 미래의 가능성에 대해서 조언을 했다. 그는 트윗에서 ‘’인공지능(AI), 에너지, 바이오 분야가 유망하다. 큰 임팩트를 만들 수 있다. 내가 오늘 대학을 나와 사회에 진출한다면 이런 분야에서 출발하겠다’ 라고 이야기 했다. 지금 인공지능을 시작해도 늦지 않는다.

 

빅데이터의 우수성을 갖추기 위해 필요한 요소들. [출처=KAIST]

 

[김정호 카이스트 전기 및 전자공학과 교수] joungho@kaist.ac.kr

 

 

[뉴스핌 베스트 기사]

사진
헌법재판관들 "공정" 49.3% "불공정" 44.9% [서울=뉴스핌] 이바름 기자 = 윤석열 대통령의 탄핵 심판을 맡은 헌법재판관들의 공정성을 묻는 질문에 '공정하다' 49.3%, '공정하지 않다' 44.9%로 팽팽했다. 종합뉴스통신사 뉴스핌이 미디어리서치에 의뢰해 지난 18~19일 전국 만 18세 이상 남녀 1000명을 대상으로 진행해 20일 발표한 ARS(자동응답 시스템) 조사에서 윤 대통령 탄핵 심판 헌법재판관들의 공정성을 묻는 질문에 49.3%가 '공정하다'고 응답했다. '불공정하다'는 답변은 44.9%로 오차범위 내였다. 5.8%는 '잘모름'이었다. 연령별로 보면 30·40·50대는 '공정'이 우세했고, 만18세~29세·60대·70대 이상은 '불공정' 응답이 많았다. 만18세~29세는 공정하다 44.7%, 불공정하다 47.8%, 잘모름은 7.5%였다. 30대는 공정하다 52.2%, 불공정하다 40.4%, 잘모름 7.3%였다. 40대는 공정하다 61.3%, 불공정하다 34.8%, 잘모름 3.9%였다. 50대는 공정하다 61.3%, 불공정하다 35.2%, 잘모름 3.6%였다. 60대는 공정하다 40.7%, 불공정하다 53.8%, 잘모름 5.5%였다. 70대 이상은 공정하다 31.6%, 불공정하다 60.4%, 잘모름은 8.0%였다. 지역별로는 서울과 경기·인천, 광주·전남·전북은 '공정'으로 기울었다. 대전·충청·세종과 강원·제주, 부산·울산·경남, 대구·경북은 '불공정'하다고 봤다. 서울은 공정하다 52.9%, 불공정하다 41.5%, 잘모름 5.6%였다. 경기·인천은 공정하다 50.8%, 불공정하다 44.0%, 잘모름 5.1%였다. 대전·충청·세종은 공정하다 41.8%, 불공정하다 50.7%, 잘모름은 7.4%였다. 강원·제주는 공정하다 44.6%, 불공정하다 48.6%, 잘모름 6.8%였다. 부산·울산·경남은 공정하다 43.8%, 불공정하다 49.3%, 잘모름 6.9%였다. 대구·경북은 공정하다 37.7%, 불공정하다 56.4%, 잘모름은 5.9%였다. 광주·전남·전북은 공정하다 28.2%, 불공정하다 67.6%, 잘모름 4.2%였다. 지지정당별로는 더불어민주당 지지자들은 88.7%가 공정하다고 답했다. 반면 국민의힘 지지자들은 90.0%가 불공정하다고 응답했다. 조국혁신당 지지자들은 84.4%가 공정하다고 봤다. 개혁신당 지지자들은 공정하다 48.0%, 불공정하다 46.9%로 팽팽했다. 진보당 지지자들은 59.5%가 공정하다, 잘모름 27.0%, 불공정하다는 13.5%였다. 무당층은 51.8%가 공정하다, 32.9%는 불공정하다. 잘모름은 15.3%였다. 성별로는 남성 53.6%는 공정하다, 42.1%는 불공정하다였다. 여성은 45.1%가 공정하다, 47.7%는 불공정하다고 답했다. 박상병 정치평론가는 "우리사회의 마지막 성역이었던 헌법재판관의 양심까지도 공격하는 시대"라며 "대통령 탄핵 인용 또는 기각 이후 다음 정권에도 이러한 갈등은 더 심해질 것으로 예상한다"고 전했다. 김대은 미디어리서치 대표는 "지지층에 따라 서로 상반된 입장이 나오고 있어 향후 헌재에서 대통령 탄핵 기각과 인용중 어떠한 판결을 내리더라도 상당한 혼란이 있을 것으로 보인다"고 말했다. 이번 여론조사는 무선 RDD(무작위 전화 걸기)를 활용한 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 7.2%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. right@newspim.com 2025-02-20 11:00
사진
민주 42.3%·국힘 39.7%…오차 범위 내 역전 [서울=뉴스핌] 한태희 기자 = 더불어민주당의 지지율이 청년층·수도권 등 보수 결집으로 힘을 받았던 국민의힘 지지율을 오차 범위 안에서 역전한 것으로 조사됐다. 20~30대 청년층과 서울·경기·인천 등 수도권에서 집권 여당에 대한 호감도가 줄어든 영향으로 분석된다. 종합뉴스통신사 뉴스핌이 여론조사 전문기관 미디어리서치에 의뢰해 지난 18일부터 19일까지 이틀 동안 전국 만 18세 이상 남녀 1000명을 대상으로 진행해 20일 발표한 자동 응답시스템(ARS) 조사에서 '어느 정당을 지지하거나 약간이라도 더 호감을 가지고 있냐'는 질문에 민주당 지지율은 직전 조사(41.4%) 대비 0.9%포인트(p) 오른 42.3%로 나타났다. 국민의힘 지지율은 직전 조사(43.2%) 대비 3.5%p 하락한 39.7%다. 같은 기간 조국혁신당은 4.5%에서 3.5%로 1%p 떨어졌다. 개혁신당은 1.5%에서 2.3%로 0.8%p 올랐다. 진보당은 0.7%로 지지율에 변동이 없었다. '지지 정당 없음'은 5.9%에서 7.6%로 1.7%p 늘었다. '기타 다른 정당'은 2.3%에서 3.1%로 0.8%p 상승했다. '잘모름'은 0.5%에서 0.6%로 0.1%p 올랐다. [서울=뉴스핌] 한태희 기자 = 2025.02.20 ace@newspim.com 연령별로 보면 만 18~29세와 60대 이상은 국민의힘에 대한 지지도가 높았다. 30~50대는 민주당을 더 지지했다. 만 18~29세 정당 지지도를 보면 국민의힘 39.6%, 민주당 36.9%, 개혁신당 7.9%, 조국혁신당 3.6%, 기타 다른 정당 1.9%, 지지 정당 없음 9.5%, 잘모름 0.6%등이다. 직전 조사와 비교하면 민주당은 35.5%에서 36.9%로 1.4%p 올랐고 국민의힘은 46.3%에서 39.6%로 6.7%p 떨어졌다. 30대는 민주당 41.3%, 국민의힘 35.2%, 개혁신당 2.7%, 조국혁신당 1.4%, 진보당 1.3%, 기타 다른 정당 5.3%, 지지 정당 없음 11.4%, 잘모름 1.3% 등이다. 직전 조사 대비 민주당은 39.9%에서 41.3%로 1.4%p 상승했고 국민의힘은 41.1%에서 35.2%로 5.9%p 하락했다. 40대는 민주당 52.2%, 국민의힘 32.9%, 조국혁신당 3.8%, 개혁신당 2.9%, 진보당 0.5%, 기타 다른 정당 1.1%, 지지 정당 없음 1.1% 등이다. 50대는 민주당 50.2%, 국민의힘 27.8%, 조국혁신당 6.4%, 진보당 1.4%, 기타 다른 정당 4.5%, 지지 정당 없음 9.7% 등이다. 60대는 국민의힘 51%, 민주당 38.4%, 조국혁신당 3.2%, 개혁신당 0.5%, 기타 다른 정당 2.7%, 지지 정당 없음 3.7%, 잘모름 0.5% 등이다. 70대 이상은 국민의힘 54.7%, 민주당 31.5%, 조국혁신당 1.8%, 진보당 1.3%, 개혁신당 0.7%, 기타 다른 정당 3.2%, 지지 정당 없음 5.1%, 잘모름 1.7% 등이다. 지역별로 보면 직전 조사와 비교해 서울과 경기·인천 등 수도권에서 민주당이 국민의힘을 역전했다. 반대로 대전·충청·세종에서는 국민의힘이 민주당보다 앞섰다. 서울은 민주 42.5%, 국민의힘 37.4%, 조국혁신당 3.0%, 개혁신당 2.2%, 진보당 2.0%, 기타 다른 정당 3.5%, 지지 정당 없음 9.5% 등이다. 경기·인천은 민주 43.5%, 국민의힘 36.9%, 조국혁신당 4.1%, 개혁신당 3.2%, 진보당 0.3%, 기타 다른 정당 2.5%, 지지 정당 없음 8.6%, 잘모름 0.9% 등이다. 대전·충청·세종은 국민의힘 45.2%, 민주당 41.7%, 개혁신당 1.9%, 조국혁신당 0.8%, 기타 다른 정당 4.4%, 지지 정당 없음 6.0% 등이다. 강원·제주는 민주당 42%, 국민의힘 31.4%, 개혁신당 7.3%, 조국혁신당 4.3%, 진보당 2.4%, 기타 다른 정당 8.1%, 지지 정당 없음 4.4% 등이다. 부산·울산·경남은 국민의힘 47.1%, 민주당 34.7%, 조국혁신당 4.2%, 개혁신당 2.0%, 기타 다른 정당 2.1%, 지지 정당 없음 8.8%, 잘모름 1.1% 등이다. 대구·경북은 국민의힘 57.3%, 국민의힘 29.1%, 조국혁신당 3.8%, 기타 다른 정당 3.1%, 지지 정당 없음 6.7% 등이다. 광주·전남·전북은 민주당 63.7%, 국민의힘 22.1%, 조국혁신당 3.9%, 진보당 1.9%, 개혁신당 1.0%, 기타 다른 정당 2.3%, 지지 정당 없음 3.1%, 잘모름 2.0% 등이다. 성별로 보면 남성은 민주당 41.1%, 국민의힘 38.7%, 조국혁신당 4.2%, 개혁신당 3.3%, 진보당 1.1%, 기타 다른 정당 2.4%, 지지 정당 없음 8.6%, 잘모름 0.6% 등이다. 여성은 민주당 43.5%, 국민의힘 40.7%, 조국혁신당 2.9%, 개혁신당 1.4%, 진보당 0.4%, 기타 다른 정당 3.8%, 지지 정당 없음 6.7%, 잘모름 0.7% 등이다. 박상병 정치평론가는 "윤석열 대통령에 대한 탄핵이 기각될 수 있다는 예상과 극우 인사 준동, 국민의힘까지 힘을 합치며 (보수) 세력이 뭉치는 밴드왜건 효과로 국민의힘 지지율이 상승했으나 이제는 (보수 결집이) 정점에 이르렀다"며 "윤석열 대통령의 헌법재판소 법정 발언에 반감이 생기고 일부 극우 인사들이 밖에서 탄핵 무효를 외치는 게 중도층에는 꼴불견으로 비춰지고 있다"고 분석했다. 이어 "극우 인사들의 준동이 해도 너무 한다는 생각을 하는 사람이 늘며 국민의힘 지지율이 정점에서 하향 추세를 보이고 있다"고 부연했다. 이번 여론조사는 무선 무작위 전화걸기(RDD)를 활용한 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 8.1%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. ace@newspim.com 2025-02-20 11:00
안다쇼핑
Top으로 이동