[김정호의 4차혁명 오딧세이] 인공지능 설계 순서

기사입력 : 2019년11월18일 08:00

최종수정 : 2019년11월18일 08:00

[편집자] 4차 산업혁명은 모든 사물과 인간을 연결하여 빅데이터를 모으고, 이를 이용하여 인공지능으로 학습하여, 결국 인공지능이 인간을 대체하는 시대를 말한다. 이러한 4차 산업혁명의 물결이 산업뿐만 아니라 경제, 사회, 정치 등 전 분야에 걸쳐서 막대한 변화를 일으키고 있다.

글로벌뉴스통신사 뉴스핌은 '김정호의 4차혁명 오딧세이' 칼럼을 매주 연재하여 4차 산업혁명의 본질과 영향, 그리고 전망을 독자들에게 쉽게 소개하고자 한다. 4차 산업혁명의 핵심은 바로 인공지능, 빅데이터, 클라우드 컴퓨팅으로 표현할 수 있으며 그 핵심 부품이 반도체이다. 이들 핵심 기술의 개념과 원리, 응용을 설명하여 일반 독자들이 4차 산업혁명에 대해서 공감하고 이해하며 더 나아가 개인과 기업, 국가의 미래를 계획하는 것을 돕고자 한다.

김정호 카이스트(KAIST) 전기 및 전자공학과 교수는 서울대 전기공학과를 졸업하고 미국 미시건대에서 박사 학위를 받았다. AI대학원 겸임교수, IEEE펠로우, 카이스트 ICT석좌교수, 한화 국방 인공지능 융합연구 센터장, 삼성전자 산학협력 센터장 등을 겸하고 있다.

인공지능 개발의 시작 조건

심층기계학습(Deep Machine Learning)으로 불리는 인공지능이 가까운 미래에 인간의 역할을 대부분 대체할 전망이다. 특히 단순 사무직, 자료 조사, 문서 작성, 상담, 심사, 면접 등은 인공지능이 쉽게 잘 할 수 있다.

김정호 교수

은행 창구 지원, 전화 상담원 등이 사라질 대표적인 직업이라 생각한다. 더 나아가 교육자, 의사, 변호사, 법관 등도 그 역할의 상당 부분이 인공지능으로 바뀐다. 인공지능은 빠르고 정확하면서 쉬지도 않는다. 노동조합도 없다.

그 결과, 인간이 '일'과 '노동'에서 소외될 가능성이 크다. 일하고 싶어도 일할 기회가 없어진다는 뜻이다. 앞으로 자라나는 청년들의 취업이 더욱 어려워질 전망이다. 이상적인 상황은 인공지능이 인간의 '일'을 대신해 주고, 대신 인간은 여가 생활, 취미생활, 여행, 독서 등 여가 활동이나 창작 활동을 할 수 있다. 또는 봉사 활동들을 통해서 삶의 의미를 높일 수 있겠다.

인공지능이 인간을 위해서 일을 하도록 하기 위해서는 인공지능을 그러한 목적에 맞게 경제적으로 설계를 해야 한다. 경제적이라는 것은 비용, 시간을 최소화해야 한다는 뜻이다. 그러려면 먼저, 설계하는 인공지능의 목적이 명확할 필요가 있겠다. 일을 대신 할지, 새로운 서비스를 창조할지 등이다.

그리고 그것을 통해서 얻고자 하는 바를 설계에 잘 설정해야 한다. 인간에게 도움을 줄지, 이윤을 얻을지, 효율을 높일지, 에너지나 자원을 절약할지 등이다. 목적하는 바가 인간을 이롭게 해야 한다. 인간을 공격하거나, 인간을 괴롭히지는 말아야 한다.

어찌하거나 인공지능을 설계하려면 목적이 친 인간적이어야 한다. 그리고 개발에 필요한 투자와 거기서부터 얻는 이득 또는 효과가 균형이 맞아야 한다.

인공지능 설계 순서

인공지능의 목적이 명확해지면 설계에 들어간다. 이때 먼저 지도학습 방법을 사용할 것인가, 비지도 학습 방법을 채택할 것인가 정해야 한다.

지도학습에서 대표적인 인공지능 구조가 CNN(Convolution Neural Network), RNN(Recurrent Neural Network), LSTM(Long-term Short-term Memory) 등이 있다.

비지도 학습의 대표적인 구조로 강화 학습이 있다. 판별, 판단(Classification), 인식, 이해, 번역, 인식 등에는 지도학습이 유리하고 게임, 투자, 설계, 최적화 등에는 강화학습이 유용하다.

인공지능 강화학습에 사용되는 동적 프로그래밍(Dynamic Programming)의 예. [출처=KAIST]

다음 단계로, 개발하려는 인공지능의 입력과 출력이 정해진다. 입력은 이미지, 영상, 문장, 책, 소리 등 다양한 디지털 데이터가 된다. 원하는 인공지능 학습과 판단에 필요한 입력 데이터를 설정하고, 충분한 학습과 테스트에 필요한 데이터를 확보해야 한다.

다음으로는 출력을 정해야 한다. 제목이 될 수도 있고, 캡션(caption)이 될 수도 있고, 판단 문장이 될 수도 있고, 그림이 될 수도 있다. 더 나아가 언어가 될 수도 있고, 문장이 될 수도 있고, 목소리가 될 수도 있다.

이때, 지도 학습을 한다고 하면 학습에 쓰일 데이터를 정해야 한다. 그리고 데이터에 설명(Labeling)해야 한다. 어찌 보면 학습용 데이터를 확보하는 것이 가장 난도가 높고 시간과 비용이 많이 들어간다고 볼 수 있다.

데이터를 사업장에서 구할 수도 있다. 구글, 아마존은 자체 플랫폼을 이용해서 데이터를 모은다. 또는 인터넷에서 구할 수도 있다. 이 모든 작업에는 개인의 프라이버시를 침해하지 말아야 하는 어려운 점이 있다. 그래서 플랫폼 확보가 경쟁력이기도 하다.

이렇게도 구하기 어려운 경우, 컴퓨터 시뮬레이션으로 데이터를 만들어 학습하기도 한다. 미래에는 학습용 데이터 자체를 컴퓨터 인공지능으로 만들 수도 있다. 그러면 점점 인공지능은 인간의 손을 떠나게 된다.

이제 인공지능망의 구조(Architecture)를 정해야 한다. CNN, RNN, LSTM을 바로 쓰거나 변형할 수 있다. 대부분 기본 구조를 따르면서 변형하게 된다.

또는 복합적으로 합쳐서 사용하기도 한다. 이때, 데이터 자체도 문장, 그림, 목소리 등 융합적으로 사용하기도 한다. 이런 구조를 멀티모달(Multi-modal) 구조라고 하기도 한다. 앞으로 인공지능 목적에 맞게 새로운 인공지능망 구조도 나오고, 융합할 것으로 예상한다. 이 부분이 창의성이 요구되는 설계 부분이다.

이제 구조가 정해지면 수학적 함수들을 정해야 한다. 활성화 함수(Activation Function)와 비용함수(Cost Function) 등이 구해진다. 이들 함수를 이용해서 역전파 방정식(Back Propagation Chain Relation)을 구한다.

인공지능 설계 순서도. [출처=KAIST]

이 함수들은 판별과 전파, 학습과정에서 핵심 역할을 하는 수학 함수다. 수학 실력이 가장 필요한 부분이다. 그리고 설계 변수(Hyper-parameter)들을 정하고 출력 함수, 신경망 층수, 노드 개수 등을 정한다. 최적화 방법, 초기화 방법도 정한다. 여기에는 개발 경험이 많이 필요하다.

이제 구상된 인공지능을 소프트웨어로 구현한다. 여러 가지의 공개된 프레임워크(Framework)를 사용할 수 있다. 보통 구글에서 개발하고 공개한 '텐서 플로우(Tensor Flow)'를 많이 사용하며, 그 상위 언어로 파이선(Python)을 사용한다. 이때 코딩 능력이 필요하다.

다음 단계에서는 개발한 인공지능을 데이터로 학습하며, 테스트를 거친다. 그리고 일정 부분 오차율 미만이 될 때까지 변수와 구조를 최적화해 간다. 이 부분 또한 시간이 오래 걸린다. 목표한 성능이 나올 때까지 반복적인 작업이 계속된다. 인력과 시간이 소모된다.

마지막으로 목표한 사업 또는 미션에 부합하는지 점검하게 된다. 최종 점검 단계에서 목표한 성능이 나오지 않으면, 구조를 바꿔 다시 설계 작업을 해야 한다. 이처럼 반복 작업이 많다. 반복 작업 줄이려면 경험과 수학, 코딩 실력이 필요하다. 이러한 작업은 작게는 수개월에서 수년의 시간이 걸린다.

인공지능 개발 최종 평가

개발한 인공지능의 평가는 결국 시장에서 받게 된다. 사용자가 많이 생기고 수익이 많으면 성공적이라고 볼 수 있다. 즉, 투자 대비 수익이 높아야 한다. 여기서 수익은 현금, 이익, 수수료 또는 노동, 에너지, 시간 절약 등으로 볼 수 있다. 또는 주관적인 행복, 평화, 사랑 등이 지표가 될 수도 있다.

결국 성능이 좋은 인공지능의 향방은 인공지능 구조의 우수성과 데이터 확보의 용이성, 투자 대비 효과 등이 좌우할 전망이다. 여기에 더해 관리비용, 하드웨어 투자비용, 유지비용도 포함된다. 한발 더 나아가, 개발할 인공지능이 가지는 사회적 가치와 윤리 준수도 중요한 평가 항목이 되어야 한다.

김정호 카이스트 전기 및 전자공학과 교수 joungho@kaist.ac.kr

사진

재주는 트럼프가, 돈은 브라질이 [서울=뉴스핌] 최원진 기자= 도널드 트럼프 미국 행정부의 관세 공세로 글로벌 무역전쟁이 격화하는 가운데, 브라질이 주요 승자로 부상하고 있다고 월스트리트저널(WSJ)이 1일(현지시간) 보도했다. 보도에 따르면, 중국은 트럼프 대통령이 부과한 대중(對中) 관세에 맞서 미국산 농산물에 보복 관세를 매기며 대체 수입처로 브라질을 주목하고 있다. 수출입 컨테이너 [사진=블룸버그] 중국 가공업체들은 트럼프 대통령이 지난 1월 취임하기 전부터 브라질산 대두를 비축하기 시작했고, 올해 1분기 필요한 물량의 거의 전량을 브라질에서 조달했다. 이는 지난해 같은 기간 54% 수준이었던 브라질산 비중과 비교하면 큰 폭의 증가다. 가격도 상승세다. 상파울루대학 산하 연구기관 세페아(CEPEA)에 따르면, 브라질 항구에서 선적되는 대두의 프리미엄은 중국이 미국산 대두에 10% 관세를 발표한 직후 일주일 동안 약 70% 급등했다. 3월 선적 기준으로는 부셸당 85센트를 기록해 3년 만에 최고치를 찍었다. 닭고기와 달걀 수출도 두 자릿수 증가율을 보인다. 브라질의 가금류·돼지고기·달걀 수출업체를 대표하는 브라질동물단백질협회(ABPA)의 히카르두 산틴 협회장은 올해 들어 브라질의 닭고기 수출은 지난해 같은 기간보다 9%, 달걀 수출은 20% 증가했다고 밝혔다. 브라질은 미국과 달리 조류 인플루엔자를 겪고 있지 않아, 안정적인 공급처로 주목받고 있다. 여기에 중국이 미국산 닭고기에 15%의 보복관세를 부과하면서 브라질산이 대안으로 떠오르고 있다는 설명이다. 사실 브라질과 중국의 교역 관계는 최근 수년 빠르게 확대됐다. 중국은 2009년에 미국을 제치고 브라질의 최대 무역 파트너로 부상했다. 쇠고기, 철광석, 석유 등 자원이 풍부한 브라질은 중국의 막대한 수요에 맞춰 수출을 확대해 왔고, 중국은 브라질의 인프라 건설에 대규모 자본을 투입하고 있다. 현재 중국은 브라질 전체 전력 공급의 약 10%를 차지하고 있으며, 항만과 도로, 철도 등 주요 기반 시설 건설에도 깊숙이 관여하고 있다. 브라질은 미국 시장에서도 수출 확대 가능성을 보고 있다. 중국은 미국의 주요 신발 수출국인데, 미국이 중국산 제품에 고율 관세를 부과할 경우 아시아를 제외하고 최대 신발 생산국인 브라질이 그 자리를 일부 대체할 수 있다는 전망이 나온다다. 하롤두 페헤이라 브라질 신발산업협회(Abicalçados) 회장은 "브라질산 제품에 별다른 관세가 없다면, 미국 수출 확대의 기회가 될 수 있다"라고 밝혔다. 글로벌 무역전쟁 국면에서 오히려 특수를 누릴 것이라는 기대는 브라질 증시에도 훈풍으로 작용했다. 올 들어 브라질 증시는 9% 넘게 오르며 뉴욕 증시를 아웃퍼폼하고 있다. 올 들어 브라질 증시는 9% 넘게 상승, 연중 5% 가까이 하락한 뉴욕증시의 S&P500 지수와 대조를 이룬다 [사진=koyfin] wonjc6@newspim.com 2025-04-02 15:30

속보

[김정호의 4차혁명 오딧세이] 인공지능 설계 순서

[관련기사]

GAM - 해외주식 투자 도우미

라씨로 - 국내주식 투자 도우미

[뉴스핌 베스트 기사]

[주요포토]

뉴스핌TV

스팟Live