[김정호의 4차혁명 오딧세이] 인공지능 설계 순서

기사입력 : 2019년11월18일 08:00

최종수정 : 2019년11월18일 08:00

[편집자] 4차 산업혁명은 모든 사물과 인간을 연결하여 빅데이터를 모으고, 이를 이용하여 인공지능으로 학습하여, 결국 인공지능이 인간을 대체하는 시대를 말한다. 이러한 4차 산업혁명의 물결이 산업뿐만 아니라 경제, 사회, 정치 등 전 분야에 걸쳐서 막대한 변화를 일으키고 있다.

글로벌뉴스통신사 뉴스핌은 '김정호의 4차혁명 오딧세이' 칼럼을 매주 연재하여 4차 산업혁명의 본질과 영향, 그리고 전망을 독자들에게 쉽게 소개하고자 한다. 4차 산업혁명의 핵심은 바로 인공지능, 빅데이터, 클라우드 컴퓨팅으로 표현할 수 있으며 그 핵심 부품이 반도체이다. 이들 핵심 기술의 개념과 원리, 응용을 설명하여 일반 독자들이 4차 산업혁명에 대해서 공감하고 이해하며 더 나아가 개인과 기업, 국가의 미래를 계획하는 것을 돕고자 한다.

김정호 카이스트(KAIST) 전기 및 전자공학과 교수는 서울대 전기공학과를 졸업하고 미국 미시건대에서 박사 학위를 받았다. AI대학원 겸임교수, IEEE펠로우, 카이스트 ICT석좌교수, 한화 국방 인공지능 융합연구 센터장, 삼성전자 산학협력 센터장 등을 겸하고 있다.

인공지능 개발의 시작 조건

심층기계학습(Deep Machine Learning)으로 불리는 인공지능이 가까운 미래에 인간의 역할을 대부분 대체할 전망이다. 특히 단순 사무직, 자료 조사, 문서 작성, 상담, 심사, 면접 등은 인공지능이 쉽게 잘 할 수 있다.

은행 창구 지원, 전화 상담원 등이 사라질 대표적인 직업이라 생각한다. 더 나아가 교육자, 의사, 변호사, 법관 등도 그 역할의 상당 부분이 인공지능으로 바뀐다. 인공지능은 빠르고 정확하면서 쉬지도 않는다. 노동조합도 없다.

그 결과, 인간이 '일'과 '노동'에서 소외될 가능성이 크다. 일하고 싶어도 일할 기회가 없어진다는 뜻이다. 앞으로 자라나는 청년들의 취업이 더욱 어려워질 전망이다. 이상적인 상황은 인공지능이 인간의 '일'을 대신해 주고, 대신 인간은 여가 생활, 취미생활, 여행, 독서 등 여가 활동이나 창작 활동을 할 수 있다. 또는 봉사 활동들을 통해서 삶의 의미를 높일 수 있겠다.

인공지능이 인간을 위해서 일을 하도록 하기 위해서는 인공지능을 그러한 목적에 맞게 경제적으로 설계를 해야 한다. 경제적이라는 것은 비용, 시간을 최소화해야 한다는 뜻이다. 그러려면 먼저, 설계하는 인공지능의 목적이 명확할 필요가 있겠다. 일을 대신 할지, 새로운 서비스를 창조할지 등이다.

그리고 그것을 통해서 얻고자 하는 바를 설계에 잘 설정해야 한다. 인간에게 도움을 줄지, 이윤을 얻을지, 효율을 높일지, 에너지나 자원을 절약할지 등이다. 목적하는 바가 인간을 이롭게 해야 한다. 인간을 공격하거나, 인간을 괴롭히지는 말아야 한다.

어찌하거나 인공지능을 설계하려면 목적이 친 인간적이어야 한다. 그리고 개발에 필요한 투자와 거기서부터 얻는 이득 또는 효과가 균형이 맞아야 한다.

인공지능 설계 순서

인공지능의 목적이 명확해지면 설계에 들어간다. 이때 먼저 지도학습 방법을 사용할 것인가, 비지도 학습 방법을 채택할 것인가 정해야 한다.

지도학습에서 대표적인 인공지능 구조가 CNN(Convolution Neural Network), RNN(Recurrent Neural Network), LSTM(Long-term Short-term Memory) 등이 있다.

비지도 학습의 대표적인 구조로 강화 학습이 있다. 판별, 판단(Classification), 인식, 이해, 번역, 인식 등에는 지도학습이 유리하고 게임, 투자, 설계, 최적화 등에는 강화학습이 유용하다.

인공지능 강화학습에 사용되는 동적 프로그래밍(Dynamic Programming)의 예. [출처=KAIST]

다음 단계로, 개발하려는 인공지능의 입력과 출력이 정해진다. 입력은 이미지, 영상, 문장, 책, 소리 등 다양한 디지털 데이터가 된다. 원하는 인공지능 학습과 판단에 필요한 입력 데이터를 설정하고, 충분한 학습과 테스트에 필요한 데이터를 확보해야 한다.

다음으로는 출력을 정해야 한다. 제목이 될 수도 있고, 캡션(caption)이 될 수도 있고, 판단 문장이 될 수도 있고, 그림이 될 수도 있다. 더 나아가 언어가 될 수도 있고, 문장이 될 수도 있고, 목소리가 될 수도 있다.

이때, 지도 학습을 한다고 하면 학습에 쓰일 데이터를 정해야 한다. 그리고 데이터에 설명(Labeling)해야 한다. 어찌 보면 학습용 데이터를 확보하는 것이 가장 난도가 높고 시간과 비용이 많이 들어간다고 볼 수 있다.

데이터를 사업장에서 구할 수도 있다. 구글, 아마존은 자체 플랫폼을 이용해서 데이터를 모은다. 또는 인터넷에서 구할 수도 있다. 이 모든 작업에는 개인의 프라이버시를 침해하지 말아야 하는 어려운 점이 있다. 그래서 플랫폼 확보가 경쟁력이기도 하다.

이렇게도 구하기 어려운 경우, 컴퓨터 시뮬레이션으로 데이터를 만들어 학습하기도 한다. 미래에는 학습용 데이터 자체를 컴퓨터 인공지능으로 만들 수도 있다. 그러면 점점 인공지능은 인간의 손을 떠나게 된다.

이제 인공지능망의 구조(Architecture)를 정해야 한다. CNN, RNN, LSTM을 바로 쓰거나 변형할 수 있다. 대부분 기본 구조를 따르면서 변형하게 된다.

또는 복합적으로 합쳐서 사용하기도 한다. 이때, 데이터 자체도 문장, 그림, 목소리 등 융합적으로 사용하기도 한다. 이런 구조를 멀티모달(Multi-modal) 구조라고 하기도 한다. 앞으로 인공지능 목적에 맞게 새로운 인공지능망 구조도 나오고, 융합할 것으로 예상한다. 이 부분이 창의성이 요구되는 설계 부분이다.

이제 구조가 정해지면 수학적 함수들을 정해야 한다. 활성화 함수(Activation Function)와 비용함수(Cost Function) 등이 구해진다. 이들 함수를 이용해서 역전파 방정식(Back Propagation Chain Relation)을 구한다.

이 함수들은 판별과 전파, 학습과정에서 핵심 역할을 하는 수학 함수다. 수학 실력이 가장 필요한 부분이다. 그리고 설계 변수(Hyper-parameter)들을 정하고 출력 함수, 신경망 층수, 노드 개수 등을 정한다. 최적화 방법, 초기화 방법도 정한다. 여기에는 개발 경험이 많이 필요하다.

이제 구상된 인공지능을 소프트웨어로 구현한다. 여러 가지의 공개된 프레임워크(Framework)를 사용할 수 있다. 보통 구글에서 개발하고 공개한 '텐서 플로우(Tensor Flow)'를 많이 사용하며, 그 상위 언어로 파이선(Python)을 사용한다. 이때 코딩 능력이 필요하다.

다음 단계에서는 개발한 인공지능을 데이터로 학습하며, 테스트를 거친다. 그리고 일정 부분 오차율 미만이 될 때까지 변수와 구조를 최적화해 간다. 이 부분 또한 시간이 오래 걸린다. 목표한 성능이 나올 때까지 반복적인 작업이 계속된다. 인력과 시간이 소모된다.

마지막으로 목표한 사업 또는 미션에 부합하는지 점검하게 된다. 최종 점검 단계에서 목표한 성능이 나오지 않으면, 구조를 바꿔 다시 설계 작업을 해야 한다. 이처럼 반복 작업이 많다. 반복 작업 줄이려면 경험과 수학, 코딩 실력이 필요하다. 이러한 작업은 작게는 수개월에서 수년의 시간이 걸린다.

인공지능 개발 최종 평가

개발한 인공지능의 평가는 결국 시장에서 받게 된다. 사용자가 많이 생기고 수익이 많으면 성공적이라고 볼 수 있다. 즉, 투자 대비 수익이 높아야 한다. 여기서 수익은 현금, 이익, 수수료 또는 노동, 에너지, 시간 절약 등으로 볼 수 있다. 또는 주관적인 행복, 평화, 사랑 등이 지표가 될 수도 있다.

결국 성능이 좋은 인공지능의 향방은 인공지능 구조의 우수성과 데이터 확보의 용이성, 투자 대비 효과 등이 좌우할 전망이다. 여기에 더해 관리비용, 하드웨어 투자비용, 유지비용도 포함된다. 한발 더 나아가, 개발할 인공지능이 가지는 사회적 가치와 윤리 준수도 중요한 평가 항목이 되어야 한다.

김정호 카이스트 전기 및 전자공학과 교수 joungho@kaist.ac.kr

[관련기사]

[관련키워드]

김정호 4차산업혁명 인공지능 카이스트 4차산업 인공지능설계 인공지능개발 지도학습 비지도학습 인공지능망 인공지능함수 함수

GAM - 해외주식 투자 도우미

클리어 시큐어 ② 월가 "다년 성장 사이클 진입" 평가

클리어 시큐어 ① 생체 보안 붐 타고 사상 최고가 경신

[홍콩 대장주] 메이퇀 ③ 신성장 동력의 '폭발적 성장'

[홍콩 대장주] 메이퇀② 실적은 고속 상승, 밸류는 역대 저점

[뉴스핌 베스트 기사]

사진

'모텔 연쇄 살인' 피의자 신상공개 검토 [서울=뉴스핌] 조준경 기자 = 검찰이 '강북 모텔 연쇄 살인 사건' 피의자인 20대 여성 김모 씨에 대한 신상공개 여부를 검토 중이다. 26일 검찰 따르면 서울북부지검은 김씨 신상 공개 여부를 논의하기 위해 신상정보공개심의위원회 개최를 검토하고 있다. [서울=뉴스핌] 최상수 기자 = 서울북부지검 검찰은 2024년 1월 시행된 중대범죄신상공개법에 따라 강력범죄 등 특정중대범죄 혐의가 있는 피의자를 신상정보공개심의위원회에 회부해 신상 공개 여부를 결정할 수 있다. 피해자 유족도 김씨 신상 정보 공개를 요구하고 있다. 김씨 범행으로 숨진 두 번째 피해자 A씨 유족 법률대리인인 남언호 변호사는 이날 보도자료를 통해 "(김씨 범행은) 우리 사회가 경험한 가장 냉혹하고 계획적인 연쇄 범죄 중 하나"라며 "그럼에도 경찰이 신상 공개를 하지 않겠다는 내부 방침을 정한 사실을 납득할 수 없다"고 강조했다. 이에 앞서 서울 강북경찰서는 지난 19일 오전 살인과 마약류 관리법 위반 혐의로 김씨를 서울북부지검에 구속 송치했다. 김씨는 지난해 12월 중순부터 이달 9일까지 20대 남성 3명에게 벤조디아제핀계 약물이 든 음료를 건네 2명을 숨지게 하고 1명이 의식을 잃게 한 혐의를 받는다. 김씨는 경찰 조사에서 병원에서 처방받은 약물을 숙취해소제에 타서 들고 다녔다고 진술했다. 또 남성들에게는 모텔 등에서 의견이 충돌해 이를 건넸다고 주장했다. 그러나 경찰은 김씨가 첫 범행 이후 약물 양을 늘렸다고 진술한 점, 휴대전화 포렌식 자료 등을 볼 때 사망 가능성을 충분히 인지했던 것으로 판단하고 상해치사가 아닌 살인죄를 적용해 검찰에 송치했다. 다만 경찰은 이번 사건이 신상공개 요건을 충족하지 않는다고 판단해 김씨 신상을 비공개했다. 한편 경찰은 지난달 24일 김씨가 다른 남성에게 약물이 든 음료를 건네 의식을 잃게 한 정황을 추가로 확인하고 조사하고 있다. calebcao@newspim.com 2026-02-26 17:38

사진

이부진, 아들 서울대 입학식 참석 [서울=뉴스핌] 남라다 기자 = 이부진 호텔신라 사장이 26일 서울 관악구 서울대학교에서 열린 2026학년도 입학식에 참석해 아들 임동현군의 입학을 축하했다. 이 사장은 이날 모친인 홍라희 리움미술관 명예관장과 함께 서울대를 찾아 임군의 입학을 기념해 사진을 찍기도 했다. [서울=뉴스핌] 김현우 기자 = 이부진 호텔신라 사장(사진 왼쪽)과 홍라희 리움미술관 명예관장이 26일 서울 관악구 서울대학교 2026학년도 입학식에 참석해 아들 임동현군의 입학을 축하하고 있다. khwphoto@newspim.com 임군은 최근 서울 휘문고등학교를 졸업하고 2026학년도 수시모집 전형으로 서울대 경제학부에 합격했다. 고교 시절 내신 성적이 상위권이었으며 대학수학능력시험에서도 한 문제만 틀린 것으로 알려졌다. 서울대 26학번이 된 임군은 외삼촌인 이재용 삼성전자 회장(서울대 동양사학과 87학번)의 후배가 됐다. 이날 입학식 현장에서 이 사장의 패션도 눈길을 끌었다. 이 사장은 크림색 계열의 디올 재킷에 에르메스 버킨백을 매치한 차분한 차림으로 참석했다. 단정한 헤어스타일과 절제된 스타일링으로 재계 인사다운 단아한 이미지를 보였다는 평가가 나왔다. [서울=뉴스핌] 김현우 기자 = 이부진 호텔신라 사장(사진 왼쪽)과 홍라희 리움미술관 명예관장이 26일 서울 관악구 서울대학교 2026학년도 입학식에 참석해 아들 임동현 군의 입학을 축하하고 있다. khwphoto@newspim.com nrd@newspim.com 2026-02-26 16:27