전체기사 최신뉴스 GAM 라씨로
KYD 디데이

[김정호의 4차혁명 오딧세이] 인공지능 설계 순서

기사입력 : 2019년11월18일 08:00

최종수정 : 2019년11월18일 08:00

[편집자] 4차 산업혁명은 모든 사물과 인간을 연결하여 빅데이터를 모으고, 이를 이용하여 인공지능으로 학습하여, 결국 인공지능이 인간을 대체하는 시대를 말한다. 이러한 4차 산업혁명의 물결이 산업뿐만 아니라 경제, 사회, 정치 등 전 분야에 걸쳐서 막대한 변화를 일으키고 있다.

글로벌뉴스통신사 뉴스핌은 '김정호의 4차혁명 오딧세이' 칼럼을 매주 연재하여 4차 산업혁명의 본질과 영향, 그리고 전망을 독자들에게 쉽게 소개하고자 한다. 4차 산업혁명의 핵심은 바로 인공지능, 빅데이터, 클라우드 컴퓨팅으로 표현할 수 있으며 그 핵심 부품이 반도체이다. 이들 핵심 기술의 개념과 원리, 응용을 설명하여 일반 독자들이 4차 산업혁명에 대해서 공감하고 이해하며 더 나아가 개인과 기업, 국가의 미래를 계획하는 것을 돕고자 한다.

김정호 카이스트(KAIST) 전기 및 전자공학과 교수는 서울대 전기공학과를 졸업하고 미국 미시건대에서 박사 학위를 받았다. AI대학원 겸임교수, IEEE펠로우, 카이스트 ICT석좌교수, 한화 국방 인공지능 융합연구 센터장, 삼성전자 산학협력 센터장 등을 겸하고 있다.

 

인공지능 개발의 시작 조건

심층기계학습(Deep Machine Learning)으로 불리는 인공지능이 가까운 미래에 인간의 역할을 대부분 대체할 전망이다. 특히 단순 사무직, 자료 조사, 문서 작성, 상담, 심사, 면접 등은 인공지능이 쉽게 잘 할 수 있다.

김정호 교수

은행 창구 지원, 전화 상담원 등이 사라질 대표적인 직업이라 생각한다. 더 나아가 교육자, 의사, 변호사, 법관 등도 그 역할의 상당 부분이 인공지능으로 바뀐다. 인공지능은 빠르고 정확하면서 쉬지도 않는다. 노동조합도 없다.

그 결과, 인간이 '일'과 '노동'에서 소외될 가능성이 크다. 일하고 싶어도 일할 기회가 없어진다는 뜻이다. 앞으로 자라나는 청년들의 취업이 더욱 어려워질 전망이다. 이상적인 상황은 인공지능이 인간의 '일'을 대신해 주고, 대신 인간은 여가 생활, 취미생활, 여행, 독서 등 여가 활동이나 창작 활동을 할 수 있다. 또는 봉사 활동들을 통해서 삶의 의미를 높일 수 있겠다.

인공지능이 인간을 위해서 일을 하도록 하기 위해서는 인공지능을 그러한 목적에 맞게 경제적으로 설계를 해야 한다. 경제적이라는 것은 비용, 시간을 최소화해야 한다는 뜻이다. 그러려면 먼저, 설계하는 인공지능의 목적이 명확할 필요가 있겠다. 일을 대신 할지, 새로운 서비스를 창조할지 등이다.

그리고 그것을 통해서 얻고자 하는 바를 설계에 잘 설정해야 한다. 인간에게 도움을 줄지, 이윤을 얻을지, 효율을 높일지, 에너지나 자원을 절약할지 등이다. 목적하는 바가 인간을 이롭게 해야 한다. 인간을 공격하거나, 인간을 괴롭히지는 말아야 한다.

어찌하거나 인공지능을 설계하려면 목적이 친 인간적이어야 한다. 그리고 개발에 필요한 투자와 거기서부터 얻는 이득 또는 효과가 균형이 맞아야 한다.

인공지능 설계 순서

인공지능의 목적이 명확해지면 설계에 들어간다. 이때 먼저 지도학습 방법을 사용할 것인가, 비지도 학습 방법을 채택할 것인가 정해야 한다.

지도학습에서 대표적인 인공지능 구조가 CNN(Convolution Neural Network), RNN(Recurrent Neural Network), LSTM(Long-term Short-term Memory) 등이 있다.

비지도 학습의 대표적인 구조로 강화 학습이 있다. 판별, 판단(Classification), 인식, 이해, 번역, 인식 등에는 지도학습이 유리하고 게임, 투자, 설계, 최적화 등에는 강화학습이 유용하다.

인공지능 강화학습에 사용되는 동적 프로그래밍(Dynamic Programming)의 예. [출처=KAIST]

다음 단계로, 개발하려는 인공지능의 입력과 출력이 정해진다. 입력은 이미지, 영상, 문장, 책, 소리 등 다양한 디지털 데이터가 된다. 원하는 인공지능 학습과 판단에 필요한 입력 데이터를 설정하고, 충분한 학습과 테스트에 필요한 데이터를 확보해야 한다.

다음으로는 출력을 정해야 한다. 제목이 될 수도 있고, 캡션(caption)이 될 수도 있고, 판단 문장이 될 수도 있고, 그림이 될 수도 있다. 더 나아가 언어가 될 수도 있고, 문장이 될 수도 있고, 목소리가 될 수도 있다.

이때, 지도 학습을 한다고 하면 학습에 쓰일 데이터를 정해야 한다. 그리고 데이터에 설명(Labeling)해야 한다. 어찌 보면 학습용 데이터를 확보하는 것이 가장 난도가 높고 시간과 비용이 많이 들어간다고 볼 수 있다.

데이터를 사업장에서 구할 수도 있다. 구글, 아마존은 자체 플랫폼을 이용해서 데이터를 모은다. 또는 인터넷에서 구할 수도 있다. 이 모든 작업에는 개인의 프라이버시를 침해하지 말아야 하는 어려운 점이 있다. 그래서 플랫폼 확보가 경쟁력이기도 하다.

이렇게도 구하기 어려운 경우, 컴퓨터 시뮬레이션으로 데이터를 만들어 학습하기도 한다. 미래에는 학습용 데이터 자체를 컴퓨터 인공지능으로 만들 수도 있다. 그러면 점점 인공지능은 인간의 손을 떠나게 된다.

이제 인공지능망의 구조(Architecture)를 정해야 한다. CNN, RNN, LSTM을 바로 쓰거나 변형할 수 있다. 대부분 기본 구조를 따르면서 변형하게 된다.

또는 복합적으로 합쳐서 사용하기도 한다. 이때, 데이터 자체도 문장, 그림, 목소리 등 융합적으로 사용하기도 한다. 이런 구조를 멀티모달(Multi-modal) 구조라고 하기도 한다. 앞으로 인공지능 목적에 맞게 새로운 인공지능망 구조도 나오고, 융합할 것으로 예상한다. 이 부분이 창의성이 요구되는 설계 부분이다.

이제 구조가 정해지면 수학적 함수들을 정해야 한다. 활성화 함수(Activation Function)와 비용함수(Cost Function) 등이 구해진다. 이들 함수를 이용해서 역전파 방정식(Back Propagation Chain Relation)을 구한다.

인공지능 설계 순서도. [출처=KAIST]

이 함수들은 판별과 전파, 학습과정에서 핵심 역할을 하는 수학 함수다. 수학 실력이 가장 필요한 부분이다. 그리고 설계 변수(Hyper-parameter)들을 정하고 출력 함수, 신경망 층수, 노드 개수 등을 정한다. 최적화 방법, 초기화 방법도 정한다. 여기에는 개발 경험이 많이 필요하다.

이제 구상된 인공지능을 소프트웨어로 구현한다. 여러 가지의 공개된 프레임워크(Framework)를 사용할 수 있다. 보통 구글에서 개발하고 공개한 '텐서 플로우(Tensor Flow)'를 많이 사용하며, 그 상위 언어로 파이선(Python)을 사용한다. 이때 코딩 능력이 필요하다.

다음 단계에서는 개발한 인공지능을 데이터로 학습하며, 테스트를 거친다. 그리고 일정 부분 오차율 미만이 될 때까지 변수와 구조를 최적화해 간다. 이 부분 또한 시간이 오래 걸린다. 목표한 성능이 나올 때까지 반복적인 작업이 계속된다. 인력과 시간이 소모된다.

마지막으로 목표한 사업 또는 미션에 부합하는지 점검하게 된다. 최종 점검 단계에서 목표한 성능이 나오지 않으면, 구조를 바꿔 다시 설계 작업을 해야 한다. 이처럼 반복 작업이 많다. 반복 작업 줄이려면 경험과 수학, 코딩 실력이 필요하다. 이러한 작업은 작게는 수개월에서 수년의 시간이 걸린다.

인공지능 개발 최종 평가

개발한 인공지능의 평가는 결국 시장에서 받게 된다. 사용자가 많이 생기고 수익이 많으면 성공적이라고 볼 수 있다. 즉, 투자 대비 수익이 높아야 한다. 여기서 수익은 현금, 이익, 수수료 또는 노동, 에너지, 시간 절약 등으로 볼 수 있다. 또는 주관적인 행복, 평화, 사랑 등이 지표가 될 수도 있다.

결국 성능이 좋은 인공지능의 향방은 인공지능 구조의 우수성과 데이터 확보의 용이성, 투자 대비 효과 등이 좌우할 전망이다. 여기에 더해 관리비용, 하드웨어 투자비용, 유지비용도 포함된다. 한발 더 나아가, 개발할 인공지능이 가지는 사회적 가치와 윤리 준수도 중요한 평가 항목이 되어야 한다. 

김정호 카이스트 전기 및 전자공학과 교수 joungho@kaist.ac.kr 

[뉴스핌 베스트 기사]

사진
尹 지지율 2.3%p↓, 38.1%…"與 총선참패 '용산 책임론' 영향" [서울=뉴스핌] 박성준 기자 = 윤석열 대통령의 지지율이 소폭 하락해 30%대 후반을 기록했다는 여론조사 결과가 18일 발표됐다. 종합뉴스통신 뉴스핌 의뢰로 여론조사 전문업체 미디어리서치가 지난 15~16일 전국 만 18세 이상 남녀 1001명에게 물은 결과 윤 대통령의 국정운영에 대한 긍정평가는 38.1%로 집계됐다. 부정평가는 59.3%로 나타났다. '잘 모름'에 답한 비율은 2.5%다. 긍정평가와 부정평가 간 격차는 21.2%포인트(p)다. 긍정평가는 지난 조사 대비 2.3%p 하락했고, 부정평가는 1.6%p 상승했다. 연령별로 보면 40대에서 긍·부정 평가 격차가 극명하게 드러났다. 만 18세~29세에서 '잘함'은 36.0% '잘 못함' 61.0%였고, 30대에서는 '잘함' 30.0% '잘 못함' 65.5%였다. 40대는 '잘함' 23.9% '잘 못함' 74.2%, 50대는 '잘함' 38.1% '잘 못함' 59.8%로 집계됐다. 60대는 '잘함' 51.6% '잘 못함' 45.9%였고, 70대 이상에서는 60대와 같이 '잘함'이 50.4%로 '잘 못함'(48.2%)보다 높게 나타났다. 지역별로는 서울 '잘함' 38.5%, '잘 못함'은 60.1%로 집계됐다. 경기·인천 '잘함' 31.4% '잘 못함' 65.2%, 대전·충청·세종 '잘함' 32.7% '잘 못함' 63.4%, 부산·울산·경남 '잘함' 47.1% '잘 못함' 50.6%로 나타났다. 대구·경북은 '잘함' 58.5% '잘 못함' 38.0%, 전남·광주·전북 '잘함' 31.8% '잘 못함' 68.2%로 나타났다. 강원·제주는 '잘함' 37.1% '잘 못함' 60.5%로 집계됐다. 성별로도 남녀 모두 부정평가가 우세했다. 남성은 '잘함' 34.7% '잘 못함' 63.4%, 여성은 '잘함' 41.6% '잘 못함' 55.3%였다. 김대은 미디어리서치 대표는 윤 대통령 지지율 하락 배경에 대해 "108석에 그친 국민의힘의 총선 참패가 '윤 대통령의 일방적·독선적인 국정 운영 스타일로 일관한 탓이 크다'라는 '용산 책임론'이 대두되며 지지율이 하락했다"고 평가했다. 이준한 인천대 정치외교학과 교수도 "선거 결과에 대해 실망한 여론이 반영됐을 것"이라며 "최근 국무회의 발언 등을 국민들이 긍정적으로 생각하는 것도 아니고 경제 상황도 나아지고 있지 않아 추후 지지율은 더 낮아질 수 있다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.9%, 표본오차는 95% 신뢰수준에 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. parksj@newspim.com 2024-04-18 06:00
사진
이재명, 범진보 대권주자 적합도 '압도적 1위' 질주 [서울=뉴스핌] 홍석희 기자 = 22대 총선에서 더불어민주당의 압승을 이끈 이재명 대표가 범진보 진영 차기 대권주자 적합도에서 압도적 1위를 질주했다. 여의도에 입성한 조국 조국혁신당 대표가 2위, 김동연 경기지사가 3위, 김부겸 전 총리가 4위로 뒤를 이었다. 종합뉴스통신사 뉴스핌 의뢰로 여론조사 전문기관 미디어리서치가 지난 15~16일 전국 만 18세 이상 남녀 1001명에게 범진보 진영 인물 중 차기 대권주자로 누가 가장 적합한지 물어본 결과 이 대표 35.4%, 조 대표 9.1%, 김 지사 8.5%, 김 전 총리 6.5%로 나타났다. 뒤이어 김경수 전 경남지사가 1.8%, 임종석 전 대통령 비서실장이 1.6%로 집계됐다. 기타 인물은 16.7%, 적합 후보 없음 15.1%, 잘 모르겠음 5.2%였다. 이 대표는 전체 연령대에서 1위를 차지했다. 다만 60대 이상에선 다소 차이가 좁혀졌다. 만18세~29세에서 이 대표 35.4%, 조 대표 12.1%, 김 지사 10.1%, 김 전 총리 5.8%였다. 30대에선 이 대표 38.7%, 김 지사 6.5%, 김 전 총리 6.2%, 조 대표 5%순이었다. 40대의 경우 이 대표 50.6%, 조 대표 12.6%, 김 지사 5.9%, 김 전 총리 5.1%로 격차가 더욱 벌어졌다. 50대에선 이 대표 41.1%, 조 대표 10.2%, 김 지사 8%, 김 전 총리 5.6%였다. 60대에선 이 대표 23.9%, 김 지사 10.4%, 조 대표 7.8%, 김 전 총리 6.4%순이었다. 70대 이상의 경우 이 대표 19.5%, 김 지사 10.8%, 김 전 총리 10.5%, 조 대표 6%로 나타났다. 이 대표는 전체 지역에서도 1위를 차지했다. 수도권 및 호남에서 격차를 벌렸고 영남에선 차이가 다소 좁아졌다. 서울에서 이 대표 32.9%, 조 대표 9.2%, 김 지사 8.2%, 김 전 총리 4.4%였다. 경기·인천에선 이 대표 43.8%, 김 지사 9.9%, 조 대표 7%, 김 전 총리 4.8%순이었다. 광주·전남·전북의 경우 이 대표 42.9%, 조 대표 9.2%, 김 전 총리 11.5%, 김 지사 6.8%였다. 대구·경북에선 이 대표 21%, 김 전 총리 11.6%, 조 대표 10.3%, 김 지사 8.8%로 나타났다. 부산·울산·경남은 이 대표 27.1%, 조 대표 9.9%, 김 전 총리 7.2%, 김 지사 5.6%였다. 대전·충청·세종에선 이 대표 32.3%, 조 대표 13.5%, 김 지사 10.9%, 김 전 총리 4.4%였다. 강원·제주에선 이 대표 36.2%, 조 대표 8.4%, 김 지사 7.8%, 김 전 총리 7.3%로 집계됐다. 지지 정당별로 살펴보면 민주당 지지층에선 이 대표 74.6%, 조 대표 5.7%, 김 지사 4.5%, 김 전 총리 1.7%로 이 대표가 압도적 지지를 받았다. 반면 국민의힘 지지층에선 김 지사 12.4%, 김 전 총리 9.5%, 이 대표 8.5%, 조 대표 3.4% 순이었다. 조국혁신당 지지층의 경우 이 대표 45.9%, 조 대표 38.5%, 김 지사 4.7%, 김 전 총리 2.2%였다. 김대은 미디어리서치 대표는 "이 대표는 '과반 의석 달성'과 함께 원내 1당을 지키며 대권주자 위상이 더욱 강화했다"며 "조 대표는 비례대표 12석을 얻으며 단숨에 경쟁력 있는 차기 대선후보 반열에 올랐다"고 분석했다. 이번 여론조사는 성별·연령대별·지역별 인구비례할당 후 무작위로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) 자동응답조사(ARS) 방식으로 실시됐다. 응답률은 3.9%고 표본 오차는 95% 신뢰수준에 ±3.1%p다. 통계보정은 2024년 1월 말 행정안전부 발표 주민등록 인구통계 기준 성, 연령, 지역별 셀가중값을 부여했다. 보다 자세한 내용은 중앙선거여론조사심의위원회 여론조사결과 등록현황을 참고하면 된다. hong90@newspim.com 2024-04-18 06:00
안다쇼핑
Top으로 이동