전체기사 최신뉴스 GAM 라씨로
KYD 디데이

[김정호의 4차혁명 오딧세이] 인공지능 설계 순서

기사입력 : 2019년11월18일 08:00

최종수정 : 2019년11월18일 08:00

[편집자] 4차 산업혁명은 모든 사물과 인간을 연결하여 빅데이터를 모으고, 이를 이용하여 인공지능으로 학습하여, 결국 인공지능이 인간을 대체하는 시대를 말한다. 이러한 4차 산업혁명의 물결이 산업뿐만 아니라 경제, 사회, 정치 등 전 분야에 걸쳐서 막대한 변화를 일으키고 있다.

글로벌뉴스통신사 뉴스핌은 '김정호의 4차혁명 오딧세이' 칼럼을 매주 연재하여 4차 산업혁명의 본질과 영향, 그리고 전망을 독자들에게 쉽게 소개하고자 한다. 4차 산업혁명의 핵심은 바로 인공지능, 빅데이터, 클라우드 컴퓨팅으로 표현할 수 있으며 그 핵심 부품이 반도체이다. 이들 핵심 기술의 개념과 원리, 응용을 설명하여 일반 독자들이 4차 산업혁명에 대해서 공감하고 이해하며 더 나아가 개인과 기업, 국가의 미래를 계획하는 것을 돕고자 한다.

김정호 카이스트(KAIST) 전기 및 전자공학과 교수는 서울대 전기공학과를 졸업하고 미국 미시건대에서 박사 학위를 받았다. AI대학원 겸임교수, IEEE펠로우, 카이스트 ICT석좌교수, 한화 국방 인공지능 융합연구 센터장, 삼성전자 산학협력 센터장 등을 겸하고 있다.

 

인공지능 개발의 시작 조건

심층기계학습(Deep Machine Learning)으로 불리는 인공지능이 가까운 미래에 인간의 역할을 대부분 대체할 전망이다. 특히 단순 사무직, 자료 조사, 문서 작성, 상담, 심사, 면접 등은 인공지능이 쉽게 잘 할 수 있다.

김정호 교수

은행 창구 지원, 전화 상담원 등이 사라질 대표적인 직업이라 생각한다. 더 나아가 교육자, 의사, 변호사, 법관 등도 그 역할의 상당 부분이 인공지능으로 바뀐다. 인공지능은 빠르고 정확하면서 쉬지도 않는다. 노동조합도 없다.

그 결과, 인간이 '일'과 '노동'에서 소외될 가능성이 크다. 일하고 싶어도 일할 기회가 없어진다는 뜻이다. 앞으로 자라나는 청년들의 취업이 더욱 어려워질 전망이다. 이상적인 상황은 인공지능이 인간의 '일'을 대신해 주고, 대신 인간은 여가 생활, 취미생활, 여행, 독서 등 여가 활동이나 창작 활동을 할 수 있다. 또는 봉사 활동들을 통해서 삶의 의미를 높일 수 있겠다.

인공지능이 인간을 위해서 일을 하도록 하기 위해서는 인공지능을 그러한 목적에 맞게 경제적으로 설계를 해야 한다. 경제적이라는 것은 비용, 시간을 최소화해야 한다는 뜻이다. 그러려면 먼저, 설계하는 인공지능의 목적이 명확할 필요가 있겠다. 일을 대신 할지, 새로운 서비스를 창조할지 등이다.

그리고 그것을 통해서 얻고자 하는 바를 설계에 잘 설정해야 한다. 인간에게 도움을 줄지, 이윤을 얻을지, 효율을 높일지, 에너지나 자원을 절약할지 등이다. 목적하는 바가 인간을 이롭게 해야 한다. 인간을 공격하거나, 인간을 괴롭히지는 말아야 한다.

어찌하거나 인공지능을 설계하려면 목적이 친 인간적이어야 한다. 그리고 개발에 필요한 투자와 거기서부터 얻는 이득 또는 효과가 균형이 맞아야 한다.

인공지능 설계 순서

인공지능의 목적이 명확해지면 설계에 들어간다. 이때 먼저 지도학습 방법을 사용할 것인가, 비지도 학습 방법을 채택할 것인가 정해야 한다.

지도학습에서 대표적인 인공지능 구조가 CNN(Convolution Neural Network), RNN(Recurrent Neural Network), LSTM(Long-term Short-term Memory) 등이 있다.

비지도 학습의 대표적인 구조로 강화 학습이 있다. 판별, 판단(Classification), 인식, 이해, 번역, 인식 등에는 지도학습이 유리하고 게임, 투자, 설계, 최적화 등에는 강화학습이 유용하다.

인공지능 강화학습에 사용되는 동적 프로그래밍(Dynamic Programming)의 예. [출처=KAIST]

다음 단계로, 개발하려는 인공지능의 입력과 출력이 정해진다. 입력은 이미지, 영상, 문장, 책, 소리 등 다양한 디지털 데이터가 된다. 원하는 인공지능 학습과 판단에 필요한 입력 데이터를 설정하고, 충분한 학습과 테스트에 필요한 데이터를 확보해야 한다.

다음으로는 출력을 정해야 한다. 제목이 될 수도 있고, 캡션(caption)이 될 수도 있고, 판단 문장이 될 수도 있고, 그림이 될 수도 있다. 더 나아가 언어가 될 수도 있고, 문장이 될 수도 있고, 목소리가 될 수도 있다.

이때, 지도 학습을 한다고 하면 학습에 쓰일 데이터를 정해야 한다. 그리고 데이터에 설명(Labeling)해야 한다. 어찌 보면 학습용 데이터를 확보하는 것이 가장 난도가 높고 시간과 비용이 많이 들어간다고 볼 수 있다.

데이터를 사업장에서 구할 수도 있다. 구글, 아마존은 자체 플랫폼을 이용해서 데이터를 모은다. 또는 인터넷에서 구할 수도 있다. 이 모든 작업에는 개인의 프라이버시를 침해하지 말아야 하는 어려운 점이 있다. 그래서 플랫폼 확보가 경쟁력이기도 하다.

이렇게도 구하기 어려운 경우, 컴퓨터 시뮬레이션으로 데이터를 만들어 학습하기도 한다. 미래에는 학습용 데이터 자체를 컴퓨터 인공지능으로 만들 수도 있다. 그러면 점점 인공지능은 인간의 손을 떠나게 된다.

이제 인공지능망의 구조(Architecture)를 정해야 한다. CNN, RNN, LSTM을 바로 쓰거나 변형할 수 있다. 대부분 기본 구조를 따르면서 변형하게 된다.

또는 복합적으로 합쳐서 사용하기도 한다. 이때, 데이터 자체도 문장, 그림, 목소리 등 융합적으로 사용하기도 한다. 이런 구조를 멀티모달(Multi-modal) 구조라고 하기도 한다. 앞으로 인공지능 목적에 맞게 새로운 인공지능망 구조도 나오고, 융합할 것으로 예상한다. 이 부분이 창의성이 요구되는 설계 부분이다.

이제 구조가 정해지면 수학적 함수들을 정해야 한다. 활성화 함수(Activation Function)와 비용함수(Cost Function) 등이 구해진다. 이들 함수를 이용해서 역전파 방정식(Back Propagation Chain Relation)을 구한다.

인공지능 설계 순서도. [출처=KAIST]

이 함수들은 판별과 전파, 학습과정에서 핵심 역할을 하는 수학 함수다. 수학 실력이 가장 필요한 부분이다. 그리고 설계 변수(Hyper-parameter)들을 정하고 출력 함수, 신경망 층수, 노드 개수 등을 정한다. 최적화 방법, 초기화 방법도 정한다. 여기에는 개발 경험이 많이 필요하다.

이제 구상된 인공지능을 소프트웨어로 구현한다. 여러 가지의 공개된 프레임워크(Framework)를 사용할 수 있다. 보통 구글에서 개발하고 공개한 '텐서 플로우(Tensor Flow)'를 많이 사용하며, 그 상위 언어로 파이선(Python)을 사용한다. 이때 코딩 능력이 필요하다.

다음 단계에서는 개발한 인공지능을 데이터로 학습하며, 테스트를 거친다. 그리고 일정 부분 오차율 미만이 될 때까지 변수와 구조를 최적화해 간다. 이 부분 또한 시간이 오래 걸린다. 목표한 성능이 나올 때까지 반복적인 작업이 계속된다. 인력과 시간이 소모된다.

마지막으로 목표한 사업 또는 미션에 부합하는지 점검하게 된다. 최종 점검 단계에서 목표한 성능이 나오지 않으면, 구조를 바꿔 다시 설계 작업을 해야 한다. 이처럼 반복 작업이 많다. 반복 작업 줄이려면 경험과 수학, 코딩 실력이 필요하다. 이러한 작업은 작게는 수개월에서 수년의 시간이 걸린다.

인공지능 개발 최종 평가

개발한 인공지능의 평가는 결국 시장에서 받게 된다. 사용자가 많이 생기고 수익이 많으면 성공적이라고 볼 수 있다. 즉, 투자 대비 수익이 높아야 한다. 여기서 수익은 현금, 이익, 수수료 또는 노동, 에너지, 시간 절약 등으로 볼 수 있다. 또는 주관적인 행복, 평화, 사랑 등이 지표가 될 수도 있다.

결국 성능이 좋은 인공지능의 향방은 인공지능 구조의 우수성과 데이터 확보의 용이성, 투자 대비 효과 등이 좌우할 전망이다. 여기에 더해 관리비용, 하드웨어 투자비용, 유지비용도 포함된다. 한발 더 나아가, 개발할 인공지능이 가지는 사회적 가치와 윤리 준수도 중요한 평가 항목이 되어야 한다. 

김정호 카이스트 전기 및 전자공학과 교수 joungho@kaist.ac.kr 

CES 2025 참관단 모집

[뉴스핌 베스트 기사]

사진
"尹 기자회견 대국민 사과 미흡" 71.2% [서울=뉴스핌] 이바름 기자 = 국민 10명 중 7명은 윤석열 대통령의 대국민 사과가 미흡하다고 생각하는 것으로 나타났다. 종합뉴스통신사 뉴스핌 의뢰로 여론조사 전문기관 미디어리서치가 지난 11일~12일 이틀간 전국 만 18세 이상 남녀 1002명을 대상으로 진행한 ARS 조사 결과 윤 대통령의 대국민 사과에 대해 '미흡했다(매우 미흡+다소 미흡)'고 응답한 비율이 71.2%로 집계됐다. '진정성 있다(다소 진정성+ 매우 진정성)'고 답변한 비율은 26.4%, '잘모름'은 2.4%로 나타났다.   '윤 대통령의 사과가 미흡했다'는 남녀 모두에서 과반을 넘었다. 남성은 64.9%, 여성은 62.9%가 '매우 미흡했다'고 답변했다. '다소 미흡했다'는 각각 8.3%, 6.2%였다. 남성 71.2%, 여성 69.1%가 윤 대통령 사과에 대해 '미흡했다'는 인식을 같이 하고 있는 셈이다. 연령별로 보면 1020세대와 40대가 특히 부정적으로 인식했다. 40대는 87.2%가 '미흡했다'고 답변했다. 구체적으로 '매우 미흡'이 81.0%, '다소 미흡'이 6.2%였다. '진정성 있다'는 12.3%로 '다소 진정성 있다'는 5.6%, '매우 진정성 있다'는 6.8%였다. '잘모름'은 0.5%였다. 만 18세~29세도 84.8%가 '미흡했다'고 응답했다. '매우 미흡'이 78.8%, '다소 미흡'이 6.0%로 나타났다. '진정성 있다'는 14.3%로 '다소 진정성 있다'가 2.4%, '매우 진정성 있다'는 11.9%였다. '잘모름'은 0.9%였다. 50대는 '미흡했다'가 75.2%(매우 미흡 69.6%, 다소 미흡 5.5%), '진정성 있다'는 23.5%(다소 진정성 7.0%, 매우 진정성 16.5%)로 조사됐다. '잘모름'은 1.3%였다. 30대는 '미흡했다' 68.2%(매우 미흡 62.2%, 다소 미흡 5.9%), '진정성 있다' 24.3%(다소 진정성 6.9%, 매우 진정성 17.5%), 잘모름 7.5%로 나타났다. 60대는 '미흡했다' 60.2%(매우 미흡 52.0%, 다소 미흡 8.1%), '진정성 있다' 38.4%(다소 진정성 17.7%, 매우 진정성 20.8%), '잘모름' 1.4%였다. 전 연령대에서 유일하게 70대 이상만 '진정성 있다'가 48.9%(다소 진정성 23.7%, 매우 진정성 25.3%)로, '미흡했다'고 응답한 46.9%(매우 미흡 34.4%, 다소 미흡 12.6%)를 앞질렀다. 지역별로는 광주·전남·전북이 '미흡했다'가 80.1%(매우 미흡 69.8%, 다소 미흡 10.3%)로 가장 많았다. '진정성 있다'는 16.5%(다소 진정성 7.1%, 매우 진정성 9.4%), '잘모름'은 3.4%였다. 다음으로 경기·인천은 '미흡했다' 74.8%(매우 미흡 69.3%, 다소 미흡 5.5%), '진정성 있다' 25.5%(다소 진정성 8.7%, 매우 진정성 15.8%), '잘모름' 0.7%였다. 서울은 '미흡했다' 74.2%(매우 미흡 64.3%, 다소 미흡 9.9%), '진정성 있다' 24.9%(다소 진정성 7.0, 매우 진정성 17.9%), '잘모름' 0.9%였다. 강원·제주는 '미흡했다' 71.0%(매우 미흡 66.2%, 다소 미흡 4.8%), '진정성 있다' 23.3%(다소 진정성 16.2%, 매우 진정성 7.1%), '잘모름' 5.7%로 나타났다. 부산·울산·경남은 '미흡했다' 65.9%(매우 미흡 55.4%, 다소 미흡 10.5%), '진정성 있다' 30.7%(다소 진정성 12.4%, 매우 진정성 18.3%), '잘모름' 3.4%였다. 대전·충청·세종은 '미흡했다' 64.7%(매우 미흡 61.0%, 다소 미흡 3.6%), '진정성 있다' 28.0%(다소 진정성 12.9%, 매우 진정성 15.1%), '잘모름' 7.3%로 조사됐다. 대구·경북은 '미흡했다' 59.4%(매우 미흡 54.6% 다소 미흡 4.8%), '진정성 있다' 38.5%(다소 진정성 15.8%, 매우 진정성 22.8%), '잘모름' 2.1%로 가장 낮았다. 지지정당별로는 여당을 제외하고 모두가 부정적인 답변이 많았다. 더불어민주당 지지자들은 윤 대통령의 사과가 '미흡했다'고 응답한 비율이 95.1%에 달했다. 이중 '매우 미흡'은 91.9%, '다소 미흡'은 3.1%였다. '진정성 있다'고 답변한 비율은 4.5%(다소 진정성 1.3%, 매우 진정성 3.2%)에 불과했다. '잘모름'은 0.4%였다. 반대로 국민의힘 지지자들은 62.6%가 '진정성 있다'고 대답했다. '다소 진정성이 있었다'는 26.1%, '매우 진정성이 있었다'가 36.7%로 집계됐다. '미흡했다'는 35.4%(매우 미흡 22.9%, 다소 미흡 12.4%), '잘모름'은 1.9%였다. 조국혁신당 지지자들은 '미흡했다' 95.8%(매우 미흡 94.7%, 다소 미흡 1.1%), '진정성 있다' 4.2%(다소 진정성 1.1%, 매우 진정성 3.1%)였다. 개혁신당은 '미흡했다' 90.0%(매우 미흡 77.9%, 다소 미흡 12.1%), '진정성 있다' 8.3%(다소 진정성 3.4%, 매우 진정성 4.9%), '잘모름' 1.7%였다. 진보당은 '미흡했다' 70.1%(매우 미흡 65.1%, 다소 미흡 5.0%), '진정성 있다' 29.9%(다소 진정성 2.3%, 매우 진정성 27.6%)로 조사됐다. 무당층은 '미흡했다' 78.6%(매우 미흡 71.3%, 다소 미흡 7.3%), '진정성 있다' 9.4%(다소 진정성 6.0%, 매우 진정성 3.4%), '잘모름' 12.0%였다. 국정지지별로는 '잘못하고 있다'는 응답자 중 94.8%가 '미흡했다'고 답변했다. '매우 미흡'이 87.9%, '다소 미흡'이 6.9%였다. '진정성 있다'는 3.1%(다소 진정성 2.0%, 매우 진정성 1.1%), 잘모름은 2.1%였다. 국정을 '잘 하고 있다' 응답자 중에서는 89.2%가 '진정성 있다'고 대답했다. '다소 진정성'은 32.5%, '매우 진정성'은 56.7%로 나타났다. '미흡했다'는 9.5%(매우 미흡 2.5%, 다소 미흡 7.0%), '잘모름'은 1.3%였다. 김대은 미디어리서치 대표는 "윤석열 대통령이 대국민담화 및 기자회견은 '끝장 회견'을 예고한 것과는 달리 국민이 원하는 '속 시원한' 대답은 나오지 않았다"며 "윤 대통령의 이날 답변은 대체로 두루뭉술하고 포괄적이었다"고 평가했다. 이어 "국민 앞에 고개는 숙였지만 정작 실제 답변에선 김건희 여사를 적극 두둔해 대국민사과 효과를 '반감'시켰다는 지적과 함께 문제 인식과 처방 모두에서 '국민 눈높이'에 크게 미흡 하다보니 이번에 조사한 대통령 국정지지율과 거의 비슷하게 나왔다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.6%, 신뢰수준은 95%, 표본 오차는 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. right@newspim.com 2024-11-14 06:00
사진
尹지지율 26.9%…'기자회견 효과 보수결집' [서울=뉴스핌] 박성준 기자 = 윤석열 대통령의 지지율이 20%대 중후반을 기록했다는 여론조사 결과가 14일 발표됐다. 종합뉴스통신사 뉴스핌 의뢰로 여론조사 전문업체 미디어리서치가 지난 11일~12일 이틀간 전국 만 18세 이상 남녀 1002명에게 물은 결과 윤 대통령의 국정운영에 대한 긍정평가는 26.9%로 집계됐다. 부정평가는 71.5%로 나타났다. '잘 모름'에 답한 비율은 1.6%다. 긍정평가(26.9%)는 지난 조사와 달라지지 않았고 부정평가는 0.4%포인트(p) 하락했다. 긍정평가와 부정평가 간 격차는 44.6%p다. 연령별로 보면 40대에서 긍정평가와 부정평가 격차가 극명하게 드러났다. 만 18세~29세에서 '잘함'은 17.1% '잘 못함' 81.1%였고, 30대에서는 '잘함' 21.3% '잘 못함' 77.2%였다. 40대는 '잘함' 10.8% '잘 못함' 88.3%, 50대는 '잘함' 24.2% '잘 못함' 75.4%로 집계됐다. 60대는 '잘함' 40.7% '잘 못함' 56.9%였고, 70대 이상에서는 '잘함' 50.8% '잘 못함' 46.2%로 집계됐다. 지역별로는 서울 '잘함' 23.6%, '잘 못함'은 73.8%로 집계됐다. 경기·인천 '잘함' 24.3% '잘 못함' 74.8%, 대전·충청·세종 '잘함' 27.3% '잘 못함' 72.1%, 강원·제주 '잘함' 14.8% '잘 못함' 74.8%로 조사됐다. 부산·울산·경남 '잘함' 33.3% '잘 못함' 65.0%, 대구·경북은 '잘함' 42.1% '잘 못함' 55.9%로 집계됐다. 전남·광주·전북은 '잘함' 18.3% '잘 못함' 79.9%로 나타났다. 성별로도 남녀 모두 부정평가가 우세했다. 남성은 '잘함' 26.2% '잘 못함' 72.6%, 여성은 '잘함' 27.6% '잘 못함' 70.4%였다. 김대은 미디어리서치 대표는 "기자회견에서 김건희 여사 관련 의혹에 대해 제대로 된 해명 대신 감싸기에만 급급했고, 명태균 씨 논란에 대한 해명도 제대로 되지 않아 결과적으로 불신만 더 키운 꼴이 됐다"며 "하지만 60-70대 이상과 영남권 등 전통적인 지지층에서는 탄핵 등의 위기감이 높아져 지지율이 오히려 상승했다"고 해석했다. 그러면서 "며칠 전 미국 대선에서 트럼프 전 대통령이 당선되면서 안보와 경제 등 위기감 고조로 보수층이 결집하며 추가적인 지지율 추락을 막을 수 있었다"고 덧붙였다. 차재권 부경대 정치외교학과 교수는 "기자회견에 대해 긍정평가와 부정평가가 동시에 존재한다"며 "형식적으로나마 기자회견을 하고 사과를 했다는 점에서 만족하는 보수 지지층이 있다"고 말했다. 이어 "지지율 자체는 큰 변동이 없지만 (이번 기자회견 때문에) 부정평가한 사람들이 나중에라도 다시 긍정평가할 가능성이 더 낮아졌다"이라며 "앞으로 지지율이 개선될 가능성은 거의 없다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.6%, 표본오차는 95% 신뢰수준에 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. parksj@newspim.com 2024-11-14 06:00
안다쇼핑
Top으로 이동