[김정호의 4차혁명 오딧세이] 인공지능과 엔트로피

기사입력 : 2019년09월16일 08:00

최종수정 : 2019년09월26일 18:26

김정호 교수.

엔트로피의 정의와 인공지능의 요구

'엔트로피'라는 단어는 1865년 독일의 물리학자 루돌프 클라우지우스가 처음으로 사용했다. 엔트로피라는 단어는 에너지라는 뜻의 그리스 어원에서 출발했다. 엔트로피는 일반적으로 무질서도라고 알려져 있기도 하며, 미시적 상태의 무질서한 정도를 표현한다.

그런데 열역학 제2법칙에서는 항상 전체 계(System)의 엔트로피가 증가하는 방향으로 사건이 일어난다고 한다. 이 법칙에 따르면 시스템은 엔트로피가 증가하는 쪽으로, 즉 무질서해지는 쪽으로 변하려 한다고 한다. 그래서 전 우주에서 부분으로 뭉쳐있는 에너지가 전체에 걸쳐 평평하게 흩어져가는 과정이 엔트로피의 증가과정이라고 본다. 즉, 엔트로피의 증가는 평형 상태로의 이동이며 에너지적으로 볼 때는 안정화되는 방향이다.

그런데 반대로 인공지능에서는 엔트로피가 감소하는 방향으로 학습을 최적화하기도 한다. 물리 법칙과 인공지능이 반대인 경우이다.

한편, 전자공학의 한 학문 분야인 ‘정보 공학’ 분야에서도 엔트로피 개념이 사용된다. 특히 인공지능과 관련해 정보 이론을 이용해서 인공지능 네트워크를 최적화하고, 그 이론을 뒷받침하려는 연구가 있다. 이러한 새로운 시도는 정보 이론 수학과 인공지능의 만남이다. 엔트로피로 대표되는 정보공학 이론이 인공지능 발전에 어떠한 기여를 할지 미래가 궁금하다.

정보 이론에서 정보의 양을 지수 I로 표현한다. 어떤 일이 일어날 확률을 P(x)라고 할 때, 그것이 갖는 정보량은 I=-Log2(P(x))로 표현된다. 정보를 확률의 로그 함수로 표현한다. 예를 들어 확률이 50%인 P(x)=1/2=0.5라고 하면 정보량 I=-Log2(1/2)=1이 되어 I=1이 된다. 그 뜻은 그 정보를 1비트의 2진수로 표현할 수 있다는 뜻이 된다.

통신이론 내용인 정보이론에서 정의된 엔트로피 수식. [출처=KAIST]

이러한 정의와 수식에 따라 확률이 낮을수록 정보량이 커진다. 거꾸로 확률이 높으면 정보량이 적어진다. 이 같은 확률에는 학교 성적 분포를 예로 들 수 있다. 학교 성적이 넓게 골고루 퍼져 있으면 정보량(I)이 많다. 점수가 골고루 분포돼야 학생의 능력을 구별하기 쉽고, 성적 주기도 편하다.

반면에 높은 성적과 낮은 그룹이 확 구별되면 성적이 특정 점수대에 몰려 있게 된다. 이때 정보량이 낮다. 학점은 2개 종류밖에 없게 된다.

여기에 더 나아가 정보 이론에서는 엔트로피(Entropy)가 정의된다. 엔트로피는 정보량과 확률 곱의 결과물이다. 정보량과 마찬가지로 넓게 골고루 분포하면 엔트로피가 높고, 특정 지점에 확률이 몰려있으면 엔트로피가 낮다.

예를 들어 주사위의 경우, 모두 6개의 면이 나올 확률이 1/6이다. 그래서 확률이 넓게 퍼져있다. 이 경우 엔트로피가 높다. 반면 윷놀이는 도(4/16), 개(6/16), 걸(4/16), 윷(1/16), 모(1/16)가 나올 확률이 각각 다르다. 분포가 균등하지 않다. 결국 윷놀이의 엔트로피가 낮다. 각각 확률의 차이가 크기 때문이다.

이러한 개념의 엔트로피가 인공지능에도 그대로 사용된다. 인공지능에서는 결과가 잘 구별되도록 엔트로피를 낮게 최적화한다. 인공지능에서는 주사위보다는 윷놀이를 원한다.

인공지능에서 출력 결과 값이 분명할수록 좋다. 그래야 인공지능이 미래를 명확하게 판단할 수 있고 미래를 예측한다. 알파고가 게임을 할 때도 인공지능이 이길 승률이 가장 높은 수를 명확히 알려 주어야 한다. 그래서 인공지능의 출력의 확률 분포는 엔트로피가 낮을수록 좋다고 볼 수 있다. 인공지능은 엔트로피 작은 방향을 선호한다.

인공지능에서 사용되는 엔트로피 비용함수

인공지능인 딥 뉴럴 네트워크(Deep Neural Network, DNN)는 대표적으로 두 종류로 나누어진다. 이미 정답을 알고 있고, 그 정답을 이용해서 인공지능을 교육하는 지도학습 (Supervised Learning)과 정답 없이 인공지능 스스로 학습하는 비지도 학습(Unsupervised Learning)으로 나누어진다.

지도 학습의 경우, 입력 데이터를 넣고, 인공지능 예측 결과를 얻는다. 예를 들어 사진을 입력으로 넣고, 고양이인지 호랑이인지 판독한다. 이때 주어진 정답과 인공지능 출력이 같을 수도 있고, 다를 수도 있다. 이때 정답과 인공지능 출력, 두 개의 차이를 함수로 정의하는 데 이를 수학적으로 비용함수(Cost Function)라고 한다.

이 비용함수를 최소화하기 위해서 인공지능 네트워크 변수들을 정해간다. 이를 학습(Training)이라고 부른다. 비용 함수의 선택에 따라 학습의 속도, 정확성에 차이가 난다.

가장 이해하기 쉽고 많이 쓰이는 비용함수가 제곱 오차 함수(Mean Square Error, MSE)이다. 즉, 정답과 인공지능 결과의 차이를 제곱해서 모두 더하는 것이다. 그래서 두 차이가 클수록 비용함수 값이 커진다. 최종 학습 결과로 비용함수가 ‘0’이 되면 제일 좋다. 그때 이 비용 함수의 미분도 ‘0’이 된다. 이처럼 비용함수가 최소화할 때까지 학습을 계속해 간다.

인공지능 최적화에 사용되는 MSE 비용함수 수식. [출처=KAIST]

그런데 또 다른 매우 용한 비용함수가 정보 이론에서 제시하는 엔트로피 함수이다. 엔트로피 함수를 사용하면 학습이 좀 더 빠르다. 다른 말로 혼란을 최소화하고, 분명한 결과를 내려면 엔트로피 값이 최소화된다.

이처럼 엔트로피 개념과 함수가 인공지능에서 유용하게 사용된다.

인공지능 최적화에 사용되는 크로스 엔트로피(Cross-Entropy) 수식. [출처=KAIST]

우리가 사는 세상의 엔트로피

인간 사회도 정보이론의 엔트로피로 표현할 수 있다. 다이내믹 코리아(Dynamic Korea)로 표현되는 우리 사회는 엔트로피가 높다고 할 수 있다. 에너지가 넘치고, 그 결과, 시간이 지나면 사회가 평형을 이룬다.

이렇게 엔트로피가 증가하는 방향은 사회 전체가 평등하다고 볼 수 있다. 사회의 자본, 정보 그리고 기회가 이렇게 골고루 퍼지면 좋다. 또한 누구나 열심히 일하면 계층이동을 할 수 있다. 이런 사회가 엔트로피가 높다.

반면에 사회의 자본, 정보 그리고 기회를 소수가 독점된 사회는 엔트로피가 낮다. 빈부격차가 큰 사회는 엔트로피가 낮다. 좌우 갈등이 높으면 엔트로피가 낮다.

인공지능은 빠르고 냉철한 지능을 가지려고 엔트로피가 낮은 방향으로 학습한다. 그렇게 보면 인공지능은 효율적이지만 냉정한 지능이다. 따뜻한 가슴이 없다.

[김정호 카이스트 전기 및 전자공학과 교수] joungho@kaist.ac.kr

사진

뉴스핌, AI 기반 맞춤형 MY뉴스 출시 [세종=뉴스핌] 이경태 기자 = 매일 쏟아지는 수만 개의 뉴스 중에서 정작 나에게 필요한 뉴스를 찾기는 쉽지 않다. 이런 고민을 해결하기 위해 종합뉴스통신사 뉴스핌이 국내 최초로 AI(인공지능)로 독자에게 뉴스를 추천해주는 'AI MY뉴스'를 11일 본격 출시했다. AI MY뉴스의 핵심은 지능형 구조에 있다. 그동안 미디어는 독자가 선택한 관심 분야에 의존해 단순히 뉴스를 선별해 제공했다. 그러나 AI MY뉴스는 독자를 이해하고 학습해가며 개인에게 꼭 필요한 뉴스를 골라 제공한다. ◆ AI 추천뉴스·글로벌투자·AI 어시스턴트 출시 'AI 추천뉴스'는 독자가 첫 번째 기사를 클릭하는 순간부터 작동한다. 관심 카테고리를 선택하고 기사를 읽을 때마다 AI 시스템이 독자의 취향을 기억하고 분석한다. 경제 뉴스를 자주 읽는 독자라면 점차 반도체, 주식, 부동산 등 세부 관심사까지 파악해 더욱 정확한 뉴스를 추천한다. '모닝 브리핑'과 '런치 브리핑'은 바쁜 현대인을 위한 맞춤 서비스다. 모닝 브리핑은 AI가 밤새 분석한 전날과 당일 새벽까지의 주요 뉴스를 5~7개 헤드라인으로 정리해 제공한다. 런치 브리핑은 오전 7시부터 정오까지의 뉴스를 공공·정치, 산업시장, 글로벌, 전국 이슈 등 4개 분야로 나눠 각각 5개씩 핵심 내용을 전달한다. '글로벌 투자' 서비스는 AI MY뉴스의 핵심 콘텐츠다. 뉴스핌 마켓 전문기자들의 고품질 투자분석 'GAM(Global Asset Management)'을 독자에게 제공한다. '글로벌 브리핑'은 미국 증권시장 상황을 한눈에 파악할 수 있도록 날마다 시장 개요부터 투자자 관점까지 4개 섹션으로 체계화된 분석을 제공한다. 애플, 마이크로소프트, 엔비디아 등 주요 기술주를 별도 추적해 대형 기술주의 시장 영향력을 정밀 분석한다. '파워 특징주 포트폴리오'는 일일 수익률, 변동성, 이동평균 편차 등 핵심 지표를 종합해 수익률 상위 종목을 분석하고, '이 시각 증시 시그널'은 글로벌 이슈를 실시간으로 찾아 미국 증시에 영향을 줄 수 있는 신호로 정리해 제공한다. '주간 연준 인사이트'는 연방준비위원회 공식 브리핑을 투자자 관점에서 재해석하며, '뉴욕증시 전문가 팁'은 매일 뉴욕 현지 증시 전문가들의 생생한 조언을 5개의 구체적인 팁으로 가공해 전달한다. 이 가운데 '뉴스 종목 추적기'는 전 세계 글로벌 뉴스에서 미국 시장에 영향을 줄 수 있는 요인을 실시간으로 포착한다. S&P500 전체 기업을 대상으로 긍정적·부정적 영향을 받을 종목을 각각 5개씩 찾아 구체적인 이유도 내놓는다. 뉴스핌이 새롭게 내놓는 AI MY뉴스 서비스 모습 [자료=뉴스핌DB] 2025.08.08 biggerthanseoul@newspim.com 뉴스핌은 글로벌 AI 검색 기업 퍼플렉시티와 협력해 생활 밀착형 AI 어시스턴트도 제공한다. '뉴스 전략 24시'는 그동안 축적된 뉴스 데이터를 바탕으로 독자의 질문 의도를 파악해 맞춤형 답변과 생활 전략을 제시한다. 미국 증시 투자 전략도 함께 제공해준다. '정책 배달 119'는 정부 정책브리핑의 모든 데이터를 기반으로 개인 상황에 맞는 정책을 찾아 신청 방법까지 안내하는 개인 맞춤형 정책 컨설턴트 역할을 한다. 단순 검색에서 그치지 않고 독자의 행동을 이끌 수 있는 현실적인 답변을 제시한다. 뉴스핌의 모든 기사는 50개 국어로 번역돼 국내 거주 외국인과 해외 독자들도 모국어로 한국 뉴스를 접할 수 있다. ◆ "독자와 함께 성장하는 새로운 미디어 경험의 시작" 민병복 뉴스핌 회장은 "AI MY뉴스는 정보 홍수 시대에 진정으로 필요한 뉴스를 선별해 전달하는 새로운 미디어 패러다임을 제시한다"며 "경제적 어려움 속에서도 국민 모두의 삶에 힘이 되는 뉴스를 제공하겠다"고 강조했다. 민 회장은 "AI MY뉴스는 독자와 함께 성장하며 개인의 삶에 진정한 가치를 더하는 새로운 미디어 경험의 시작"이라며 "AI를 활용해 새로운 결과를 도출하는 것은 쉬운 일이 아니기 때문에 직접 AI로 콘텐츠를 만들어 국민 모두가 제한 없이 무료 서비스를 바로 활용할 수 있게 했다"고 말했다. 이번 AI MY뉴스 서비스는 첫 버전(V 1.0)이다. 우선 모바일 웹페이지에서 서비스가 제공된다. 뉴스핌은 국민을 대상으로 맞춤형 콘텐츠 수요를 직접 파악해 국민이 원하는 서비스를 지속 개발해나갈 예정이다. 분야별 독자들의 성향을 파악해 다양한 콘텐츠 설계 아이디어를 받아 매월 지속적인 콘텐츠 업데이트에 나설 예정이다. 이어 이미 서비스에 나선 AI 아나운서 글로벌 투자 콘텐츠는 물론, 다양한 영상 콘텐츠도 선보일 계획이다. 이를 토대로 뉴스핌은 국내를 뛰어넘어 세계 시장에서 AI를 잘 활용하는 글로벌 뉴스통신사로 도약하는 데 속도를 낼 예정이다. biggerthanseoul@newspim.com 2025-08-11 12:54

사진

비만치료제 '마운자로' 21일부터 처방 가능 [서울=뉴스핌] 김신영 기자 = 한국릴리가 비만치료제 '마운자로'(성분명 터제파타이드)를 14일 국내 출시했다고 밝혔다. 릴리와 공급 계약을 체결한 도매 업체는 오는 20일부터 마운자로의 유통을 시작할 예정이다. 빠르면 21일부터 각 의료기관에서 처방이 본격화될 전망이다. [로고=마운자로] 다만 상급 종합병원의 경우 각 기관의 약사위원회(DC)를 통과해야 하기 때문에 시간이 더 소요될 수 있다. 한국릴리 측은 "마운자로를 필요로 하는 국내 2형 당뇨병 및 비만 환자 분들께 치료제를 가장 빠르고 지속 가능한 방식으로 공급할 수 있도록 최선을 다하겠다"고 밝혔다. sykim@newspim.com 2025-08-14 14:38

속보

[김정호의 4차혁명 오딧세이] 인공지능과 엔트로피

[관련기사]

GAM - 해외주식 투자 도우미

[뉴스핌 베스트 기사]

[주요포토]

뉴스핌TV

스팟Live