전체기사 최신뉴스 GAM
KYD 디데이
산업 생활경제

속보

더보기

[김정호의 4차혁명 오딧세이] 인공지능과 엔트로피

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

김정호 교수.

엔트로피의 정의와 인공지능의 요구

'엔트로피'라는 단어는 1865년 독일의 물리학자 루돌프 클라우지우스가 처음으로 사용했다. 엔트로피라는 단어는 에너지라는 뜻의 그리스 어원에서 출발했다. 엔트로피는 일반적으로 무질서도라고 알려져 있기도 하며, 미시적 상태의 무질서한 정도를 표현한다.

그런데 열역학 제2법칙에서는 항상 전체 계(System)의 엔트로피가 증가하는 방향으로 사건이 일어난다고 한다. 이 법칙에 따르면 시스템은 엔트로피가 증가하는 쪽으로, 즉 무질서해지는 쪽으로 변하려 한다고 한다. 그래서 전 우주에서 부분으로 뭉쳐있는 에너지가 전체에 걸쳐 평평하게 흩어져가는 과정이 엔트로피의 증가과정이라고 본다. 즉, 엔트로피의 증가는 평형 상태로의 이동이며 에너지적으로 볼 때는 안정화되는 방향이다.

그런데 반대로 인공지능에서는 엔트로피가 감소하는 방향으로 학습을 최적화하기도 한다. 물리 법칙과 인공지능이 반대인 경우이다.

한편, 전자공학의 한 학문 분야인 ‘정보 공학’ 분야에서도 엔트로피 개념이 사용된다. 특히 인공지능과 관련해 정보 이론을 이용해서 인공지능 네트워크를 최적화하고, 그 이론을 뒷받침하려는 연구가 있다. 이러한 새로운 시도는 정보 이론 수학과 인공지능의 만남이다. 엔트로피로 대표되는 정보공학 이론이 인공지능 발전에 어떠한 기여를 할지 미래가 궁금하다.

정보 이론에서 정보의 양을 지수 I로 표현한다. 어떤 일이 일어날 확률을 P(x)라고 할 때, 그것이 갖는 정보량은 I=-Log2(P(x))로 표현된다. 정보를 확률의 로그 함수로 표현한다. 예를 들어 확률이 50%인 P(x)=1/2=0.5라고 하면 정보량 I=-Log2(1/2)=1이 되어 I=1이 된다. 그 뜻은 그 정보를 1비트의 2진수로 표현할 수 있다는 뜻이 된다.

통신이론 내용인 정보이론에서 정의된 엔트로피 수식. [출처=KAIST]

이러한 정의와 수식에 따라 확률이 낮을수록 정보량이 커진다. 거꾸로 확률이 높으면 정보량이 적어진다. 이 같은 확률에는 학교 성적 분포를 예로 들 수 있다. 학교 성적이 넓게 골고루 퍼져 있으면 정보량(I)이 많다. 점수가 골고루 분포돼야 학생의 능력을 구별하기 쉽고, 성적 주기도 편하다.

반면에 높은 성적과 낮은 그룹이 확 구별되면 성적이 특정 점수대에 몰려 있게 된다. 이때 정보량이 낮다. 학점은 2개 종류밖에 없게 된다.

여기에 더 나아가 정보 이론에서는 엔트로피(Entropy)가 정의된다. 엔트로피는 정보량과 확률 곱의 결과물이다. 정보량과 마찬가지로 넓게 골고루 분포하면 엔트로피가 높고, 특정 지점에 확률이 몰려있으면 엔트로피가 낮다.

예를 들어 주사위의 경우, 모두 6개의 면이 나올 확률이 1/6이다. 그래서 확률이 넓게 퍼져있다. 이 경우 엔트로피가 높다. 반면 윷놀이는 도(4/16), 개(6/16), 걸(4/16), 윷(1/16), 모(1/16)가 나올 확률이 각각 다르다. 분포가 균등하지 않다. 결국 윷놀이의 엔트로피가 낮다. 각각 확률의 차이가 크기 때문이다.

이러한 개념의 엔트로피가 인공지능에도 그대로 사용된다. 인공지능에서는 결과가 잘 구별되도록 엔트로피를 낮게 최적화한다. 인공지능에서는 주사위보다는 윷놀이를 원한다.

인공지능에서 출력 결과 값이 분명할수록 좋다. 그래야 인공지능이 미래를 명확하게 판단할 수 있고 미래를 예측한다. 알파고가 게임을 할 때도 인공지능이 이길 승률이 가장 높은 수를 명확히 알려 주어야 한다. 그래서 인공지능의 출력의 확률 분포는 엔트로피가 낮을수록 좋다고 볼 수 있다. 인공지능은 엔트로피 작은 방향을 선호한다.

인공지능에서 사용되는 엔트로피 비용함수

인공지능인 딥 뉴럴 네트워크(Deep Neural Network, DNN)는 대표적으로 두 종류로 나누어진다. 이미 정답을 알고 있고, 그 정답을 이용해서 인공지능을 교육하는 지도학습 (Supervised Learning)과 정답 없이 인공지능 스스로 학습하는 비지도 학습(Unsupervised Learning)으로 나누어진다.

지도 학습의 경우, 입력 데이터를 넣고, 인공지능 예측 결과를 얻는다. 예를 들어 사진을 입력으로 넣고, 고양이인지 호랑이인지 판독한다. 이때 주어진 정답과 인공지능 출력이 같을 수도 있고, 다를 수도 있다. 이때 정답과 인공지능 출력, 두 개의 차이를 함수로 정의하는 데 이를 수학적으로 비용함수(Cost Function)라고 한다.

이 비용함수를 최소화하기 위해서 인공지능 네트워크 변수들을 정해간다. 이를 학습(Training)이라고 부른다. 비용 함수의 선택에 따라 학습의 속도, 정확성에 차이가 난다.

가장 이해하기 쉽고 많이 쓰이는 비용함수가 제곱 오차 함수(Mean Square Error, MSE)이다. 즉, 정답과 인공지능 결과의 차이를 제곱해서 모두 더하는 것이다. 그래서 두 차이가 클수록 비용함수 값이 커진다. 최종 학습 결과로 비용함수가 ‘0’이 되면 제일 좋다. 그때 이 비용 함수의 미분도 ‘0’이 된다. 이처럼 비용함수가 최소화할 때까지 학습을 계속해 간다.

인공지능 최적화에 사용되는 MSE 비용함수 수식. [출처=KAIST]

그런데 또 다른 매우 용한 비용함수가 정보 이론에서 제시하는 엔트로피 함수이다. 엔트로피 함수를 사용하면 학습이 좀 더 빠르다. 다른 말로 혼란을 최소화하고, 분명한 결과를 내려면 엔트로피 값이 최소화된다.

이처럼 엔트로피 개념과 함수가 인공지능에서 유용하게 사용된다.

인공지능 최적화에 사용되는 크로스 엔트로피(Cross-Entropy) 수식. [출처=KAIST]

우리가 사는 세상의 엔트로피

인간 사회도 정보이론의 엔트로피로 표현할 수 있다. 다이내믹 코리아(Dynamic Korea)로 표현되는 우리 사회는 엔트로피가 높다고 할 수 있다. 에너지가 넘치고, 그 결과, 시간이 지나면 사회가 평형을 이룬다.

이렇게 엔트로피가 증가하는 방향은 사회 전체가 평등하다고 볼 수 있다. 사회의 자본, 정보 그리고 기회가 이렇게 골고루 퍼지면 좋다. 또한 누구나 열심히 일하면 계층이동을 할 수 있다. 이런 사회가 엔트로피가 높다.

반면에 사회의 자본, 정보 그리고 기회를 소수가 독점된 사회는 엔트로피가 낮다. 빈부격차가 큰 사회는 엔트로피가 낮다. 좌우 갈등이 높으면 엔트로피가 낮다.

인공지능은 빠르고 냉철한 지능을 가지려고 엔트로피가 낮은 방향으로 학습한다. 그렇게 보면 인공지능은 효율적이지만 냉정한 지능이다. 따뜻한 가슴이 없다.

 

[김정호 카이스트 전기 및 전자공학과 교수] joungho@kaist.ac.kr

[뉴스핌 베스트 기사]

사진
[현장] 다시 청와대…낙수효과 기대 [서울=뉴스핌] 조준경 기자 = 지난 22일부터 언론 브리핑이 청와대 춘추관에서 진행되면서, 용산 대통령실 시대가 사실상 마무리됐다. 이재명 대통령은 이달 말부터 청와대에서 집무를 시작할 예정이다. 다시 청와대 시대가 오는 것이다.  23일 서울 종로구 청와대 부근의 효자동과 통의동 인근 상인들과 주민들을 방문해 대통령실 청와대 복귀에 대한 의견을 들어봤다. 기대하는 이들이 있는 한편, 별 차이가 없을 것이라며 시큰둥한 반응을 보이는 이들도 있었다. 다만 기자와 취재원들의 만남이 무작위적으로 이뤄졌기 때문에 전체 상인과 주민들의 입장을 대변하지는 않는다. [서울=뉴스핌] 조준경 기자 = 23일 효자로 남단에서 청와대 방향을 바라본 모습. 우측으로 경복궁 영추문이 눈에 들어온다. 2025.12.23 calebcao@newspim.com ◆ "낙수 효과로 장사 잘 될 것 기대 중" 이날 오전 자하문로에서 식당을 운영하는 50대 여성 A씨는 대통령실 청와대 복귀에 대한 의견을 묻는 기자의 질문에 "대통령실이 청와대로 돌아왔다니까 기대하는게 크다"면서 "아무래도 직원들도 돌아오고 하니 매출이 늘어나지 않겠어요?"라고 예측했다. A씨는 장사를 시작한지 3개월 가량 지났다고 밝혔다. 점심 무렵인 오전 11시쯤 효자동에서 5년째 음식 장사 중인 김광재 청기와집 사장(62)은 대통령실 용산 이전(移轉) 전후를 설명했다. 김 사장은 "용산으로 가기 전에는 점심 장사로만 60~70명 정도를 받았고, 청와대 외곽을 경비서는 경찰 인력들이 큰 비중을 차지했다"면서 "그러다가 청와대를 일반인들에게 개방하고 나서는 5~6개월간 관광객이 몰려들며 300명씩 받는 '특수'를 누렸다"고 얘기했다. 그는 "이후에 거의 다 관람하고 나서 청와대 신비감이 떨어졌고 2년 가까이 장사가 엄청 안됐다"면서 "용산으로 가기 전에 비하면 반 토막 정도 떨어진 것 같다. 그래서 다시 대통령실이 돌아온다니까 기대가 크다"고 밝혔다. 김 사장과 대화하는 중간에 청와대 외곽 경비를 담당하는 경찰 직원 7명이 식당 안으로 들어왔다. 김 사장이 기자에게 양해를 구하고 손님들의 자리 안내를 한 후 다시 돌아와 인터뷰를 계속했다. "지금도 사람들이 들어오잖아요. 저분들은 기동대인데, 낙수효과지. 근무하는 인원이 몇 천은 될 테니까. 그 안에서 식사하는 사람도 있겠지만, 밖으로 나와서 먹는 사람도 있을 겁니다. 도시락을 맞출 수도 있으니까 우리에겐 기회지." 집회나 시위에 대한 걱정이 없냐는 질문에 김 사장은 "시위 걱정? 시위대가 온다고 식당을 부수진 않으니까, 왔으면 밥이라도 한 그릇 먹겠지 우리 손해는 아닐 겁니다"라면서도 "다만 주민들은 피해를 볼 수도 있겠네요. 막 욕하고 시끄럽게 떠들고 할 테니까"라고 내다봤다. ◆ "별 체감 안 되는데" 시큰둥한 반응...임대료 증가 걱정도 효자동에서 남쪽에 인접한 경복궁 옆 통의동 골목에서 25년째 한식당을 하고 있는 60대 여성 B씨는 "솔직히 (장사가 잘 되는)체감이 아직은 안가요. 뭐 돌아오면 나아지겠지?"라며 시큰둥한 반응을 보였다. 이어 "우리 집은 경찰이나 직원들이 오는 집은 아니에요. 그 전에도 그렇게 많이 오지 않았고. 주로 경복궁에 놀러 온 사람들이 찾아와요"라며 "(이전에 청와대 사람들이)오더라도 그 사람들은 왜 이렇게 룸을 찾는지, 음식 맛보러 오는 게 아니라 대화하려고 오는거야. 그래서 대통령실 돌아왔다고 해도 그냥 그래"라며 얼버무렸다. 경복궁과 통의동을 가르는 효자로변에서 카페를 운영하는 76세 남성 C씨도 대통령실 복귀가 자신과는 크게 상관이 없다고 설명했다. 오히려 대통령실이 용산으로 갔다가 돌아오는 바람에 상권 변화에 따른 불안정성만 커졌다고 지적했다. "원래 12월은 비수기라 사람이 없어요. 그래서 체감이 안 가는 걸 수도 있는데, 여기서 15년 장사를 했는데, 그 전에도 대통령실 직원들이나 경찰들이 우리 가게에는 오지 않았어요." C씨의 가게는 커피콩을 직접 볶는 '로스팅' 전문점이다. 과거 문재인 정권 시절에는 청와대에서 커피콩을 사러 오는 경우도 있었다고 한다. 그러나 대다수 고객은 경복궁을 찾는 관광객들이다. "대통령실이 용산으로 가기 전에 이 안쪽 골목에는 비싼 한식집들이 많았습니다. 아무래도 고위 관료들을 대상으로 장사를 하는 곳이었겠죠. 그런데 용산으로 가버리니까, 그 집들이 다 카페로 바뀌었어요. 옛날엔 이 근방에 카페가 5~6곳이었는데, 올해만 20곳 넘게 생겼어요." C씨의 설명에 따르면 청와대가 일반인들에게 개방되며 카페들이 우후죽순 생겨났다고 한다. C씨의 추측으로는 올해 들어 주변 상점들의 임대차 계약 만료일이 겹쳤는지, 전체적으로 월세가 큰 폭으로 올랐다고 한다. "이 부근 월세가 보통 30평에 500만원을 내는데, 다른 카페들 보면 더 큰 평수겠지만 1000만~1500만원 내는 곳도 있습니다. 근데 보시면 알겠지만 장사가 안돼요. 내 나이에는 돈 벌려고 하는 게 아니라 월세만 내면 버티지만 다른 곳들은 걱정입니다" 집회와 시위가 늘어나는 것에 대한 질문에는 "시위도 두 종류가 있다"며 "무슨 노조들이 하는 시위는 매출과 관계 하나도 없고 시끄럽지만, 여러 시민단체나 각 개인이 와서 하는 시위는 장사에 도움이 된다"고 말했다. 청와대 옆 무궁화동산에서 만난 산책 중이던 동네 주민 D씨는 "원래 여기가 조용하기도 하고 시끄러운 곳"이라며 "용산으로 갔을 때도 큼지막한 시위는 항상 광화문에서 했기 때문에 별 차이는 못 느꼈다"고 얘기했다. D씨는 "옛날 2008년에 광우병 시위를 크게 할 때는 집에 가는 길도 시위대랑 경찰에 막혀서 불편한 게 많았다"면서 "그런 것만 제외하면 동네 사는 게 나쁘진 않다"고 설명했다. 한편 일각에선 대통령실 청와대 복귀와 관련해 수백억원의 혈세가 낭비됐다는 비판도 나오고 있다. 용산에서 다시 청와대로 옮기는 데 드는 비용이 269억원, 그 자리에 국방부가 다시 들어오는 데 238억원이 필요하다는 지적이다. 2022년 윤석열 정부가 용산으로 대통령실을 옮길 때 든 비용 800억원을 합산하면 총 1300억원의 비용이 낭비된 셈이다. calebcao@newspim.com 2025-12-23 15:14
사진
신한카드, 19만명 정보 유출 [서울=뉴스핌] 이윤애 기자 = 국내 최대 신용카드사인 신한카드에서 가맹점 대표자 약 19만명의 개인정보가 유출된 사실이 확인됐다. 신한카드는 해당 사실을 인지한 뒤 개인정보보호위원회에 신고하고 후속 조치에 착수했다. 신한카드는 23일 가맹점 대표자의 휴대전화번호를 포함한 총 19만2088건의 개인정보가 신규 카드 모집 과정에서 유출된 것으로 파악됐다고 밝혔다. [서울=뉴스핌] 이윤애 기자 = 신한카드 본사 전경[ 사진=신한카드] 2025.06.18 yunyun@newspim.com 유출된 정보는 ▲휴대전화번호 18만1585건 ▲휴대전화번호와 성명 8120건 ▲휴대전화번호·성명·생년·성별 2310건 ▲휴대전화번호·성명·생년월일 73건 등이다. 신한카드는 조사 결과 주민등록번호, 카드번호, 계좌번호 등 민감한 신용정보는 포함되지 않았으며, 가맹점 대표자 정보 외 일반 고객 정보와도 무관하다고 설명했다. 해킹 등 외부 침투로부터 비롯된 것은 아니며 조사 결과 일부 내부 직원의 신규 카드 모집을 위한 일탈로 밝혀진 만큼 유출된 정보가 다른 곳으로 추가 확산될 염려도 없는 것으로 파악된다고 덧붙였다 신한카드 관계자는 "현재까지 해당 정보로 인한 실제 피해 사례는 확인되지 않았다"면서도 "향후 피해가 발생할 경우 적극적으로 보상에 나설 계획"이라고 말했다. 신한카드는 홈페이지를 통해 사고 사실과 사과문을 게시하고, 가맹점 대표자가 본인의 정보 포함 여부를 직접 확인할 수 있는 조회 페이지를 운영 중이다. 아울러 개별 안내도 병행하고 있다. 신한카드 관계자는 "이번 일로 심려를 끼쳐드린 점에 대해 깊이 사과드린다"며 "고객 보호와 유사 사례 재발 방지를 위해 최선의 노력을 다할 것"이라고 말했다. 이어 "해당 사안이 '목적 외 개인정보 이용'인지, '정보 유출'인지 추가 조사를 통해 확인해야할 필요가 있으나, 적극적인 고객 보호를 위해 '정보 유출'에 준하는 조치를 취하고 있다"고 덧붙였다.  yunyun@newspim.com 2025-12-23 14:32
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동