[편집자] 4차 산업혁명은 모든 사물과 인간을 연결하여 빅데이터를 모으고, 이를 이용하여 인공지능으로 학습하여, 결국 인공지능이 인간을 대체하는 시대를 말한다. 이러한 4차 산업혁명의 물결이 산업뿐만 아니라 경제, 사회, 정치 등 전 분야에 걸쳐서 막대한 변화를 일으키고 있다.
글로벌뉴스통신사 뉴스핌은 '김정호의 4차혁명 오딧세이' 칼럼을 매주 연재하여 4차 산업혁명의 본질과 영향, 그리고 전망을 독자들에게 쉽게 소개하고자 한다. 4차 산업혁명의 핵심은 바로 인공지능, 빅데이터, 클라우드 컴퓨팅으로 표현할 수 있으며 그 핵심 부품이 반도체이다. 이들 핵심 기술의 개념과 원리, 응용을 설명하여 일반 독자들이 4차 산업혁명에 대해서 공감하고 이해하며 더 나아가 개인과 기업, 국가의 미래를 계획하는 것을 돕고자 한다.
김정호 카이스트(KAIST) 전기 및 전자공학과 교수는 서울대 전기공학과를 졸업하고 미국 미시건대에서 박사 학위를 받았다. AI대학원 겸임교수, IEEE펠로우, 카이스트 ICT석좌교수, 한화 국방 인공지능 융합연구 센터장, 삼성전자 산학협력 센터장 등을 겸하고 있다.
인공지능 반도체에서 열이 나는 이유
인공지능을 학습하거나 판단을 위한 계산을 하려면 반도체 프로세서가 필요하다. 보통 병렬 처리에 유리한 GPU(그래픽 프로세서 장치)가 사용된다. 그리고 학습에 필요한 데이터와 학습 결과, 프로그램을 저장하기 위해서 반도체 메모리를 사용한다. 이러한 프로세서와 메모리는 실리콘 CMOS(Complementary Metal-Oxide Silicon)라고 불리는 트랜지스터 구조를 사용한다.
김정호 교수 |
이 CMOS 실리콘 트랜지스터를 이용하면 '1'과 '0'으로 표시하는 디지털 신호의 저장과 처리, 전송에 유리하다. 특히 CMOS 반도체 공정의 발전으로 가격도 저렴하고 수율도 높다. 그래서 인공지능 컴퓨터에는 실리콘 CMOS 트랜지스터를 이용한 프로세서와 메모리가 가장 중요한 부품이 된다.
이렇게 인공지능용 반도체가 계산할 때 전류를 흘리거나 끊는다. 왜냐하면 반도체 내부에서 '0'에서 '1'로 논리 상태가 변화하려면 캐패시터(Capacitor)에 전류를 흘려줘야 하기 때문이다.
이때 스위치 기능을 하는 구조가 트랜지스터인데, 여기에는 내부 저항(Resistor) 성분이 존재한다. 이상적인 스위치는 저항이 0이지만 실제는 그렇지 않다. 실리콘은 다이아몬드 결정 구조로 이루어져 있고, 결정에 위치한 원자가 온도가 높으면 진동하기 때문이다.
상온에서는 절대 온도(K)가 0이 아니어서 원자의 진동이 있고, 이때 전류가 흐를 때, 전자와 부딪힌다. 이렇게 전류가 저항을 따라 흐르면 '열'이 난다. 백열전구에 전류가 흐르면 열이 나고 빛이 나오는 원리와 같다. 그래서 인공지능 계산용 컴퓨터와 반도체에는 엄청난 양의 열이 난다. 그게 심각한 문제가 되고 있다.
여기에 더해서 논리 태가 '1'에서 '0'으로 변화할 때, 반도체 내 캐패시터 성분에 담겨있던 전자 에너지가 열로 바뀐다. 그 정도는 E=(1/2)CVVf 에 비례한다. 여기서 인공지능 계산량이 많아지면 C가 커지고 주파수 성분 f도 커진다. 인공지능이 빅데이터를 처리하고 인공지능이 판단을 많이 할수록 늘어날 수밖에 없다.
그래서 인공지능과 열은 떼려야 뗄 수 없는 관계가 됐다. 그래서 인공지능 컴퓨터는 열을 받는다. 그것도 엄청난 온도가 올라간다. 아마 냉각 시스템이 없다면, 인공지능 컴퓨터와 반도체가 다 녹아 버릴 것이다.
계산 작업 동안 발생한 열에 의해서 올라간 반도체 내부의 온도 분포에 대한 컴퓨터 시뮬레이션 결과. [출처=KAIST] |
반도체에서 열이 나면 생기는 문제와 냉각 기술
이렇게 인공지능 반도체에서 열이 나서 온도가 수백 도 정도로 올라가면 여러 가지 심각한 문제가 생긴다. 가장 중요한 문제는 컴퓨터의 계산 능력이 현격히 떨어진다는 것이다. 그 결과, 컴퓨터는 점점 느리게 계산을 하게 된다.
실리콘 결정의 온도가 올라가면, 원자의 진동이 증가해서 트랜지스터 저항은 더욱 증가한다. 트랜지스터 저항이 증가하면 디지털 논리 변환 즉 '0'에서 '1'로의 변화나 '1'에서 '0'으로의 전이가 늦어진다. 그 결과는 계산 속도의 하락을 가져온다. 그러면 인공지능 계산도 늦어지고, 실시간 인공지능 서비스도 불가능해진다. 인공지능과 실시간 대화도 불가능해진다.
반도체 메모리도 온도가 올라가는 것도 위험하다. 디램(DRAM)의 경우, 전자를 작은 캐패시터에 가두어 두면서 논리를 기억한다. 그런데 이 전자의 온도가 높아지면 열을 받아서 캐패시터에 가만있지 않고 튀어 나간다. 그러면 데이터의 손실이 일어난다. 인공지능의 학습 결과가 사라질 수도 있다. 인공지능이 멍청해진다.
낸드플래시 메모리도 마찬가지이다. 온도가 높아지면 전자를 가둬 놓기 어렵다. 어떤 경우 전자가 에너지 장벽을 뚫고 지나갈 수 있다. 이러한 메모리가 인공지능 자율주행자동차의 엔진 근처에 있다면 더욱 문제가 된다.
자율주행자동차가 사막에서 달린다면 엔진 룸 근처의 온도가 더욱 올라간다. 그 부분의 인공지능 컴퓨터는 에러를 발생시키고, 자동차가 사고를 유발할 수도 있다. 이처럼 열이 나면 인공지능이 위험해진다.
이러한 문제를 방지하려면 인공지능 컴퓨터나 반도체를 냉각해야 해야 한다. 보통 냉각 방법에는 공랭식, 수랭식이 있다. 현재의 GPU는 공기로 냉각한다. 그래서 공기의 흐름을 크게 만들기 위해 냉각 팬을 돌린다. 그래서 소음이 난다.
인공지능 컴퓨터에 사용되는 HBM 반도체를 위한 물 또는 액체 질소를 사용하는 냉각 구조 개념도. [출처=KAIST] |
미래의 인공지능 컴퓨터는 물로 냉각해야 하는 상황이 됐다. 공기를 이용한 냉각이 충분하지 않기 때문이다. 앞으로 인공지능 컴퓨터에는 전기만 연결하는 것이 아니라 물 배관도 연결해야 한다. 전기 누전만 고려해야 하는 것이 아니라 냉각수 누설도 설계 시 고려해야 하고 관리해야 한다.
여기에 한발 더 나아가 마이크로소프트(MS)는 서버를 바닷물 속에 넣은 실험을 하고 있다. 그리고 데이터 센터는 강가에 주로 설치한다. 냉각수가 필요해서다.
앞으로 데이터 센터는 바닷가에 지어야 할 수도 있다. 더 나아가 미래에는 물을 사용하는 냉각이 충분하지 않아, 액체 질소를 사용해야 할지도 모른다. 액체 질소는 영하 200도(절대 온도 77.35K) 액체이다. 인공지능 반도체 내부에 구멍을 뚫어 물을 흘리거나 액체 질소를 흘려 냉각할 수도 있다. 이 모두 인공지능 반도체가 열을 받기 때문이다.
영하 200도 액체 질소 통 사진. [출처=KAIST] |
인공지능 기술은 복합 기술(Multi-physics)
인간도 사회생활을 하다 보면 열을 받는다. 상대방의 행동이나 말이 약속한 것이나 기대와 다르면 화가 나고 열을 받는다. 인격적으로 무시당해도 열을 받는다. 그러면 서로 관계가 악화하기도 한다. 열을 받아 거꾸로 판단을 그르쳐 손해를 입기도 한다.
이런 때 잠시 머리나 생각의 온도를 낮추고 다시 생각한다. 여름에 선풍기, 에어컨 또는 얼음 수건이 열을 식히는 데 도움이 된다.
요즘 여름에는 에어컨 없이 지내기 어렵게 되었다. 인공지능도 마찬가지이다. 인공지능 컴퓨터와 반도체도 바람 혹은 냉각수로 온도를 낮추어야 한다. 그래야 인공지능이 열 받지 않고 정상적으로 동작한다.
김정호 카이스트 전기 및 전자공학과 교수 joungho@kaist.ac.kr