전체기사 최신뉴스 GAM
KYD 디데이
산업 전기·전자

속보

더보기

[Tech 스토리] '수학 천재'에 코딩도 잘하는 LG '엑사원 딥'

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

수학·과학·코딩까지 섭렵…에이전트 AI의 새 기준 제시
작은 모델로도 AIME·GPQA 1위…'작지만 똑똑한' AI
추론 기반의 문제 해결 능력, 인간 연구 파트너 머지 않아

기업들의 신기술 개발은 지속 가능한 경영의 핵심입니다. 이 순간에도 수많은 기업은 신기술 개발에 여념이 없습니다. 기술의 진화는 결국 인간 삶을 바꿀 혁신적인 제품 탄생을 의미합니다. 기술을 알면 우리 일상의 미래를 예측해볼 수 있습니다. 각종 미디어에 등장하지만 독자들에게 아직은 낯선 기술 용어들. 그래서 뉴스핌에서는 'Tech 스토리'라는 고정 꼭지를 만들었습니다. 산업부 기자들이 매주 일요일마다 기업들의 '힙(hip)한' 기술 이야기를 술술 풀어 독자들에게 전달합니다.

[서울=뉴스핌] 서영욱 기자 = 사람이 시키지 않아도 스스로 생각하고, 가설을 세우고, 문제를 해결하는 똑똑한 인공지능(AI)이 등장하고 있습니다. 이런 AI를 '에이전트 AI(Agentic AI)'라고 부릅니다. 앞으로는 이런 AI가 점점 더 많아질 예정입니다. 하지만 이 AI가 정말 똑똑해지려면 '추론' 능력이 아주 중요합니다.

추론이란 주어진 정보를 바탕으로 새로운 사실을 알아내는 능력입니다. 예를 들어 "하늘이 흐리면 비가 올 수 있다"는 식으로 생각하는 것이죠. 그런데 이 능력을 높이기란 쉽지 않아서 세계에서도 아주 소수의 AI 회사만이 직접 이런 모델을 만들고 있습니다.

LG AI연구원은 최근 '엑사원 딥(EXAONE Deep)'이라는 아주 똑똑한 AI 모델을 공개했습니다. 이 모델은 수학 문제를 잘 풀고, 과학을 이해하고, 컴퓨터 코딩까지 잘하는 AI입니다. 엑사원 딥은 이렇게 '생각하는 힘'을 키우는 데 초점을 맞춰 개발됐습니다.

엑사원 딥과 타 AI의 수학 부문 성능 비교 [사진=LG AI연구원]

엑사원 딥은 수학 문제를 푸는 능력이 아주 뛰어납니다. 우리나라 고등학생이 보는 2025학년도 수능 수학 시험에서 최고 점수를 받았고, 미국의 어려운 수학 시험인 AIME 2024에서도 훌륭한 성적을 거뒀습니다.

특히 엑사원 딥 32B 모델은 AIME 시험에서 무려 90.0점을 받아서, 사람보다도 더 똑똑한 수학 실력을 보여줬습니다. 이 모델은 다른 AI보다 훨씬 작은 크기임에도 불구하고, 아주 복잡한 수학 문제도 척척 풀어냅니다.

작은 모델인 7.8B와 2.4B도 놀라운 성과를 냈습니다. 이 모델들은 스마트폰 같은 작은 기기에서도 돌아갈 수 있는 모델인데, MATH-500, AIME 2025 같은 시험에서 각각 1위를 차지했습니다.

엑사원 딥은 수학뿐 아니라 과학과 컴퓨터 프로그래밍에서도 뛰어난 실력을 보입니다. 박사급 수준의 과학 시험인 GPQA 다이아몬드 테스트에서 66.1점을 받았고, 실시간으로 코딩 실력을 평가하는 라이브코드벤치(LiveCodeBench) 테스트에서는 59.5점을 기록했습니다. 이 정도면 사람과 함께 연구하거나 프로그래밍하는 일도 가능할 만큼 실력이 좋다는 뜻입니다.

엑사원 딥의 2025년 수능 수학 영역 평가 결과 [사진=LG AI연구원]

작은 모델인 7.8B와 2.4B도 GPQA와 라이브코드벤치에서 1위를 차지하며, 작은 몸집에도 뛰어난 능력을 보여줬습니다. 작년에는 엑사원 3.5 모델이 세계 최대 AI 모델 평가 사이트인 '허깅페이스(Hugging Face)'의 엣지 부문 1위를 차지한 데 이어, 엑사원 딥까지 좋은 성과를 냈습니다.

엑사원 딥은 수학, 과학, 코딩뿐 아니라 일반적인 문제도 잘 푸는 AI입니다. MMLU(멀티태스크 언어이해) 테스트에서 83.0점을 받아, 우리나라가 만든 AI 모델 중 최고 성능을 기록했습니다.

이 테스트는 여러 분야의 상식을 묻는 문제로 구성돼 있어서, AI의 전반적인 실력을 평가하는 데 사용됩니다. 엑사원 딥은 이 테스트에서도 뛰어난 추론 능력을 보이며, 다방면으로 똑똑한 AI임을 증명했습니다.

LG AI연구원이 만든 엑사원 딥은 단순히 문제를 푸는 것을 넘어, 스스로 생각하고 판단하는 새로운 시대의 AI입니다. 앞으로도 우리 생활을 더 편리하고 똑똑하게 만드는 데 기여하기를 기대해 봅니다.

엑사원 딥과 타 AI의 코딩 부문 성능 비교 [사진=LG AI연구원]

syu@newspim.com

[뉴스핌 베스트 기사]

사진
전현무, 순직 경찰관 관련 발언 사과 [서울=뉴스핌] 최문선 기자 = 방송인 전현무가 순직한 경찰관을 언급하는 과정에서 부적절한 표현을 사용해 사과했다. 23일 전현무의 소속사 SM C&C는 입장문을 내고 "해당 방송에서 사용된 일부 표현으로 인해 고인과 유가족분들께 상처를 드린 점에 대해 무거운 책임을 느끼고 있다"며 "어떠한 맥락이 있었더라도 고인을 언급하는 자리에서 더욱 신중했어야 했다"고 밝혔다. [서울=뉴스핌] 이형석 기자 = 방송인 전현무. leehs@newspim.com 소속사 측은 "전현무는 출연자의 발언을 정리하는 과정에서 일부 단어를 그대로 언급했고, 표현의 적절성을 충분히 살피지 못했다"며 "그로 인해 고인에 대한 예를 다하지 못한 점을 무겁게 받아들이고 있다"고 해명했다. 이어 "고인과 유가족분들께 진심으로 사과드리며, 시청하며 불편함을 느끼셨을 분들께도 죄송하다는 말씀을 드린다"며 "보다 엄격한 기준과 책임감을 갖도록 내부적으로 점검하고 재발 방지에 만전을 기하겠다"고 덧붙였다. 이번 논란은 디즈니 플러스 예능 프로그램 운명전쟁49 2화 방송에서 불거졌다. 해당 회차에서는 무속인들이 과거 사건을 언급하며 사인을 추리하는 장면이 담겼고, 이 과정에서 전현무가 고(故) 경찰관의 사인을 설명하며 비속어를 사용해 비판을 받았다. 논란이 된 발언은 2004년 흉기에 찔려 순직한 고(故) 이재현 경장을 언급하는 과정에서 나왔다. 고인은 당시 서울 서부경찰서 강력반 형사로 근무하던 중, 마포구의 한 커피숍에서 폭력 사건 피의자를 검거하려다 범인이 휘두른 흉기에 찔려 숨졌다. 방송 이후 시청자들 사이에서는 순직 경찰관과 관련된 사안을 예능적 맥락에서 다루는 데 대한 문제 제기와 함께, 표현의 부적절성을 지적하는 비판이 이어졌다. moonddo00@newspim.com 2026-02-24 08:52
사진
음주운전 부장판사 감봉 3개월 징계 [서울=뉴스핌] 홍석희 기자 = 서울중앙지법 소속 현직 부장판사가 음주운전으로 감봉 처분을 받았다. 23일 법조계에 따르면 대법원은 지난 3일 서울중앙지법 A 부장판사에게 감봉 3개월 징계를 내렸다. A 부장판사는 지난해 12월 13일 오후 3시 1분께 면허 정지 수준인 혈중알코올농도 0.071% 상태로 중랑구 사가정역 근처 한식당에서 약 4㎞가량 승용차를 운전하다 적발된 것으로 알려졌다. 대법원은 "법관으로서의 품위를 손상하고 법원의 위신을 떨어뜨렸다"고 했다. A 부장판사는 현재 서울중앙지법 민사 재판부에 소속돼 있다. 서울중앙지법 소속 현직 부장판사가 음주운전으로 감봉 처분을 받았다. 서울 서초동 서울중앙지법. [사진=뉴스핌DB] hong90@newspim.com 2026-02-23 09:29
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동