전체기사 최신뉴스 GAM
KYD 디데이

SKT 정예팀, A.X K1 기술 보고서 공개

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 송은정 기자 = SK텔레콤 정예팀은 매개변수 519B(5190억 개) 규모의 초거대 AI 모델 'A.X K1(에이닷엑스 케이원)'의 기술 보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔다.

SK텔레콤 로고. [사진=SK텔레콤]

SK텔레콤 정예팀은 4개월여의 짧은 개발기간과 제한된 GPU 자원에도 불구하고 다양한 기술과 효율성을 극대화한 설계로 국내 첫 500B 이상 초거대 모델 A.X K1을 완성했다.

한정된 시간 안에 519B 규모를 갖췄음에도 주요 벤치마크에서 딥시크-V3.1 등 세계적으로 많이 활용되는 초거대 모델과 유사하거나 더 높은 성능을 달성한 점은 고무적이다.

통상 매개변수가 많아질수록 최적화 시간과 GPU 자원 투입이 늘어날 수밖에 없는데, 타 정예팀 대비 최소 2배 이상의 모델 규모임에도 높은 성능까지 확보해 주목할만하다.

A.X K1은 향후 추가 연구 기간에 따라 더 많은 컴퓨팅 자원과 데이터를 투입해 성능을 더욱 높일 수 있는 모델이다. SKT는 연내 멀티모달 기능을 추가하고 조 단위 파라미터로 확대할 계획이다.

◆제한된 자원에도 개발 효율 극대화…학습 효과와 성능 높여

SKT 정예팀은 1000개의 GPU 자원을 활용해 A.X K1 학습을 진행했다. 학습 기간과 GPU 규모를 바탕으로 가능한 총 학습량을 추산하고, 이를 바탕으로 최대 모델 크기를 스케일링 이론(모델 성능은 투입 자원에 비례한다는 이론)에 근거해 설계했다.

그 결과 세계적으로도 독창적인 매개변수 구조인 519B 규모의 모델을 목표로 정하고 약 10조(10T) 개의 데이터를 투입해 학습했다.

정예팀은 개발 기간 동안 상시 1000개 이상의 GPU를 인공지능 훈련에 활용했다. 투여된 GPU 자원 대비 효과를 극대화하기 위해 최적의 학습 연산량을 수학적으로 설계하고 관리했다.

특히 A.X K1은 이번 개발기간 동안 정부 지원을 받지 않고 자체 GPU 조달만으로 목표를 달성했다는 점에서 더욱 의미가 깊다.

모델 학습에는 웹 데이터, 코드, 이공계 데이터 (STEM, Science, Technology, Engineering, Mathematics), 추론 데이터 등 다양한 고품질 데이터를 활용했다. 한국어 특화 PDF 문서를 파싱 및 합성 데이터를 생성했고, 난이도별 커리큘럼 학습 방식도 적용했다.

◆수학, 코딩 등 다양한 분야에서 우수한 성능 구현

A.X K1은 수학과 코딩 등 초거대 인공지능 모델의 능력을 필요로 하는 분야에서 우수한 성능을 구현했다.

이번 보고서에 기술된 벤치마크 지표는 매개변수 6850억 개(685B)의 '딥시크-V3.1', 매개변수 3570개(357B)의 'GLM-4.6' 오픈소스 모델과 비교해 규모 대비 성능을 비교할 수 있도록 했다.

수학은 AIME25 벤치마크에서 89.8점을 받아 딥시크-V3.1 모델(88.4점) 대비 102% 수준으로 앞선 성능을 확인했다. AIME25는 미국 고등학생 수학 올림피아드 문제로 AI의 수학 실력을 측정하며, 창의적이고 복잡한 난이도의 문제가 출제된다.

코딩 활용도 측면에서 측정한 LiveCodeBench는 영어 기반 75.8점, 한국어 기반 73.1점을 기록하며 실시간 코딩 문제 해결 능력을 입증했다. 영어 기반 69.5점, 한국어 기반 66.2점을 받은 딥시크-V3.1 대비 각각 109%, 110% 수준의 높은 성능을 보였다.

LiveCodeBench는 AI가 실시간으로 나오는 최신 코딩 문제를 얼마나 잘 푸는지 측정하는 시험이다. 인공지능이 미리 볼 수 없는 최신 문제들로 구성돼 실제 코딩 능력을 테스트한다.

◆실용적인 구조 설계로 훈련 안정성 확보

A.X K1은 519B 규모의 파라미터 가운데 33B만 선택적으로 활성화하는 방식으로 효율성을 높였다. 전문가 혼합(MoE, Mixture of Expert) 구조를 채택해 AI 훈련 과정의 안정성과 효율을 동시에 확보한 것이 특징이다.

MoE란 여러 개의 작은 전문가 모델들이 모여서 하나의 큰 문제를 해결하는 방식으로 각 전문가 모델은 특정 유형의 데이터를 잘 처리하도록 특화되어 있고, 입력 데이터에 따라 가장 적합한 전문가가 선택되어 문제를 해결한다.

그 밖에도 A.X K1은 한 번에 128K 토큰의 긴 문맥도 처리할 수 있는 능력을 갖췄다. 이는 한국어 기준 약 10만 단어로서, 인공지능 모델이 소설책 한 권 또는 기업 연간 보고서 한 권도 동시에 검토할 수 있게 해 준다.

yuniya@newspim.com

[뉴스핌 베스트 기사]

사진
靑, 김승룡 소방청장 감찰 착수 [서울=뉴스핌] 김미경 기자 = 이재명 대통령이 22일 김승룡 소방청장에 대한 즉각적인 진상 확인을 지시해 감찰에 착수했다고 청와대가 밝혔다. 강유정 청와대 수석대변인은 이날 저녁 언론 공지를 통해 이같이 밝혔으며 현재로선 개인 비위로 인한 사유로 전해졌다. [남양주=뉴스핌] 김현우 기자 = 김승룡 소방청장 직무대행이 24일 오후 경기도 남양주 수도권119특수구조대에서 열린 현대자동차그룹-소방청 무인소방로봇 기증식에서 인사말을 하고 있다. 2026.02.24 khwphoto@newspim.com 김 청장은 허석곤 전 청장이 12·3 비상계엄 가담 의혹으로 직위 해제된 지난해 9월부터 소방청장 직무대행을 맡아왔다. 올해 3월 새 청장에 정식 임명됐다. 청와대는 어떤 사유로 김 청장에 대한 감찰에 착수했는지에 대해서는 공개하지 않았다.  일각에서는 업무 추진비와 갑질 의혹이 거론되고 있다. 관용차를 이용하는 과정에서 규정에 어긋난 부적절한 행동을 한 것 아니냐는 얘기도 흘러나온다. 청와대는 감찰 사유에 대해 '개인 비위'라고 설명했지만 구체적인 내용에 대해서는 공개하지 않고 있다. the13ook@newspim.com 2026-05-22 22:45
사진
대전 허태정 51.4% 이장우 37.0% [서울=뉴스핌] 박서영 기자 = 6·3 지방선거 대전시장 선거에 출마한 집권 여당인 더불어민주당 허태정 후보가 제1야당인 국민의힘 이장우 후보를 14.4%p(포인트)차로 크게 앞서는 것으로 나타났다.  종합뉴스통신사 뉴스핌이 리얼미터에 의뢰해 지난 19~20일 대전 18살 이상 남녀 802명을 대상으로 실시한 여론조사 후보 지지도 조사에서 22일 이같은 결과가 나왔다.   ◆ 허태정 51.4% vs 이장우 37.0%...오차범위 밖 14.4%p 대전시장 후보자 지지도 조사에서 허 후보는 51.4%로 과반을 넘었다. 이 후보 37.0%, 강희린 개혁신당 후보 2.5% 순이다. '없음' 응답자는 3.8%, '잘 모름'은 5.4%로 유보층은 9.2%다. 지역별로 살펴보면 허 후보가 이 후보를 5개 선거구에서 모두 앞섰다. 동구 허 후보 57.3%·이 후보 33.4%, 중구 허 후보 57.8%·이 후보 34.3%, 서구 허 후보 48.2%·이 후보 37.6%, 유성구 허 후보 44.8%·이 후보 42.0%, 대덕구 허 후보 57.8%·이 후보 32.9%다. 연령별로는 70살 이상을 뺀 모든 연령대에서 허 후보가 우위를 보였다. 특히 허 후보는 40대·50대·60대에서 큰 격차로 이 후보를 앞섰다. 18~29살 허 후보 45.7%·이 후보 31.8%, 30대 허 후보 42.9%·이 후보 40.1%, 40대 허 후보  58.0%·이 후보 28.6%, 50대 허 후보 63.6%·이 후보 32.0%, 60대 허 후보 52.5%·이 후보 43.5%, 70살 이상 허 후보 42.5%·이 후보 48.6%였다. 성별로는 남성 허 후보 48.4%·이 후보 40.7%, 여성 허 후보 54.4%·이 후보 33.3%로 모두 허 후보가 높은 지지율을 보였다. 지지 정당별로는 민주당 지지층 허 후보 89.3%·이 후보 5.5%, 국민의힘 지지층 허 후보 6.5%이 후보  90.9%였다. 조국혁신당 지지층에서는 허 후보 58.9%·이 후보 21.8%, 진보당 지지층 허 후보 50.6%·이 후보 30.0%, 개혁신당 지지층 허 후보 30.2%·이 후보 28.3%, 강 후보 28.4%였다. 적극 투표층은 허 후보 58.2%로 이 후보 36.7%를 크게 앞질렀다. ◆ 지방선거 '투표할 것' 85.9%... 적극 투표층 67.2%로 선거 '고관여 양상' 이번 지방선거 투표 의향과 관련해 대전시민 85.9%가 '투표하겠다'고 했다. '반드시 투표' 67.2%, '가급적 투표' 18.7%였다. 반면 '별로 투표할 생각 없음' 3.7%, '전혀 투표할 생각 없음' 9.6%였다. 권역별 투표 의향은 동구 83.5%, 중구 82.8%, 서구 88.3%, 유성구 84.5%, 대덕구 90.0%였다. 모든 권역에서 고르게 투표 의향층은 80%를 넘었다. 연령별로는 60대가 95.4%로 가장 높았다. 이어 70살 이상은 91.6%, 50대 90.4%, 40대 89.5% 순이었다. 30대 79.3%, 18~29살 69.3%였다. 이번 여론조사는 휴대전화 가상(안심)번호를 무작위로 추출해 자동응답조사(ARS) 방식으로 진행됐다. 표본오차는 95% 신뢰수준에 ±3.5%p, 응답률은 8.2%다. 2026년 4월 말 행정안전부 주민등록 인구를 기준으로 성별, 연령별, 지역별 가중치(림 가중)를 적용했다. 자세한 사항은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. seo00@newspim.com 2026-05-22 05:00
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동