이 기사는 2월 20일 오후 2시56분 '해외 주식 투자의 도우미' GAM(Global Asset Management)에 출고된 프리미엄 기사입니다. GAM에서 회원 가입을 하면 9000여 해외 종목의 프리미엄 기사를 보실 수 있습니다.
이 기사는 AI 번역에 기반해 생산된 콘텐츠로 중국 관영 증권시보(證券時報)의 2월 19일자 기사를 인용하였습니다.
[서울=뉴스핌] 배상희 기자 = 지난해 12월 'A주 국산 GPU 1호주'라는 타이틀을 달고 상하이증권거래소 산하의 과학기술주 전용 거래시장인 과창판(科創板∙커촹반)에 성공적으로 상장한 중국 GPU 스타트업 무어스레드(摩爾線程∙Moore Threads 688795.SH)가 자사의 플래그십 AI 학습·추론 일체형 전기능 GPU인 MTT S5000에서 알리바바의 최신 대규모 모델 큐원(Qwen)3.5에 대한 전면적인 적응을 완료했다고 밝혔다.
개발자는 MUSA C 프로그래밍 언어와 Triton-MUSA 툴체인을 통해 효율적으로 모델 배포와 최적화를 수행할 수 있게 됐다.
Qwen3.5 적응 과정에서 무어스레드는 자체 개발한 무사(MUSA, 무어스레드 통합 시스템 아키텍처) 생태계의 두 가지 핵심 역량을 검증했다.
첫째, 네이티브 MUSA C 지원을 통해 개발자가 MUSA C를 직접 활용해 커널을 개발할 수 있어 엔비디아의 쿠다(CUDA) 아키텍처 생태계에서의 이전 장벽을 크게 낮췄다.

둘째, Triton-MUSA와의 깊은 호환성을 바탕으로 개발자가 익숙한 Triton 문법으로 고성능 연산자를 작성한 뒤, Triton-MUSA 백엔드를 통해 무어스레드 전기능 GPU에서 이를 끊김 없이 실행할 수 있게 했다.
Qwen3.5 멀티모달 모델이 채택한 하이브리드 어텐션 메커니즘에 대해서는 무어스레드가 네이티브 수준의 최적화를 구현했다. muDNN 계산 라이브러리와 MATE 오픈소스 연산자 라이브러리를 기반으로, 하이브리드 어텐션에서의 장문 시퀀스 처리를 효율적으로 지원하며, MTT S5000 상에서 해당 모델의 고성능 추론을 실현했다.
Qwen3.5 적응 외에도 2월 12일 즈푸AI(智譜華章 2513.HK)가 차세대 대모델 GLM-5를 발표한 직후, 무어스레드는 SGLang 추론 프레임워크를 기반으로 플래그십 AI 학습·추론 일체형 전기능 GPU MTT S5000에서 공정 적응 및 검증을 완료했다.
2월 14일에는 무어스레드가 동일한 플래그십 GPU 플랫폼 MTT S5000에서 미니맥스(MiniMax 0100.HK)의 차세대 대모델 MiniMax M2.5에 대해 초고속 적응을 구현했다.
무어스레드 측 설명에 따르면, GLM-5에서 MiniMax M2.5를 거쳐 현재의 Qwen3.5에 이르기까지 지속적으로 국산 최상위 AI 모델에 대한 초고속 추적과 적응을 이어가고 있다.
이는 MUSA 아키텍처가 주류 AI 생태계와의 무정지 호환성을 갖추고 있으며, 지속적으로 고도화되는 툴체인 지원을 제공해 온 결과라는 평가다. 향후 무어스레드는 MUSA 기술 생태계에 대한 심층적인 구축을 이어가, 더 많은 최전선 AI 모델이 출시와 동시에 실제 응용에 안착할 수 있도록 돕고, 국산 연산력 생태계의 번영을 가속한다는 방침이다.
pxx17@newspim.com













