AI 핵심 요약
beta- 아크릴이 10일 대규모 GPU 클러스터 이더넷 네트워크 패브릭 국책과제 주관기관으로 선정됐다고 밝혔다.
- 아크릴은 GPUBASE와 결합한 국산 개방형 GPU 네트워크 패브릭 솔루션을 개발해 인피니밴드 중심 구조의 비용·벤더 종속 문제를 해소하겠다고 했다.
- 연세대·성균관대·아주대와 2028년까지 AI 데이터 처리·보안·이더넷 최적화 원천기술을 개발하고, 자사 IDC RoCEv2 클러스터에서 실증 테스트를 진행할 계획이다.
!AI가 자동 생성한 요약으로 정확하지 않을 수 있어요.
[서울=뉴스핌] 이나영 기자= AX 전문기업 아크릴이 국내 AI 인프라의 핵심 병목으로 지적되는 GPU 클러스터 네트워크 기술 국산화에 나선다.
10일 아크릴은 과학기술정보통신부 산하 정보통신기획평가원(IITP)이 추진하는 '대규모 GPU 클러스터 환경에서의 네트워크 효율성 극대화를 위한 이더넷 기반 GPU 클러스터 네트워크 패브릭 시스템 및 최적화 기술 개발' 국책과제에 주관기관으로 선정됐다고 밝혔다.
이번 과제는 총사업비 약 67억원(정부지원금 55억원) 규모로 오는 2028년 12월까지 진행된다. 아크릴은 주관기관으로 연세대학교, 성균관대학교, 아주대학교 산학협력단과 공동 연구를 수행한다. 3개 대학은 각각 AI 데이터 처리 가속, 고신뢰 보안, 이더넷 기반 클러스터 네트워크 최적화 관련 원천 연구를 담당한다.

아크릴은 이번 과제를 통해 확보한 기술을 상용 GPU 인프라 통합 플랫폼 'JONATHAN GPUBASE'와 결합할 계획이다. 클라우드서비스사업자(CSP), 관리형서비스사업자(MSP), 공공 AI 데이터센터, 의료 AI 인프라 등에 적용 가능한 국산 GPU 네트워크 패브릭 솔루션으로 완성한다는 목표다.
회사에 따르면 현재 대규모 GPU 클러스터 네트워크는 엔비디아의 전용 네트워크 기술인 '인피니밴드'가 주도하고 있다. 클러스터 규모가 커질수록 인피니밴드 관리 소프트웨어인 'UFM(Unified Fabric Manager)' 사용이 요구되며, 이에 따른 구독형 라이선스 비용은 CSP와 공공 AI 데이터센터의 운영비용(OPEX)을 높이는 요인으로 지적돼 왔다. 인피니밴드 중심의 벤더 종속 구조는 전용 스위치와 스마트 NIC(Network Interface Card) 공급 지연, 기존 이더넷 장비 활용 제약, 신규 장비 도입에 따른 자본적지출(CAPEX) 부담 등으로 이어진다.
글로벌 시장에서는 기존 이더넷 자산을 활용하면서 GPU 간 고속 통신을 구현할 수 있는 'RoCEv2(RDMA over Converged Ethernet v2)' 기반 개방형 이더넷 패브릭이 인피니밴드 대안으로 부상하고 있다. 이번 과제는 인피니밴드 중심 AI 네트워크에서 이더넷/RoCE 기반 개방형 인프라로 전환되는 과정에서 발생하는 멀티벤더 운영 복잡성과 벤더 종속 문제를 해결하는 데 의의가 있다.
RoCE는 다양한 벤더의 경쟁과 선택지를 확대하지만, 벤더별 네트워크 운영체제(NOS)와 패브릭 관리 체계가 분리돼 운영자가 개별 도구에 종속될 수 있다는 한계가 있다. 아크릴의 GPUBASE는 멀티벤더 RoCE 패브릭을 GPU 워크로드 관점에서 통합 관찰·관리·최적화하는 공통 제어 계층을 제공한다.
아크릴은 개방형 이더넷 RDMA 영역에서 국내외 연구 성과와 지식재산권을 축적해 왔다. 회사는 대규모 멀티테넌트 환경에서 RDMA 성능 격리 원천 기술인 'PeRF'를 컴퓨팅 시스템분야 대표 국제 학술대회인 'USENIX ATC 2024'에서 발표했으며, RDMA 다중경로 전송 기술인 'UL-MPRDMA'는 글로벌 공학분야 국제 학술지 'IEEE Access'에 게재됐다. RoCEv2 패브릭 및 RDMA 전송 최적화 분야에서 국내외 특허 22건을 보유하고 있다.
아크릴은 이미 인피니밴드와 RoCEv2를 모두 지원하는 상용 GPU 인프라 통합 플랫폼 GPUBASE를 운영 중이다. 이번 과제를 통해 GPUBASE에 개방형 이더넷 GPU 클러스터 패브릭 기술을 결합하고, 3차년도에는 아크릴 자체 IDC(Internet Data Center)에 구축한 RoCEv2 클러스터에서 대규모 실증을 진행할 예정이다.
특히 이번 과제는 엔비디아 'Spectrum-X'가 높은 성능 수준을 제시해 온 구간에서 개방형 네트워크 운영체제인 SONiC(Software for Open Networking in the Cloud) 기반으로 90% 이상의 유효 대역폭 달성을 목표로 한다.
염익준 아크릴 CTO는 "AI 인프라 경쟁의 핵심은 수만 개 GPU를 안정적으로 묶는 네트워크 패브릭 기술"이라며 "이번 과제를 통해 인피니밴드 중심 구조의 비용·공급·자산 활용 한계를 해소할 개방형 이더넷 GPU 네트워크 대안을 제시하고, 국내 AI 인프라 생태계 자립 기반을 마련하겠다"고 말했다.
nylee54@newspim.com












