AI 핵심 요약
beta- 노타가 29일 퀄컴 최신 엣지 AI 디바이스에서 VLA 최적화 성과를 입증했다고 밝혔다.
- 로봇 동작 생성 단계만 선택적으로 최적화해 처리 시간을 218ms에서 31ms로 줄이며 전체 추론 속도를 높였다.
- 노타는 이번 성과를 임베디드 비전 서밋 2026에서 공개하고 피지컬 AI 핵심 기반 기술로 확장해 나갈 계획이다.
!AI가 자동 생성한 요약으로 정확하지 않을 수 있어요.
[서울=뉴스핌] 이나영 기자= AI 모델 경량화 기업 노타가 퀄컴 최신 엣지 AI 디바이스에서 비전-언어-행동 모델(VLA)을 효율적으로 구동하는 최적화 성과를 입증했다고 29일 밝혔다.
회사에 따르면 노타는 퀄컴의 Dragonwing IQ-9075 환경에서 VLA 모델인 SmolVLA 0.45B가 작동하도록 구현했다. SmolVLA 0.45B는 노타가 자체적으로 구동 환경을 마련했다.
최적화의 핵심은 모델 전체를 줄이지 않고 속도 개선 효과가 크면서 정확도 손실을 최소화하는 부분을 선별한 것이다. 노타는 카메라로 본 장면을 이해하고 사람의 명령을 해석하는 앞단 단계는 유지하고, 로봇 동작을 생성하는 마지막 단계 중심으로 최적화를 적용했다. 로봇 동작 생성 단계의 반복 연산을 줄이는 실시간 추론 최적화와 퀄컴 엣지 AI 디바이스의 실행 환경에 맞춰 연산 흐름을 효율화하는 NPU 기반 그래프 최적화를 적용했다.

그 결과 로봇 동작 생성 단계인 Action Head의 처리 시간은 218ms에서 31ms로 줄어 약 85.8% 감소했으며, 최대 7배 수준의 속도 개선을 달성했다. 전체 추론 시간도 505ms에서 310ms로 단축됐다. 작업 성공률은 기존 86%에서 85%로 유사한 수준을 유지해 속도는 크게 높이면서도 로봇 동작의 안정성은 기존과 비슷한 수준으로 유지했다.
노타는 이번 성과를 미국 산타클라라에서 열린 임베디드 비전 서밋 2026에서 공개했다. 현장에서는 관람객이 직접 물품을 선택하면 최적화된 VLA 모델이 이를 인식하고 로봇팔 동작을 생성해 선택한 물품을 집어 바구니에 넣는 과정을 실시간으로 체험할 수 있도록 구성했다.
노타 채명수 대표는 "피지컬 AI가 산업 현장으로 확산되기 위해서는 AI가 실제 환경을 보고, 이해하고, 행동으로 연결하는 과정을 엣지 AI 디바이스에서 빠르고 안정적으로 처리할 수 있어야 한다"며 "이번 VLA 최적화 성과는 노타의 AI 최적화 기술이 피지컬 AI 시대의 핵심 기반 기술로 확장될 수 있음을 보여준 사례"라고 말했다.
한편 노타는 다양한 엣지 AI 및 임베디드 디바이스 환경에서 고성능 AI 모델을 효율적으로 구동할 수 있는 최적화 기술을 고도화해 나갈 계획이다.
nylee54@newspim.com












