[서울=뉴스핌] 송은정 기자 =초거대 인공지능(AI) 시대가 열리면서 시스템의 부하를 줄이고 연산 속도를 높이는 이른바 'AI경량화' 기술이 각광받고 있다. AI경량화 기술을 활용하면 AI 모델 추론 과정에서 필요한 메모리 사용량과 연산량을 크게 줄일 수 있어 빠른 계산이 가능하다. 특히 AI 기반 서비스 효율성을 높이는 데 매우 효과적이다.
[사진=스퀴즈비츠] |
12일 업계에 따르면, 스퀴즈비츠는 'AI경량화' 기술을 선보이며 카카오, 삼성, 포스코,네이버로부터 일찌감치 러브콜을 받았다.
스퀴즈비츠는 2022년 3월 설립됐으며 AI 기반 서비스 효율적 운영 돕는 경량화 기술을 개발하고 있다. 회사는 포스텍홀딩스와 네이버D2SF로부터 초기(시드) 투자를 받은데 이어 올 1월 카카오벤처스와 삼성넥스트, 포스코기술투자, 포스텍홀딩스에서 25억원 규모의 프리 시리즈A 투자를 유치했다.
스퀴즈비츠의 'AI 경량화 기술'은 AI 모델 성능을 유지하면서 32비트 데이터를 4비트 이하로 양자화한다. 더 빠르고 가벼운 AI 모델을 만드는 핵심 기술이다. 회사는 양자화된 모델을 기존 하드웨어에서도 효율적으로 연산할 수 있는 소프트웨어 엔진도 보유했다.
AI 경량화 기술은 모바일 스마트폰, 노트북을 비롯한 엣지 디바이스, 그래픽처리장치(GPU) 클라우드 등 다양한 환경에 적용할 수 있다. 이미지, 비디오, 음성, 자연어 등 다양한 모델을 지원해 응용 분야도 넓다. 이미 네이버, SK텔레콤 등 20여 곳 기업과 기술 검증(PoC) 및 프로젝트를 완료하고 초거대 AI 모델 등 다양한 분야 AI 서비스에 경량화 기술을 선보이고 있다. 최근 회사는 초거대 언어 모델(LLM)을 엣지 기기에서 실시간으로 구동하는 온디바이스 AI데모를 공개해 업계 관심을 받았다. 이미지 생성 AI 스테이블 디퓨전(Stable Diffusion) 모델을 스마트폰에서 실시간으로 구동하는 기술을 공개하기도 했다.
스퀴즈비츠는 그동안 프로젝트 단위로 경량화 서비스를 제공해왔다. 회사는 올해 1월 'OwLite'라는 이름의 경량화 서비스형 소프트웨어(SaaS) 툴킷을 개발해 출시했다. 이 툴킷으로 AI 서비스를 개발하는 기업들이 머신러닝운영(MLOps) 과정에서 스퀴즈비츠의 경량화 기술을 쉽게 적용해 보다 효율적으로 모델을 개발할 수 있도록 지원할 계획이다.
현재 주로 엔비디아 GPU를 기반으로 기술을 제공하고 있지만 국내 AI 반도체 스타트업의 AI 가속기나 인텔의 가우디 등 다양한 하드웨어 옵션을 지원해 고객들이 비용 효율적인 하드웨어를 선택할 수 있도록 확장할 계획이다. 이를 통해 고객들은 자신의 요구사항에 가장 적합한 하드웨어 옵션을 쉽게 검토하고 선택할 수 있게 된다.
스퀴즈비츠는 AI 경량화 기술이 널리 확산돼 더 많은 기업이 지속 가능한 AI 서비스를 운영할 수 있도록 돕는다는 계획이다. 또한 서비스 출시 초기인 만큼 유사 서비스 대비 매우 낮은 가격으로 서비스를 제공해 많은 잠재 고객들이 부담 없이 서비스를 도입하고 경험해 봄으로써 경량화 기술이 제공하는 가치를 충분히 누려볼 수 있도록 하고 있다.
회사는 올해 해외 시장 진출을 본격화한다는 계획이다. 올 하반기에는 엔비디아, 인텔 등 글로벌 하드웨어 회사들과의 파트너십을 구축해 AI 스타트업이 가장 많이 포진한 북미 시장에 진출한다. 이를 통해 글로벌 시장에서의 입지를 더욱 확고히 하고 빠르게 성장해나갈 계획이다.
김형준 스퀴즈비츠 대표는 "스타트업 혹한기가 이어지고 있는 만큼 AI 스타트업들도 비용 최적화에 많은 노력을 기울이고 있다"며 "이런 기업들에겐 아울라이트가 최적의 솔루션이 될 것"이라 밝혔다.
yuniya@newspim.com