EMNLP 학회 논문 게재로 글로벌 기술력 입증
AI 서비스 기업과 연구개발 기업에 유용
[서울=뉴스핌] 양태훈 기자 = 엔씨소프트가 국내 최초로 거대언어모델(LLM)의 성능을 검증하는 평가 모델 'VARCO Judge LLM'을 출시했다고 23일 밝혔다.
'VARCO Judge LLM'은 다른 LLM이 얼마나 빠르고 정확하게 작업을 수행하는지 검사하는 평가 모델이다. 엔씨소프트에 따르면 이 모델은 동급 모델 중 가장 높은 성능을 갖췄으며, 특히 LLM 편향(Bias) 문제 해결 능력과 한국어 성능이 우수하다.
엔씨소프트는 이 기술로 자연어 처리 분야의 세계적 권위 학회인 EMNLP(Empirical Methods in Natural Language Processing)에 논문을 게재하며 글로벌 무대에서 기술력을 인정받았다.
'바르코(VARCO)' 로고. [사진=엔씨소프트] |
이 평가 모델을 활용하면 AI 기반 서비스 기업은 자사 서비스에 최적화된 LLM을 빠르게 선택할 수 있다. AI 모델 연구개발 기업은 자사 LLM의 성능을 검증하고 개선할 수 있으며, 모델 허브 사업자는 LLM 제공 프로세스를 가속화할 수 있다.
이연수 NC 리서치 본부장은 "VARCO Judge LLM은 기존 LLM 기반 서비스의 품질 향상을 넘어 AI 비즈니스에서 없어서는 안 될 중요한 도구로 자리잡을 것"이라고 전했다.
한편, 엔씨소프트는 게임 개발 과정과 사내 업무 효율화 전반에 AI 기술을 적극 활용하고 있으며, 이번 평가 모델 출시에 따라 자체 LLM '바르코(VARCO)'의 품질 향상과 함께 LLM 모델 평가 분야에서 선도적 위치를 확보한다는 계획이다.
dconnect@newspim.com