적은 데이터로 다국어 음성 제작
게임 캐릭터 음성 개발에 활용
[서울=뉴스핌] 양태훈 기자 = 엔씨소프트가 8일 게임 음성 제작 과정에 활용할 수 있는 인공지능(AI) 모델 'Zero-shot Multi-verse TTS(멀티버스 TTS)'를 공개했다.
멀티버스 TTS는 3초 분량의 음성 데이터만으로도 다양한 발화 스타일 변환과 다국어 음성 제작이 가능한 기술이다. 이 기술을 활용하면 제한된 음성 리소스로 고품질의 AI 캐릭터 보이스를 제작할 수 있어, 기존 음성 작업에 소요되던 시간과 비용을 크게 절감할 수 있다.
엔씨소프트 측은 "단일 모델로 여러 언어와 기능을 가진 TTS를 구현해 다국어 음성 콘텐츠를 제작할 수 있다"며 "경쟁 TTS 모델에 비해 상대적으로 적은 운용 비용으로 고품질의 음성 생성 서비스를 제공한다"고 설명했다.
'바르코(VARCO)' 로고. [사진=엔씨소프트] |
멀티버스 TTS 기술의 우수성은 세계적 권위의 인공지능 기술 학회인 EMNLP(Empirical Methods in Natural Language Processing)에 관련 논문이 게재되면서 입증됐다.
엔씨소프트는 이 기술을 활용해 연내 100종의 게임 캐릭터 음성을 제작할 계획이다. 또한 NPC(non-player character)의 성격과 상황에 맞는 음성을 제작하는 조절 기능도 지속적으로 개발할 예정이다.
dconnect@newspim.com