이용자 상황에 따라 실시간 적용·개발 가능
기존 STT 대비 음석 인식·변환 정확도 대폭 향상
[서울=뉴스핌] 진현우 인턴기자 = 카카오엔터프라이즈는 기업용 인공지능(AI) 음성 인식·변환 모델 '커스텀 STT(Speech-to-Text)'를 공개했다고 25일 밝혔다.
STT는 AI를 활용해 음성을 문자로 변환해주는 기능으로 AI 스피커와 음성 검색, 내비게이션 등 다양한 용도로 활용되고 있다.
[사진=카카오엔터프라이즈] |
카카오엔터프라이즈가 공개한 커스텀 STT는 각 기업의 고객과 산업 특성에 맞는 모델을 쉽고 빠르게 구축해 음성 인식·변환의 정확도를 높일 수 있다.
고객사가 직접 단어와 패턴을 추가하면 가장 적합한 AI 모델을 빠른 시간 내 자동으로 만들어준다. 고유명사나 길고 복잡한 단어 처리도 가능하다. 클라우드 기반의 '서비스형 AI(AIaaS)'로 기업의 서비스 관리 시간과 비용 부담을 해소할 수 있다는 점도 장점이다.
카카오 관계자는 "커스텀 STT 모델은 고객사가 직접 클라우드에 접속해 제품명과 신기능, 요청 사항 등 새로운 내용을 직접 실시간으로 입력하고 커스터마이즈할 수 있어 시간과 비용을 대폭 절감할 수 있다"고 말했다.
카카오엔터프라이즈는 오는 상반기 중 문을 여는 '카카오 i 커넥트 센터'의 문의응대나 상담 업무 등에도 커스텀 STT를 적용할 예정이다. 향후에는 문자인식(OCR)과 음성합성(TTS) 분야의 보유 기술도 맞춤 서비스형 AI 모델로 순차 공개할 예정이다.
최동진 카카오엔터프라이즈 AI Lab장은 "기업들은 신속하게 데이터를 변경·추가해 사용자들에게 새로운 정보를 빠르게 전달하고 더 편리한 경험을 제공할 수 있을 것이다"고 말했다.
hwjin@newspim.com