[서울=뉴스핌] 송은정 기자 =코난테크놀로지가 스마트폰에 자체 개발 STT와 TTS 그리고 LLM이 탑재된 차별화된 On-Device AI 기술력을 공개했다.
코난테크놀로지가 스마트폰에서 실시간 번역으로 자연스러운 외국어 대화가 가능한 '코난 온디바이스' AI 기술력을14일 공개했다.[사진=코난테크놀로지] |
14일 코난테크놀로지는 공식 유튜브 채널에 '코난 온디바이스'(Konan On-Device)라는 타이틀로 데모영상을 업로드했다. '코난 온디바이스' 데모는 삼성전자의 갤럭시S24 울트라 모델에서 실시했다. 마이크 버튼을 탭하여 한국어로 말하면 자동으로 음성이 인식되고(Speech-to-text), 실시간 번역 후 상대방에게 영어 음성으로 제공(Text-to-speech) 된다. 사용자가 말한 내용을 번역해 상대방 언어의 음성으로 들려주고 사용자의 언어와 상대방의 언어 번역 결과가 스마트폰 화면에 대화 창으로 표시되는 방식이다. 현재 한국어와 영어 외에도 향후 업데이트를 통해 지원 언어를 추가할 계획이다.
음성인식은 기존의 챗GPT에서도 가능했지만 이에 더해 음성합성 기능이 추가됐다. 네트워크 연결 없이 디바이스 자체에서 사람의 말을 인식하고 상대방 언어로 번역해서 말 해주는 과정이 한번에 AI를 통해 처리되는게 특징이다. 또한 모바일 기기 자체의 CPU만 사용하기 때문에 저렴한 가격으로 각종 엣지 디바이스에서 효율적으로 이용할 수 있다.
코난테크놀로지 음성기술의 핵심경쟁력은 고속 실시간 처리에 특화된 구조의 신경망 설계로 인식결과가 응답지연 없이 즉시 출력(STT) 및 즉시 합성(TTS)된다는 점이다. 제공형태는 안드로이드 및 리눅스 버전이다. 13개 언어를 AI로 동시 통역하는 '코난 챗봇 플러스'는 현재 서울지하철 주요 역사 및 롯데백화점, 파라다이스카지노 등에 설치돼 외국어 및 관광객들의 의사소통을 돕고 있다.
실시간 번역에는 코난 LLM이 사용됐다. 온디바이스에 최적화 된 '코난 LLM-4B' 모델이 새로 개발 및 탑재됐다. LLM을 통한 즉시 번역으로 온디바이스 생성AI의 응답성이 개선됐다.
'코난 온디바이스'는 S24 Qualcomm 스냅드래곤에서 작동됐다. 저가의 퀄컴 ARM 계열 프로세서도 동작이 가능하다. 스마트폰 외에도 ▲카메라 ▲센서 ▲드론 ▲웨어러블 ▲스마트홈 디바이스 등에 적용할 수 있다. 또한 ▲내비게이션 ▲자율주행 보조장치와 같은 차량 디바이스에서 음성지시를 통해 운전자를 보조하고 운행을 제어할 수도 각종 공장과 제조사에서 음성으로 기계를 운영시켜 제품에 지능을 부여할 수 도 있다. 따라서 수많은 하드웨어와의 협업이 기대된다.
김영섬 코난테크놀로지 대표이사는 "그 동안 축적해온 생성 AI 기술 역량을 결집시켜 각 HW에 최적화 된 온디바이스 AI 기술을 구현하고 다양한 수요처들과 비즈니스 기회를 만들고 매출로 연결시키겠다"고 소감을 말했다.
코난테크놀로지는 자체개발 인공지능 프레임워크 '코난 디트레인'을 이용해 더 적은 메모리로 계산량은 크게 늘려주는 엣지 모델 또한 지속적으로 개발할 예정이다.
yuniya@newspim.com