7일 롯데월드타워 'AI PLUS 2020', 이스트소프트 주최
[서울=뉴스핌] 김지완 기자 = 실제 아나운서가 방송하는 것과 차이가 거의 없는 AI(인공지능) 방송뉴스 제작 기술이 개발됐다. 이 기술은 텍스트 입력만으로 실존 아나운서의 뉴스 진행을 그대로 흉내낼 수 있다고 한다.
이스트소프트는 7일 롯데월트타워에서 'AI PLUS 2020(AI플러스)'을 열고 최신 인공지능 기술을 소개했다. 이날 포럼에 이스트소프트, 자회사 줌인터넷, 루닛, 카카오, 스캐터랩, 인텔코리아, 네이버 클로바, 삼성전자, 아마존웹서비스(AWS), 뤼이드, 휴렛패커드 엔터프라이즈(HPE) 등 각 산업별 대표급 AI 전문가들이 참여했다.
[서울=뉴스핌] 김지완 기자 = 7일 이스트소프트가 주최한 롯데월드타워 'AI PLUS 2020'에 디지털 휴먼 기술로 만들어진 가짜 손정의 소프트뱅크 회장이 축사 메세지를 전하고 있다. [갈무리=김지완 기자] 2020.10.07 swiss2pac@newspim.com |
이날 컨퍼런스 시작에 앞서 손정의 소프트뱅크 회장과 마크 저커버그 페이스북 CEO가 'AI플러스' 행사 축하메시지가 상영됐다. 하지만 이 영상은 이스트소프트 디지털 휴먼 기술을 이용해 만들어진 가짜 영상이었지만 영상에 나온 저커버그 CEO와 손정의 회장, 이들의 목소리와 표정, 말투 등에서 가짜라고 느끼긴 어려웠다.
이 기술은 AI가 머신러닝을 통해 아나운서 얼굴·표정·목소리 등을 학습한 뒤, 텍스트를 입력하면 AI가 실제 아나운서를 똑같이 모방해 뉴스 진행을 할 수 있도록 고안됐다. 사람의 시각·청각으론 도저히 구분할 수 없는 AI 앵커가 최신 뉴스를 진행할 수 있게 된 것.
권택순 이스트소프트 수석은 "지난 7월초부터 3개월 걸쳐 진행 텍스트 기사 읽은 아나운서 동영상 생성 기술 개발했다"며 "AI가 텍스트에 맞는 얼굴·표정을 생성하고, 목소리 생성 AI가 목소리를 만들어낸다"고 밝혔다.
이 기술은 TV아나운서 촬영 영상을 학습데이터로 두고 학습하는 방식으로 만들어진다. 텍스트에 따라 변하는 입모양도 머신러닝을 통해 만들어내게 된다.
디지털 휴먼 기술은 머지않아 TV방송 패러다임을 바꿀 수 있을 것으로 전망됐다.
권 수석은 "주커버그와 손정의 회장 축하 영상엔 버츄얼 휴먼 기술이 적용됐다"며 "이 기술은 단 5개월 분량의 촬영분량만 있으면 실제와 구분이 힘든 AI 아나운서를 만들어낼 수 있다"고 설명했다.
이어 "이를 통해 손쉽게 뉴스를 제작해 전파하고, 아나운서는 그 시간에 더 효율적으로 뉴스를 전달할 수 있는 방안을 연구하면 된다"면서 "이 기술이 TV뉴스 영상 제작에 혁신을 가져올 것"이라고 기대했다.
[서울=뉴스핌] 김지완 기자 = 7일 이스트소프트가 주최한 롯데월드타워 'AI PLUS 2020'에서 정상원 이스트소프트 대표가 강연하고 있다. [갈무리=김지완 기자] 2020.10.07 swiss2pac@newspim.com |
다만 무분별한 최신 AI 기술 사용을 경계하는 주장도 제기됐다. 최신 기술에만 집착하면 정작 중요한 서비스 품질이 떨어지는 등의 주객전도 현상이 생길 수 있다는 지적이다.
정상원 이스트소프트 대표는 "모바일앱에서 안경을 골라주고 찾아주는 '라운즈(ROUNZ)'앱에선 최신 이미지 인식 기술이 적용되지 않았다"면서 "카메라가 안경착용자 얼굴을 비추는 각도에 따라 인식되는 안경이 달라졌기 때문이다. 결국 우리는 OCR(광학문자인식)로 안경마다 번호표를 매긴 뒤, 인식하는 방식으로 서비스 완성도를 높였다"고 설명했다.
정 대표는 "OCR은 이미지 인식 기술에 비해 아주 오래된 기술"이라면서 "최신 기술로 완성도 높은 서비스를 만드는데는 상당한 도전이 필요하다. 최신기술에 집착을 버리고 제대로 된 서비스를 제공하는데 집중해야 한다"고 강조했다.
swiss2pac@newspim.com