"최근 연구트렌드는 규모보다 '실용성'"
"카카오 초거대AI, 성능서 네이버 능가"
[서울=뉴스핌] 나은경 기자 = "언어모델의 사이즈를 무조건 키우면 학습과정도 복잡하고 연구개발비용도 많이 든다. 카카오브레인은 실용적으로 쓸 수 있는 규모이면서도 성능은 네이버의 최고 규모 초거대 인공지능(AI)과 비등하게 만들기 위해 노력했고 결과적으로 일부 항목에선 네이버를 능가하는 성능을 기록했다."
카카오의 AI 연구 자회사인 카카오브레인은 20일 오전 온라인 간담회를 열고 카카오의 초거대 AI 로드맵 및 방향성을 공개했다.
지난 5월 국내 기업 최초로 공개된 초거대 AI인 네이버의 '하이퍼클로바', 초거대 AI 개발을 위해 카이스트와 손잡은 KT, 지난 14일 모습을 드러낸 LG의 '엑사원'까지. 국내 주요 빅테크 기업들의 최근 관심사는 초거대 AI에 쏠려있다.
[서울=뉴스핌] 나은경 기자 = 김일두 카카오브레인 대표 [사진=카카오브레인] 2021.04.12 nanana@newspim.com |
카카오 역시 카카오브레인을 중심으로 초거대 AI 개발에 박차를 가하고 있다. 다만 이날 밝힌 카카오브레인의 초거대 AI는 파라미터 숫자만으로 따지면 경쟁사 대비 적은 편이다.
이날 간담회를 진행한 김일두 카카오브레인 대표는 "채팅봇에 이용자들이 질문을 하는데 10초 뒤에 답장이 오면 실시간으로 대화하기 어렵지 않느냐. 우리 모델인 60억~800억파라미터는 실시간 대답이 가능한 실용적인 구간"이라며 "네이버의 하이퍼클로바는 논문을 통해 수행한 과제와 그 점수를 공개하고 있는데 우리가 동일한 과제를 진행한 결과 하이퍼클로바보다 (파라미터 규모는 작지만) 점수는 더 높게 측정된 것들이 있었다"며 카카오의 초거대 AI 모델에 강한 자신감을 드러냈다.
◆카카오 AI는 글·이미지 같이 이해…몸집 작지만 성능서 네이버 제쳐
카카오브레인은 내년에 글과 이미지를 함께 이해할 수 있는 초거대 AI 모델을 공개할 계획이다.
김 대표는 "이를 위해 글로벌 최대 규모의 이미지 텍스트 멀티모달(multi-modal) 데이터세트를 구축해 공개할 것"이라고 말했다. 멀티모달이란 텍스트와 이미지, 음성을 함께 이해할 수 있는 AI 모델을 뜻한다.
카카오측은 이 점이 기존에 공개된 국내 빅테크 기업들의 초거대 AI와 카카오의 차별점이라고 본다. 김 대표는 "카카오는 실용구간의 초거대 AI를 전략적으로 파고 있다"며 "언어모델과 이미지모델을 섞는 등 타사와는 차별점을 둘 수 있는 연구를 진행 중"이라고 밝혔다.
실제로 이날 오픈AI의 초거대 AI인 '달리'가 그린 그림을 보고 카카오브레인의 초거대 AI 모델 중 하나인 'KoGPT(코지피티)'는 "렘브란트의 '야경'을 떠올리게 한다"는 설명을 달았다. 김 대표는 이에 대해 "이 그림을 보고 렘브란트의 '야경'으로 부연설명을 한다는 건 이 상황에서 어떤 말을 하는 것이 앞 뒤 문맥상 맞는지 KoGPT가 안다는 것을 보여준다"며 "이게 2~3년에 걸쳐 발전되면 나중에는 글과 어울리는 이미지를 찾거나 이미지를 글로 표현하고, 복잡한 텍스트를 갖고 관련된 이미지를 찾는 등 쇼핑분야나 검색엔진에 많은 기여를 할 것"이라고 설명했다.
"카카오는 실용구간의 초거대 AI를 전략적으로 파고 있다. 언어모델과 이미지모델을 섞는 등 타사와는 차별점을 둘 수 있는 연구를 진행 중이다"
◆카카오의 초거대 AI, 교육·헬스케어 사업에 우선 적용
[서울=뉴스핌] 나은경 기자 = 카카오의 AI 연구 자회사인 카카오브레인은 20일 오전 온라인 간담회를 열고 카카오의 초거대 AI 로드맵 및 방향성을 공개했다. [자료=카카오브레인] 2021.12.20 nanana@newspim.com |
이번에 카카오브레인은 자사 초거대 AI 모델인 KoGPT와 'minDALL-E(민달리)'를 오픈소스로 공개해 업계의 눈길을 끌기도 했다. 이에 대해서도 김 대표는 "이 정도 라지스케일 모델을 공개한 사례는 국내에서 카카오브레인이 최초"라며 "이번에 공개한 내용이 학계나 산업계가 초거대 AI의 개인정보 유출, 혐오발언 관련 문제를 연구하는 데 도움이 될 것"이라고 설명했다.
KoGPT와 minDALL-E에 대한 연구라면 특별한 제약이 없지만 만약 다른 기업이 이 모델을 제품이나 서비스에 녹여 사업화를 진행하려면 카카오브레인과 사전협의를 해야 한다. 이는 제품이나 서비스 적용시점에 혐오발언이나 개인정보 유출과 같은 민감한 문제를 면밀히 살피기 위함이라는 설명이다. 김 대표는 "당장은 초거대 AI 기술모델을 오픈한 것이지 서비스를 오픈한 것이 아니라 민감한 문제는 서비스하는 주체가 서비스적으로 막아야 한다"며 "다만 타사가 제품 및 서비스에 KoGPT와 minDALL-E를 녹일 땐 우리도 개입해 살필 것"이라고 말했다.
초거대 AI를 활용한 사업모델의 첫 타자로 교육과 헬스케어 분야를 선택한 이유에 대해서는 "접근성이 떨어지면서도 부가가치가 높은 분야를 찾았고 교육과 헬스케어가 이에 해당하는 분야였다"고 설명했다.
김 대표는 "앞으로 교육 및 헬스케어 분야에서 공격적·적극적으로 투자 및 공동연구를 진행하겠다"며 "교육과 헬스케어 분야를 중심으로 혁신사업을 할 것이고 내년 초 구체적으로 어떤 사업을 진행할지 말씀드리겠다"고 했다.
nanana@newspim.com