전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 ICT

속보

더보기

네이버, 국내 최초 '초대규모 AI' 하이퍼클로바 공개…"모두를 위한 AI시대"

기사입력 : 2021년05월25일 14:00

최종수정 : 2021년05월25일 14:00

오픈AI가 개발한 GPT-3보다 6500배 많은 한국어 데이터 학습
204B 규모의 세계 최대 한국어 언어모델로 AI 주권 확보
검색어 교정 시작으로 다양한 네이버 서비스에 상용화 계획

[서울=뉴스핌] 구윤모 기자 = 네이버는 25일 국내 기업 최초의 '초대규모 AI'인 '하이퍼클로바(HyperCLOVA)'를 공개했다. 국내 AI 퍼스트무버(first mover)를 넘어 글로벌 AI 기술 리더로 발돋움하겠다는 계획도 밝혔다. 기존 한국어 AI의 패러다임을 바꾸는 '하이퍼클로바'를 통해 사용자, 중소상공인(SME), 크리에이터에게 새롭고 차별화된 경험을 선보이며 '모두를 위한 AI' 시대를 이끌어가겠다는 계획이다.

네이버는 이날 온라인으로 열린 'NAVER AI NOW' 컨퍼런스에서 지난해 10월 슈퍼컴퓨터 도입 이후 네이버 AI 기술의 성과와 앞으로의 방향성을 공개했다.

[서울=뉴스핌] 구윤모 기자 = 네이버 하이퍼클로바 [사진=네이버] 2021.05.25 iamkym@newspim.com

◆ 국내 최초 초대규모 AI, 세계 최대 한국어 언어모델 '하이퍼클로바'

하이퍼클로바는 네이버가 국내 기업 최초로 자체 개발한 초대규모 AI다. 정석근 네이버 CLOVA CIC(Company-In-Company) 대표는 키노트에서 "글로벌 기술 대기업들은 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있다"며 "한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다"고 개발 배경을 밝혔다.

하이퍼클로바는 '오픈AI'의 GPT-3(175B)를 뛰어넘는 204B(2040억개) 파라미터(parameter, 매개변수) 규모로 개발됐다. AI 모델의 크기를 나타내는 파라미터의 수가 높아질수록 AI는 더욱 많은 문제를 해결할 수 있게 된다.

하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한 현재 전세계에서 가장 큰 한국어 초거대 언어모델이기도 하다. 영어가 학습 데이터의 대부분을 차지하는 GPT-3와 달리, 하이퍼클로바 학습 데이터는 한국어 비중이 97%에 달한다. 영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어모델을 개발함으로써 AI 주권을 확보한다는 의미도 있다.

◆ 네이버 "글로벌 수준의 인프라, 데이터, AI 전문성으로 기술 주도권 잡을 것"

네이버는 지난 10월 국내 기업 최초로 700 페타플롭(PF) 성능의 슈퍼컴퓨터를 도입하며 대용량 데이터 처리를 위한 인프라를 갖췄다.

국내 최대 인터넷 플랫폼을 운영하며 쌓아온 대규모 데이터 처리 능력도 하이퍼클로바만의 중요한 경쟁력이다. 네이버는 하이퍼클로바 개발을 위해 5600억개 토큰(token)의 한국어 대용량 데이터를 구축했다.

슈퍼컴퓨터 인프라와 한국어 데이터 외에 네이버가 보유한 전세계 최고 수준의 AI 연구 개발 역량 역시 하이퍼클로바 자체 개발의 중요한 요소다. 네이버는 작년 한해 동안 글로벌 Top AI 컨퍼런스에서 국내 기업 중 가장 많은 43개의 정규 논문을 발표하며 기술력을 인정받았다. 

또한 서울대학교와 '서울대-네이버 초대규모(Hyperscale) AI 연구센터'를 설립하고, 카이스트 AI 대학원과는 '카이스트-네이버 초창의적(Hypercreative) AI 연구센터'를 설립하는 등 긴밀하고 강력한 산학협력을 통해 AI 공동 연구에 더욱 박차를 가하고 있다.

네이버는 앞으로 한국어 외 다른 언어로 언어 모델을 확장하고, 언어뿐만 아니라 영상이나 이미지 등도 이해하는 '멀티모달(Multimodal) AI'로 하이퍼클로바를 계속해서 발전시켜나갈 계획이다.​

◆ 네이버 서비스에 하이퍼클로바 상용화...사용자 경험 차별화

하이퍼클로바는 AI 개발과 적용의 패러다임을 완전히 바꿔 일상 속에서 AI가 더욱 많이, 널리 사용되도록 한다. 기존에는 해결하고자 하는 문제별로 데이터를 확보하고 정제해 모델을 개발했다면 하이퍼클로바는 하나의 'Big Model'에 방대한 데이터를 학습시켜 다양한 문제에 적용할 수 있다. 이를 통해 AI를 더욱 효율적으로 개발할 수 있을 뿐만 아니라 AI의 확장성이 대폭 높아진다.

네이버는 하이퍼클로바의 기술을 네이버 서비스에 적용해 사용자들에게 차별화된 경험을 제공할 예정이다. 첫번째 사례로 지난 6일 검색 서비스에 하이퍼클로바를 적용, 사용자가 검색어를 잘못 입력하는 경우 올바른 단어로 전환해 검색해주거나 적절한 검색어를 추천해주는 기능을 선보인 바 있다.​

 ◆ SME, 크리에이터, 스타트업 등 기술이 필요한 '모두의 능력'으로

네이버는 하이퍼클로바가 SME, 크리에이터, 스타트업 등 기술의 도움이 필요한 '모두의 능력'이 될 수 있도록 지원한다는 계획이다. 간단한 설명과 예시를 제시하는 소수학습(Few-shot learning) 방식으로 AI를 동작시킬 수 있기 때문에 AI 전문가가 아니어도 누구나 손쉽게 AI 서비스를 만들 수 있다.

예를 들어 상품 판매에 도움이 되는 적절한 마케팅 문구를 AI가 자동으로 작성해주는 일, 공부해야 할 내용을 AI가 빠르게 요약하거나 모르는 내용을 질문했을 때 자연스럽게 답변해주는 일 등이 가능해지게 된다. 네이버는 향후 적극적인 사업 및 연구 협력을 통해 다양한 방식의 기술 제공을 계획하고 있다.

​정석근 네이버 CLOVA CIC 대표는 "더 짧은 시간과 더 적은 리소스를 사용해서 이전에 우리가 상상만 헀던, 또는 우리가 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다"며 "하이퍼클로바를 통해 SME와 크리에이터를 포함해 AI 기술이 필요한 모두에게 새로운 경험을 제공할 것"이라고 말했다.

 

iamkym@newspim.com

CES 2025 참관단 모집

[뉴스핌 베스트 기사]

사진
모델 문가비 아들 친부는 정우성 [서울=뉴스핌] 양진영 기자 = 모델 문가비(35)가 출산한 아들의 친부가 배우 정우성(51)인 것으로 드러났다. 정우성 소속사 아티스트컴퍼니는 24일 "문가비가 소셜미디어를 통해 공개한 아이는 정우성의 친자가 맞다"며 "아이의 양육 방식에 대해서 최선의 방향으로 논의 중이다. 아버지로서 아이에 대해 끝까지 책임을 다할 것"이라고 밝혔다. 다만 "출산 시점과 두 사람의 교제 여부, 결혼 계획 등 사생활 관련 내용은 확인해 줄 수 없다"고 알렸다. 배우 정우성 [사진=에이스메이커무비웍스] 앞서 두 사람 사이의 득남 소식이 알려졌다. 두 사람은 2022년 한 모임에서의 만남 가까이 지냈으나 교제한 사이는 아니었고 결혼 계획도 없는 것으로 전해졌다. 작년 6월 문가비가 임신 사실을 알렸고 정우성은 양육의 책임을 약속했다고 한다. 문가비는 뷰티 예능 프로그램 '겟잇뷰티' 등으로 얼굴을 알린 한동안 활동을 중단했다가 지난 22일 인스타그램을 통해 아들 출산 사실을 고백했다. 그러나 결혼 여부나 아이 아버지에 관한 언급은 없어 궁금증을 샀다. 당시 문가비는 "너무 갑작스럽게 찾아온 소식에 아무 준비가 돼 있지 않았던 저는 임신의 기쁨이나 축하를 마음껏 누리기보다는 가족들의 축복 속에 조용히 임신 기간 대부분을 보냈다"며 "그렇게 하기로 선택한 건 오로지 태어날 아이를 위함이었다. 마음 한편에 늘 소중한 무언가를 지키기 위해서는 꽁꽁 숨겨야 한다고 생각했다"고 했다. [사진=문가비 인스타그램] 이어 "세상에 나온 아이를 앞에 두고 여전히 완벽한 준비가 되지 않은 엄마지만 그런 내 부족함과는 상관없이 존재 자체만으로 나의 마음을 사랑으로 채워주는 아이를 보며, 완벽함보다는 사랑과 행복으로 가득 찬 건강한 엄마가 돼야겠다고 다짐했다"며 "그러기 위해서는 용기를 내야 한다고 생각했다"고 말했다. 문가비는 1989년생으로 2017년 온스타일 예능 '매력티비'와 '겟잇뷰티'로 얼굴을 알렸다. 이후 SBS '정글의 법칙'과 KBS '볼빨간 당신' 등 각종 예능에 출연했다. 여러 광고와 헤라서울패션위크 등 패션쇼 무대에도 섰다. jyyang@newspim.com 2024-11-25 09:48
사진
이재명 '위증교사' 1심 김동현 판사 누구 [서울=뉴스핌] 배정원 기자 = 이재명 더불어민주당 대표의 위증교사 혐의 1심 선고를 맡은 서울중앙지법 형사합의33부 재판장에 대한 관심이 집중되고 있다. 서울중앙지법 형사합의33부(김동현 부장판사)는 25일 오후 2시 위증교사 혐의로 기소된 이 대표의 1심 선고공판을 진행한다.  전라남도 장성 출신의 김동현 부장판사는 고려대학교 법학과를 졸업하고 2001년 사법연수원을 30기로 수료했다. 김 부장판사는 2004년 광주지법 판사를 시작으로 인천지법, 서울동부지법, 서울고법 등을 거쳐 지난해부터 선거·부패 사건을 전담하는 서울중앙지법 형사합의33부 부장판사로 재직하고 있다. [서울=뉴스핌] 이형석 기자 = 이재명 더불어민주당 대표가 25일 오전 서울 여의도 국회에서 열린 최고위원회의에 자리하고 있다. 2024.11.25 leehs@newspim.com 김 부장판사는 이 대표의 위증교사 사건 외에도 '대장동·위례신도시·성남FC·백현동 의혹' 사건을 함께 심리하고 있는데, 해당 사건은 기록의 양이 방대하고 쟁점이 복잡해 1심 선고를 하기까지 몇 년이 더 걸릴 수 있다는 전망이 나온다. 당초 이 대표 측은 두 사건을 분리해서 진행할 경우 방어권 보장에 어려움을 겪게 된다며 병합 심리를 요구했으나, 김 부장판사는 두 사건을 병합하지 않고 별도로 진행하기로 결정했다. 또 김 부장판사는 이른바 '가짜 수산업자'에게 금품을 받은 혐의로 기소된 박영수 전 특별검사(특검)의 1심 사건을 맡으며 징역 4개월에 집행유예 1년을 선고하기도 했다. 당시 김 부장판사는 "이 사건 범행으로 공직자의 공정한 직무수행과 공공기관에 대한 국민의 신뢰가 크게 훼손됐다"며 "특히 박영수 피고인은 국정농단 규명을 위해 임명된 특별검사로 어느 공직자보다 공정성과 청렴성에서 모범을 보여야함에도 금품을 수수했다"고 질책했다. 박 전 특검 등에게 금품을 제공한 혐의로 기소된 가짜 수산업자 김모 씨에 대해서는 "다수의 공직자에게 긴 시간 금품을 제공한 점, 이종범죄로 처벌받은 전력이 있는 점 등을 고려했다"며 징역 6개월의 실형을 선고했다. 또 김 부장판사는 이명박 정부 시절 이른바 '스파르타팀'을 꾸려 정부에 우호적인 방향으로 온라인 여론을 조작한 혐의 등으로 기소된 전직 청와대 비서관들에게도 징역형 집행유예를 선고한 바 있다.  이런 가운데, 위증교사 혐의는 이 대표의 형사 사건 중 가장 불리한 판결이 나올 가능성이 높은 사건으로 꼽히고 있다. 검찰에 따르면 최근 6년간 유죄가 확정된 위증교사 사범 195명 중 실형(69명)이나 징역형 집행유예(114명)가 선고된 사례는 94.8%에 이르며 벌금형(12명) 선고 비율은 6.2%에 그쳤다. 이 대표가 만약 위증교사 혐의로 대법원에서 금고 이상의 형(집행유예 포함)을 확정받으면 공직선거법 제19조에 따라 피선거권이 박탈돼 형이 실효될 때까지 선거에 출마할 수 없게 된다.  jeongwon1026@newspim.com 2024-11-25 11:19
안다쇼핑
Top으로 이동