전체기사 최신뉴스 GAM 라씨로
KYD 디데이

베일벗은 네이버 '초거대 AI'...구글·MS 대항마 될까

기사입력 : 2023년08월25일 14:24

최종수정 : 2023년08월25일 16:08

'1조 투자' 초거대 AI '하이퍼클로바X' 전격 출시
글로벌 빅테크와 경쟁 본격화…생성형 AI 춘추전국시대
"자체기술 탑재 후 환각 현상 72% 감소"

[서울=뉴스핌] 배요한 기자 = 네이버가 3년 동안 1조원을 투자해 개발한 초거대 인공지능(AI) 모델 '하이퍼클로바X'가 베일을 벗었다. 마이크로소프트, 구글 등 글로벌 빅테크들과의 AI 경쟁도 본격화 됐다. 

25일 업계에 따르면 전날 네이버는 팀네이버 컨퍼런스 '단 23'을 개최하고 초대규모 AI '하이퍼클로바'를 개발한 이후 2년 만에 업그레이드 모델 '하이퍼클로바X'를 공개했다.

이날 컨퍼런스에서 네이버는 하이퍼클로바X를 적용한 세 가지의 서비스를 소개했다. 대화형 AI 서비스인 '클로바X(CLOVA X)', 기업 생산성 향상을 위한 AI 플랫폼 '프로젝트 커넥트X(Project CONNECT X)' 그리고 비즈니스에 최적화된 AI 개발도구 '클로바 스튜디오(CLOVA Studio)'다.

네이버 관계자는 "20년 이상 축적된 데이터 자산을 활용해 한국 최적의 생성형 AI 모델을 구현했다"며 "기존 사업인 검색, 커머스, 광고, 클라우드, 웹툰 등 콘텐츠 사업 전반에 적용함으로써 소비자와 셀러, 개발자, 기업 모두의 편의성 및 업무효율성을 향상시킬 수 있다"고 밝혔다.

최수연 네이버 대표이사가 24일 그랜드 인터컨티넨탈 서울 파르나스에서 열린 팀네이버 컨퍼런스 'DAN 23'에서 차세대 생성형 AI인 '하이퍼클로바X' 기술을 소개하고 있다.[사진=네이버]

◆ 글로벌 초대형 빅테크와 경쟁 본격화..."챗GPT 대결 승률 75%" 

네이버가 초거대AI 모델 하이퍼클로바X를 공식 발표하면서 오픈 AI의 '챗GPT'으로 시작된 '생성형 AI' 시장은 그야말로 춘추전국시대가 열리게 됐다. 현재 오픈AI의 'GPT', 구글의 '팜2', 마이크로소프트(MS)의 'GPT-4' 등 해외 빅테크들의 거대 언어 모델(LLM)이 시장을 선도하고 있는 가운데 네이버가 이들에 맞서 경쟁력을 입증할 수 있을지 관심이 쏠린다.

네이버는 이번에 출시한 '하이퍼클로바X의 파라미터(parameter, 매개변수)를 공개하지 않았다. 매개변수는 입력된 데이터에서 원하는 출력값을 얻기 위해 AI가 찾아내야 하는 변수로, 통상 이 수치가 높으면 우수한 AI모델이라고 평가받는다.

다만 이전 모델인 하이퍼클로바의 성능지표로 하이퍼클로바X의 성능을 가늠해볼 수 있다. 지난 2021년 네이버가 공개한 하이퍼클로바의 매개변수는 2040억개다. 반면 오픈AI가 개발한 초거대 AI 'GPT-3.5'의 매개변수는 1750억개로 하이퍼클로바X보다 낮다 수준이다.

단순 수치상으로 비교해볼 때 네이버의 하이퍼클로바X는 챗GPT에 적용된 초거대AI보다 성능 면에서 우위에 있다고 볼 수 있는 셈이다.

성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "초거대 규모의 언어모델의 성능을 어떤 하나의 수치로 비교하는 것은 어렵다"라면서도 "내부적으로 우리 모델과 GPT-3.5의 시뮬레이션을 진행해본 결과 75%의 높은 승률을 기록했다"고 말했다. 

생성형 AI의 문제점으로 지적돼온 '환각(hallucination) 현상'에 대해서도 좋은 평가를 받았다. 대표적 대화형 AI 서비스인 챗GPT는 환각현상이 빈번하게 나타나 정확도가 중요한 검색 서비스에 부적절하다는 논란이 있었다. 반면 하이퍼클로바X는 내부 테스트 결과, 자체기술 탑재 후 환각 현상이 72% 감소한 것으로 알려졌다. '환각 현상'은 생성형 인공지능 서비스가 사실이 아닌 것을 사실처럼 말하는 현상이다. 

네이버는 오는 11월 단일 기업으로는 아시아 최대 규모인 60만 유닛 이상의 서버를 수용할 수 있는 하이퍼스케일 데이터센터 '각 세종'을 오픈할 예정이다. '각 세종'은 초대규모AI의 브레인센터 역할을 수행하게 된다.

◆ '국내용' 우려...저작권 논란 '불씨'

네이버에 따르면 하이퍼클로바는 GPT-3보다 한국어 데이터를 약 6500배 이상 학습한 것으로 알려졌다. 한국어 데이터 학습 기반을 통해 영어 형식의 챗 GPT보다 자연스럽고 이해하기 쉬운 한국어로 답변을 해줄 수 있다는 평가가 나온다.

하이퍼클로바X가 영어 중심의 오픈AI '챗GPT'나 구글의 '바드'와 달리, 한국 시장에서 유리한 고지를 선점한 것은 분명하지만, '국내용'이라는 우려의 목소리도 적지 않다. 실제 네이버는 컨퍼런스에서 구체적인 해외 진출 계획을 공개하지 않았다.

최수연 네이버 대표는 해외 시장 진출을 묻는 질문에 "하이버클로바X가 영어·일본어 등 여러 외국어도 굉장히 잘한다"면서도 "이길 수 있는 시장을 먼저 잡기 위해 한국 타깃의 국내 스타트업 수요를 맞춘 것으로, 글로벌 진출 요구에도 대응하겠다"며 모호한 답변을 내놨다. 

성낙호 네이버 총괄은 "유니버셜하게 전체에 대한 데이터를 학습한다면 그걸 똑같은 성능을 발휘하는 인공지능을 만드는 과정에서 훨씬 더 고비용 구조를 가질 수밖에 없다"라며 "우리는 생성형 AI에서도 로컬라이즈된 사업 전략이 필요하다고 생각했고, 한국 시장에 특화된 모델을 만들고 경량화를 진행하고 있다"고 설명했다.

이제 막 개화하는 글로벌 생성형 AI 시장 전망은 굉장히 밝은 편이다. 스탠더드앤드푸어스(S&P) 글로벌 마케팅 인텔리전스가 조사한 전세계 생성형 AI 시장 규모는 올해 37억360만 달러(약 4조 9,606억원) 규모로 연평균 58% 성장해 2028년에는 10배 이상 성장할 것으로 예상했다. 그랜드 뷰 리서치는 Chat GPT 등 생성형 AI에서 비롯된 데이터 서비스 및 솔루션 수요가 2022년 글로벌 시장에서 약 90억 달러(약 11조 9502억원)를 기록했으며, 2030년에는 660억 달러(약 87조 6348억원) 규모로 급성장할 것으로 추정했다.

국내 생성형 AI 시장에 대한 구체적인 자료는 없지만, 국내 AI기업 매출액은 2020년 1조 9506억원에서 지난해 3조 9702억원으로 2배 이상 증가한 것으로 나타났다. 국내 AI 시장 규모가 증가 추세를 보이는 것은 확실하지만 글로벌 시장과 비교해서는 상당한 차이가 나는 셈이다.

네이버는 초거대AI 하이퍼클로바X를 개발하는데 3년동안 1조원 가량을 쏟아 부었다. 앞으로 기술 고도화에 따른 개발 비용으로 천문학적인 추가 비용이 투입될 수 있는 상황에서 해외 시장 점유율 확보는 필수적이다.

네이버가 풀어야할 숙제로 저작권 문제도 남아있다. 앞서 네이버는 보유한 50년치 뉴스와 9년치 블로그 데이터가 생성형AI 학습에 사용됐다며 저작권 논란에 휩싸였다.

최근 한국신문협회는 '생성형 인공지능(AI)의 뉴스 저작권 침해 방지를 위한 신문협회 입장'을 내고 "정당한 권한과 근거 없이 뉴스 콘텐츠를 AI 학습에 이용하는 것은 언론사가 뉴스 콘텐츠에 대해 갖는 저작권 및 데이터베이스(DB) 제작자로서의 권리를 침해하는 것"이라고 입장을 표명한 바 있다.

이와 관련해 최수연 대표는 "하이퍼클로바를 출시할 때 그 학습한 데이터의 규모를 알기 쉽게 전달하는 과정에서 '뉴스 50년치'가 아니고, 1년에 검색되는 뉴스 분량의 50배 혹은 블로그에 몇 배다 이런 식으로 비교해서 언급했는데 그 부분에서 오해가 있었던 것 같다"고 저작권 침해 사실을 부인했다.

Press Q&A에 최수연 대표와 성낙호 네이버클라우드 Hyperscale AI 기술총괄, 김용범 Search US AI 기술총괄, 최재호 AiRSearch 책임리더 등이 참석해 기자들의 질의에 답변했다.[사진=배요한 기자]

yohan@newspim.com

[뉴스핌 베스트 기사]

사진
[여론조사] 국민의힘 차기 당권주자는…한동훈 28.4%·유승민 25.9% [서울=뉴스핌] 송기욱 기자 = 한동훈 전 국민의힘 비상대책위원장이 보수 진영의 가장 유력한 차기 당권 주자라는 여론조사 결과가 30일 발표됐다. 여론조사 전문기관 미디어리서치가 종합뉴스통신 뉴스핌 의뢰로 지난 27~28일 전국 만 18세 이상 남녀 1000명에게 물은 차기 국민의힘 당대표 조사 결과 한 전 위원장은 28.4%로 1위를 차지했다. 유승민 전 의원이 25.9%로 2위에 올랐으며 뒤이어 안철수 국민의힘 의원(6.4%), 원희룡 전 장관(5.5%), 나경원 국민의힘 당선인(5.4%), 윤상현 국민의힘 의원(3.1%), 김태호 국민의힘 당선인(1.1%) 순으로 집계됐다. 기타는 5.8%, 없음 14.1%다. 한 전 위원장은 국민의힘 지지자들 사이에서 압도적이었다. 정당별로 살펴본 결과 국민의힘 지지층에서 한 위원장의 지지도는 55.9%를 기록했다. 반면 유 전 의원은 더불어민주당(40.5%), 조국혁신당(44.9%), 개혁신당(31.7%), 새로운미래(40.1%) 등 야권 지지층에서 높게 나타났다. 연령대별로 보면 한 전 위원장 지지율은 70대 이상(27.3%), 60대(36.3%), 30대(32.8%)에서 높았으며 유 전 의원은 40대(32.1%), 50대(30.8%)에서 높았다. 김대은 미디어리서치 대표는 "민주당과 조국혁신당 지지층에서 유승민 전 의원에 대한 지지세가 강한 것은 국민의힘의 대표적인 비윤(비윤석열)계로 분류되는 유 전 의원의 윤석열 대통령 비판 목소리와 무관치 않다"고 분석했다. 이어 "야권 지지층에서의 역선택이 반영된 것"이라며 "특히 유 전 의원이 국민의힘 당대표가 되는 것이 야권층에 더 유리하다고 봤기 때문"이라고 덧붙였다. 그는 또 "반면 국민의힘 지지층에서 과반수가 한 전 위원장을 지지한 것은 이번 22대 총선 참패의 주범이라는 비판을 받고 있음에도 불구하고 당심은 여전히 한 전 비대위원장임을 보여준 결과"라고 설명했다. 이번 조사는 무선 RDD 활용 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 3.3%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. oneway@newspim.com 2024-05-30 06:00
사진
[분석] 北, 9년 전 치욕 떠올렸나…"대남 오물살포 자충수 될 수도" [서울=뉴스핌] 이영종 통일전문기자 = 북한이 우리 민간단체의 대북전단 살포를 빌미로 대형풍선을 이용한 오물 투척에 나서는 초유의 사태가 벌어지면서 향후 김정은의 선택에 시선이 쏠린다. 2일 밤 관영 선전매체인 조선중앙통신으로 북한이 밝힌 데 따르면 접경지역과 수도권에 지난달 28일부터 2일까지 모두 15톤의 쓰레기와 오물을 3500개 각종 기구로 날려보냈다. 2일 오전 안양 남부시장에서 발견된 대남전단으로 추정되는 오물. [사진=경기도소방재난본부] 우리 정부 당국과 합동참모본부에서 파악한 것보다 훨씬 많은 물량이다. 도심지나 민가 외에도 야산 지역 등에 상당수가 떨어졌을 것이란 추정이 가능하다. 담화에서 김강일 국방성 부상은 대남 오물 살포를 잠정 중단하겠다는 입장을 밝혔다. 그는 자신들의 행위가 대북전단에 대한 대응 차원이라는 논리를 폈다. 하지만 우리 민간 단체들이 대북전단 보내기가 재개될 경우 "백배의 휴지와 오물량을 다시 집중 살포하는 것으로 대응할 것"이라고 위협하고 있어 오물 풍선이 다시 날아온 가능성은 여전하다. 북한은 이번 오물풍선을 통해 김정은 독재체제를 비판하는 전단이 '쓰레기'에 불과하다는 점을 주장하려 한 것으로 보인다. 김정은의 여동생 김여정이 담화를 내고 '표현의 자유' 운운하면서까지 오물풍선에 의미를 부여한 것도 이런 맥락이라 볼 수 있다. [서울=뉴스핌] 김정은 북한 국무위원장이 5월 30일 600mm 방사포를 동원한 대남 핵 타격 훈련을 참관했다고 관영 조선중앙통신이 31일 보도했다. [사진=조선중앙통신] 2024.05.31 하지만 김정은으로서는 고민스런 대목이 적지 않다. 첫째는 한국의 반발뿐 아니라 국제사회의 비난이 거세다는 점이다. 외부의 시선 따위는 아랑곳 않겠다는 게 북한의 기본자세이기는 하지만 담배꽁초 등 쓰레기는 물론 동물의 분변까지 실어 상대측에 날려 보낸 해괴한 행위로 북한 체제의 이미지는 더욱 추락하는 상황을 맞았다. 더욱이 항공기 안전 등 심각한 문제를 부를 수 있고, 풍선과 함께 GPS 교란까지 벌인 행태에 주변국의 시선이 곱지 않다. 둘째는 사태가 장기화 해 북한 주민들에게 오물풍선을 보낸 사실이 입소문 날 경우 김정은 체제에 대한 반감과 한국 사회의 실상, 대북전단에 대한 호기심 등을 자극할 소지가 있다. 김정은은 청년층을 중심으로 번지고 있는 한국 드라마와 영화・가요 등 한류 영향으로 체제에 위협요인이 커지고 있다면서 이를 차단하는데 주력하고 있는 것으로 알려져 있다. 이른바 '반동사상문화배격법'을 만들어 단순 시청만으로도 징역 5~15년 형을 선고하는 가혹한 처벌을 하고 있지만 좀체 수그러들지 않고 있는 것으로 고위 탈북인사들은 귀띔하고 있다. 북한이 이번 대남 오물풍선 소동을 벌이면서도 북한 주민들이 접할 수 없는 관영매체인 조선중앙통신으로만 입장을 밝히는 데서도 김정은이 이를 얼마나 민감하게 다루고 있는지를 알 수 있다. [서울=뉴스핌] 장호진 국가안보실장이 2일 서울 용산구 대통령실에서 북한의 대남 오물 풍선 살포, GPS 교란, 단거리 미사일 발사 등에 대한 대책을 논의하기 위해 열린 긴급 국가안전보장회의(NSC) 상임위원회를 주재하고 있다. [사진=대통령실]2024.06.02 photo@newspim.com 셋째는 만만치 않은 비용이다. 오랜 기간 북한 주민들에게 외부 정보를 알리기 위한 전단 풍선을 보내온 이민복 북한동포직접돕기운동 대표는 "북한이 가스와 풍선 등을 대규모로 날리려면 엄청난 자금이 들어간다"면서 "북한이 엄포를 놓은 것처럼 우리 대북전단에 백배 보복을 할 재력이 없다"고 말했다. 도무지 득이 되지 않을 화풀이성 오물투척에 계속 돈을 쏟아부을 입장이 아니란 얘기다. 무엇보다 9년 전 대북 확성기 방송으로 굴욕적인 상황을 당했던 악몽을 떠올리면 김정은과 북한 군부의 행동반경은 좁아질 수박에 없다. 지난 2015년 8월 4일 북한은 경기도 파주 비무장지대(DMZ)에 목함지뢰를 매설해 우리 부사관 2명에게 중상을 입히는 도발을 벌였다. 엿새만에 우리 군 당국이 대북 확성기 방송을 11년 만에 재개하자 북한은 "48시간 내 중단 않으면 군사행동을 벌이겠다"고 위협했다. 김정은까지 나서 '준전시 사태'를 선포하는 등 도발이 임박한 것처렴 사태를 몰아갔다. [사진공동취재단] 지난 2018년 5월 1일 오후 경기도 파주 육군 9사단 교하소초에서 병사들이 임진강변에 설치된 대북 심리전 확성기 방송시설을 철거하고 있다. 2018.05.01 하지만 같은달 21일 박근혜 당시 대통령이 3군 사령부를 방문해 "추가 도발시 단호해 대응하라"고 지시하면서 일촉즉발의 위기상황이 벌어졌다. 그런데 북한은 같은 날 갑자기 입장을 바꿔 김양건 당시 노동당 통일전선부장이 판문점 접촉을 제안해 왔다. 청와대는 "북한군을 대표하는 황병서가 나오라"고 대북통보를 했고 북한은 우리 요구에 따라 황병서가 나와 목함지뢰 도발에 '유감'이라며 사실상 사과했다. 당시 상황은 북한이 대북 확성기 방송이나 전단에 얼마나 사활을 거는지를 잘 보여줬다. 이번의 경우도 상황은 크게 달라 보이지 않는다. 쓰레기 투척이라는 다소 기발한 착상에 이를 행동으로 옮겼지만 이후 행보가 여의치 않은 국면에 빠질 것이란 분석이 나오는 것도 이런 이유에서다. 무엇보다 윤석열 정부가 확성기를 전방에 설치하는 작업에 착수할 것으로 보이고, 북한의 추가적 도발이 이어지면 즉각 김정은 수령독재와 핵・미사일에 집착해 민생을 외면하는 행태 등을 비판하고 나설 것이 분명해 보인다. 한국 민간단체의 대북전단을 빌미로 오물풍선에 다시 손을 댔다가 자칫 김정은의 아킬레스건을 건드리는 자충수가 될 수 있다. 물론 한국 내 일부 종북・친북 성향 인사나 단체가 북한을 일방적으로 감싸거나 교묘한 양비론적 시각을 펴며 대북전단 중단의 필요성에 무게를 싣는 행태를 보일 수 있지만 악화된 국민의 대북 여론에 힘을 얻기는 어려울 전망이다. 사법부에 의해 '표현의 자유' 제약으로 대북전단금지법이 효력을 잃은데다 폐쇄적 체제에서 외부 정보에 목말라하는 북한 주민들에게 실상을 있는 그대로 전달하는 움직임을 막을 수 없다는 점도 북한에게는 불리한 형국이다. yjlee@newspim.com 2024-06-03 08:35
안다쇼핑
Top으로 이동