[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개하면서 세상을 깜짝 놀라게 했다.
제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '울트라', 구글의 AI 챗봇 '바드'의 모델인 '프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.
구글 AI조직 딥마인드에 따르면 '제미나이 울트라'는 LLM 평가시 AI 업계에서 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 능가했다.
특히 제미나이 울트라는 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 90% 이상의 정답률을 기록, GPT-4(87.29%) 보다 월등히 높았다.
MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.
사실이라면 '제미나이 울트라'는 현존하는 가장 강력한 성능의 AI 모델이 된다. 오픈AI가 최신 GPT-4를 세상에 내놓은 지 약 9개월 만이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지피게 됐다. 제미나이의 등장은 단순한 기술 개발 경쟁을 떠나 업계의 판도를 뒤흔들 수 있다는 분석이 나온다.
[사진= 구글 홈페이지] |
◆ 무료 배포된 '제미나이 바드'도 챗GPT 능가
구글은 제미나이를 공개한 6일 곧바로 챗봇 '바드'에 '제미나이 프로'를 탑재했다. 구글은 제미나이 울트라뿐만 아니라 프로도 'GPT-3.5' 구동의 챗GPT 보다 성능이 좋다고 주장한다.
시시 샤오 구글 어시스턴트 및 바드 부사장 겸 총괄은 "제미나이 프로가 8개 벤치마크 중 6개에서 GPT-3.5를 넘어섰다"고 밝혔다.
구체적으로 제미나이 프로의 MMLU 점수는 79.13%로 GPT-3.5(70%)보다 9.13% 높았고, 방대한 학교 수학 문제 데이터로 텍스트 이해도를 평가하는 GSM8K 벤치마크에서는 86.5%를 기록해 GPT-3.5 보다 무려 29.4%포인트(P) 높았다.
이 밖에 여러 단계의 추론을 요구하는 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard), 독해력 벤치마크인 DROP, 코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval), 파이선(Python) 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 등 제미나이 프로는 여러모로 GPT-3.5를 앞섰다는 주장이다.
제미나이 프로의 높은 벤치마크 점수도 관심이지만 네티즌들의 관심은 제미나이의 '태생적 멀티모달(natively multi-modal)'에 있다. 오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오·동영상 등 다양한 데이터로 제미나이를 훈련해 왔다.
구글은 제미나이 프로 구동의 바드에 점진적으로 이미지, 오디오, 동영상 프롬프트 기능을 추가할 예정이다. 현재는 텍스트, 이미지 프롬프트만 제공하고 있다.
구글이 완전한 멀티모달 바드를 내놓는다면 이는 세계에서 가장 널리 쓰이는 첫 멀티모달 챗봇이 될 전망이다.
기자가 8일 제미나이 프로 구동의 바드에 고양이 이미지와 함께 어떤 종류인지 질문하니 숏헤어종이란 답변을 받은 모습. [사진=바드] |
◆ "물 들어올 때 노 젓는다" 구글, '제미나이 생태계' 구축에 박차
구글은 자사 AI 모델의 성능이 마이크로소프트(MS)와 협업하는 오픈AI의 모델보다 우수하다는 테스트 결과를 보고서로 적극적으로 홍보한 데 그치지 않고 곧바로 제품 탑재에 나섰다.
'제미나이 프로'를 바드에 결합한 데 이어 구글은 '제미나이 나노'를 자사 스마트폰 '픽셀 8 프로'에 접목했다. 제미나이 나노는 문자 작성 시 이용자가 원하는 답변 문장을 추천해 주는 '스마트 리플라이'(Smart Reply) 기능을 제공한다. 픽셀 8 프로에 있는 구글의 리코더(Recorder) 앱으로 장시간 회의나 강의를 녹음하면 제미나이가 주요 포인트를 요약해 준다.
구글은 앞으로도 제미나이를 자사 제품에 녹일 예정이다. 내년에 출시될 가장 강력한 '제미나이 울트라'는 기업용 제품이지만 그전에 '바드 어드벤스드'란 '챗GPT 플러스'와 같은 유료 버전 챗봇에 먼저 선보인다. 울트라는 멀티모달 검색을 넘어 이미지, 오디오, 동영상을 직접 생성해 줄 것으로 기대를 모은다.
구글은 향후 브라우저 '크롬'과 자사 앱들에도 AI 모델을 접목할 계획이다. 제미나이 생태계 구축을 통해 구글을 업계 선두주자로 발돋움하겠단 취지다.
주요 외신들은 GPT-4보다 뛰어난 제미나이 울트라가 일상에 실질적으로 도움을 줄 수 있는 생성형 AI에 가장 가까운 모델이며, 자사 소프트웨어와 클라우드 서비스에 오픈AI LLM을 채택해 온 구글의 경쟁사 마이크로소프트(MS)에 한방 먹였다고 진단한다.
무엇보다 제미나이가 구글 생태계 구축으로 우리 일상에 깊숙이 자리한다면 오픈AI의 업계 입지가 줄어드는 결과를 낳는다. 크롬은 전 세계 검색 시장에 60% 이상을 차지하고 있다. 이용자들이 크롬에서 제미나이 검색 경험에 익숙해질수록 챗GPT를 사용하기 위해 오픈AI 웹사이트에 접속할 일이 사라진다.
인도 뭄바이의 삼성 휴대폰 매장 [사진=로이터 뉴스핌] |
구글 안드로이드 운영체제(OS)의 세계 시장 점유율은 70%다. 유튜브, G메일, 구글 독스(Docs), 구글 드라이브 등 앱까지 제미나이의 가능성은 그야말로 무궁무진하다.
제프리스는 최근 노트에서 "실질적으로 생성형 AI를 도입하고 있는 이들은 스타트업들과 MS, 구글, 아마존 등 하이퍼스케일러(hyperscaler·대형 클라우드 공급자)들 뿐"이라며 경쟁 상대가 많지 않아 구글이 제미나이로 시장 판도를 흔들 수 있다고 봤다.
최근 샘 올트먼 최고경영자(CEO) 축출 후 그의 복귀와 아직 완성되지 않은 이사진 개편 등 오픈AI가 혼란을 겪는 가운데 리스크 관리를 원하는 고객 기업들이 구글 제미나이로 재고할 수 있다는 관측도 나온다.
일각에서는 제미나이가 GPT 보다 조금 나은 수준이지 혁신적인 수준까진 아니고, 구글이 모델을 훈련한 데이터가 무엇이고, 어떻게 콘텐츠를 필터링했는지 등 정보를 제공하지 않았기에 자체 성능 테스트 결과를 믿지 못하겠단 의혹을 제기한다. AI 모델이 주어진 데이터 또는 맥락에 근거하지 않은 허위 정보를 생성하는 '할루시네이션'(Hallucination) 가능성도 구글이 앞으로 적극 들여다봐야 할 숙제다.
파이낸셜타임스(FT)는 "제미나이는 내년 구글에 큰 시장을 갖고 올 명확한 이점들이 있다"며 구글의 공격적 AI 사업 드라이브에 관해서는 "구글이 (오픈AI에) 뒤처질 의향이 없는 것으로 보인다"고 진단했다.
wonjc6@newspim.com