인간 전문가 점수 89.8% 넘은 첫 AI 모델
성능·규모 따라 울트라·프로· 나노 3가지 버전 출시
경쟁작 GPT-4 테스트에 32개 항목 중 30개 '능가'
[휴스턴=뉴스핌] 고인원 특파원= 구글이 오픈AI의 챗GPT-4에 맞설 대항마로 생성형 AI(인공지능) 모델 '제미나이(Gemini)'를 5일(현지시간) 전격 공개했다.
이날 구글은 제미나이 출시를 알리며 "인간 전문가도 뛰어넘은 첫 AI 모델"이라고 설명했다. 경쟁작인 챗GPT-4와의 성능 테스트에서도 더 나은 점수를 받았다고 밝혔다.
구글 제미나이를 소개하는 순다르 피차이 구글 CEO, 자료=유튜브, 2023.12.07 koinwon@newspim.com |
구글은 5일 온라인 기자간담회를 통해 제미나이의 성능과 각종 지표를 공개했다. 당초 언어 오류가 발생해 내년 초로 출시가 연기될 거라고 예상됐지만, 최근 치열한 생성형 AI 개발 경쟁 속에 출시를 앞당긴 것으로 보인다.
제미나이는 챗GPT처럼 텍스트, 이미지, 음성 등을 동시에 처리하는 '멀티모달(Multi Modal)' AI 모델이다. 수학 문제를 풀고, 틀린 추론 과정을 분석하는 것도 가능하다.
데미스 허사비스 구글 딥마인드 최고경영자(CEO)는 "제미나이는 MMLU(대규모 다중작업 언어 이해)에서 90%의 점수를 얻었다"며 "인간 전문가 점수인 89.8%를 넘은 첫 AI 모델"이라고 밝혔다.
MMLU는 수학, 물리학, 의학, 역사, 윤리, 법률 등 50여 개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다. 같은 테스트에서 오픈 AI의 최신 대규모언어모델(LLM)인 GPT-4는 86.4%의 정답률을 보였다.
◆ 제미나이, 성능·규모에 따라 3가지 버전으로 출시...프로·울트라 나노 오늘부터 사용 가능
'제미나이는 크기와 성능에 따라 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 ①'제미나이 울트라', 구글의 AI 챗봇 '바드'의 중추가 될 ②'제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 가장 컴팩트한 사이즈의 ③'울트라 나노'다.
제미나이의 초기 버전은 6일부터 구글의 바드에서 영어를 기반으로 170개 이상의 국가와 지역에서 사용 가능하다.
구글은 여러 경로를 통해 이날 제미나이 초기 버전을 공개했는데, 당장 구글 바드가 6일부터 프로를 기반으로 구동되며, 구글의 최신 스마트폰 '픽셀8 프로' 사용자들은 나노의 일부 기능을 사용할 수 있다. 가장 강력한 데이터 센터용 울트라는 내년 출시된다.
또한 개발자들이나 기업 고객들은 오는 12일부터 구글의 기업용 생성 AI 플랫폼 '버텍스 AI'에서 제미나이 프로를 사용할 수 있다.
순다르 피차이 CEO는 구글의 최종 목표는 구글의 검색 엔진, 광고 제품, 크롬 브라우저에 제미나이를 결합해 전 세계에서 사용 가능하도록 하는 것이라고 밝혔다.
◆ 32개 항목 중 30개에서 GPT-4 능가...'멀티 모달리티' 강점
구글의 제미나이 출시는 챗봇 바드 출시 이후 8개월 만이며, 생성형 AI의 선두 주자로 평가되는 오픈AI의 챗 GPT-3.5 출시 1년 만이다. 지난 3월에는 챗 GPT-3.5의 업그레이드 버전인 GPT-4.0이 출시됐다.
생성형 AI 시장을 둘러싼 빅테크 간 경쟁이 갈수록 치열해지면서 누가 AI 생태계를 먼저 장악할지에 시장의 관심이 쏠리고 있다. 가장 뛰어난 성능을 가진 AI를 내놓는 회사가 선두 지위를 차지할 가능성이 높은 만큼 제미나이의 성능에도 관심이 쏠릴 수밖에 없다.
이와 관련해 구글은 제미나이 출시에 앞서 GPT4와 제미나이의 성능을 비교하는 테스트를 했으며, 그 결과 LLM 성능을 평가할 때 사용하는 32개 항목 중에서 제미니가 30개 항목에서 GPT-4를 뛰어넘었다고 밝혔다.
특히 제미나이는 비디오 및 오디오를 이해하고 상호 작용하는 데 강점을 드러낸 것으로 알려졌다. 이는 설계 단계부터 구글이 '멀티 모달리티'를 염두에 둔 것이기에 가능한 결과다.
구글은 오픈AI가 달리(DALL-E:이미지 생성 AI)와 위스퍼(Whisper:음성 인식 AI)를 개발한 방식처럼 이미지와 음성을 위한 별도의 모델을 학습시키지 않고 처음부터 하나의 다중 감각 모델을 구축했다.
다양한 입력과 감각으로부터 최대한 많은 데이터를 수집하고 그에 맞춰 다양한 답변을 내놓도록 여러 모드를 통합해 소프트웨어가 아닌 진짜 (인간) 협력자처럼 느껴지는 AI를 목표로 제미나이를 구상했다는 의미다.
이날 구글은 제미나이의 내부 테스트 영상도 공개했다. 아이들의 물리 숙제를 제미나이가 도와주는 모습이 담겼는데 아이들이 푼 문제의 답을 업로드하면, 제미나이가 오답 여부와 이유를 분석해준다. 틀린 부분과 연관된 맞춤형 연습 문제도 제공한다.
구글 바드 [사진=블룸버그] |
구글은 제미나이를 두 단계에 걸쳐 바드에 적용한다는 계획이다. 당장 오늘부터 바드 영어 버전에 제미나이 프로가 적용되며, 내년에는 제미나이 울트라를 적용한 '바드 어드밴스드'도 선보일 예정이다.
구글 어시스턴트 및 바드 부사장인 시시 샤오는 "제미나이를 통해 바드는 역대 최대 규모의 최고의 업그레이드를 받게 될 것이며, 사람들이 창작하고 소통하고 협업할 수 있는 새로운 방법을 열어줄 것"이라고 밝혔다.
블룸버그, 로이터통신 등 외신은 구글의 제미나이 출시를 소개하며 구글을 인터넷 공룡으로 성장시킨 구글 검색 엔진의 핵심인 '페이지 랭크 알고리즘'에 이어 구글 역사상 두 번째로 중요한 알고리즘이 될 수도 있다고 전했다.
순다르 피차이 구글 CEO와 데미스 하사비스 구글 딥마인드 CEO 역시 이날 제미나이의 출시를 알리며 "궁극적으로 구글의 거의 모든 제품에 영향을 미칠 AI 모델의 큰 도약"이라고 강조했다.
koinwon@newspim.com