AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 : 2023년12월07일 14:53

최종수정 : 2023년12월08일 07:49

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다.

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다.

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다.

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다.

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다.

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다.

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다.

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다.

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다.

wonjc6@newspim.com

[관련기사]

[관련키워드]

제미나이

GAM - 해외주식 투자 도우미

[AI의 종목 이야기] 페덱스, 미국 시총 최대 물류사 등극...UPS 추월

"넷플릭스, 인수전 패했어도 주식시장선 승자"

[홍콩 대장주] 메이퇀 ③ 신성장 동력의 '폭발적 성장'

[홍콩 대장주] 메이퇀② 실적은 고속 상승, 밸류는 역대 저점

[뉴스핌 베스트 기사]

사진

한국, 호주 꺾고 기적의 미국행 [서울=뉴스핌] 이웅희 기자·한지용 인턴기자=한국 야구 대표팀이 정규이닝 기준 2실점 이하 5점 이상으로 승리해야 하는 어려운 상황을 기어이 극복했다. 2009년 이후 17년 만에 월드베이스볼클래식(WBC) 8강에 극적으로 진출했다. 한국은 9일 일본 도쿄돔에서 열린 2026 WBC 1라운드 C조 조별리그 마지막 4차전 호주와의 경기에서 7-2로 승리했다. [도쿄 로이터=뉴스핌] 한지용 인턴기자 = 한국 선수단이 9일 일본 도쿄돔에서 열린 2026 WBC 1라운드 C조 조별리그 4차전 호주전 승리 직후 기뻐하고 있다. 2026.03.09 football1229@newspim.com 한국은 이날 승리로 2승 2패를 기록해 일본(4승)에 이어 조 2위로 결선 라운드에 진출을 확정했다. 마찬가지로 2승 2패를 기록한 대만, 호주와 승점 동률을 이뤘으나, 한국이 최소 실점에서 앞섰다. 한국은 김도영(KIA·3루수)-저마이 존스(디트로이트·좌익수)-이정후(샌프란시스코·중견수)안현민(KT·우익수)-문보경(LG·지명타자)-노시환(한화·1루수)-김주원(NC·유격수)-박동원(LG·포수)-신민재(LG·2루수)로 이어지는 라인업을 가동했다. 한국의 류지현 감독은 전날 선발 무안타로 부진했던 위트컴과 김혜성 대신 노시환과 신민재를 투입했다. 선발투수로 손주영(LG)이 나섰다. 선취점은 한국의 차지였다. 2회초 안현민이 안타를 치고 나간 후 문보경이 선제 투런 홈런을 터뜨렸다. 시속 136.8km의 슬라이더를 공략해 우중간을 넘겼다. 비거리 130m의 큰 타구였다. 3회에도 한국은 추가점을 뽑았다. 존스와 이정후의 연속 2루타로 3-0으로 앞서나갔고, 이후 3회 1사 2루 상황에서 문보경이 1타점 2루타를 터트려 4-0까지 달아났다. [도쿄 로이터=뉴스핌] 한지용 인턴기자 = 문보경이 9일 일본 도쿄돔에서 열린 2026 WBC 1라운드 C조 조별리그 4차전 호주전에서 2루타를 친 후 비행기 세리머니를 하고 있다. 2026.03.09 football1229@newspim.com 한국은 5회 첫 실점했다. 손주영, 노경은의 뒤를 이어 4회부터 마운드에 오른 소형준이 5회 선두 타자 로비 글렌디닝에게 좌중간 담장을 넘기는 솔로포를 맞았다. 하지만 소형준은 후속 타자를 안정적으로 처리하고 마운드를 박영현에게 넘겼다. 6회초 한국은 1점 더 추가햇다. 1사 무사 상황에서 박동원이 펜스 직격 2루타를 쳤다. 신민재가 3루수 라인드라이브로 물러났으나, 김도영 타석에서 투수 폭투로 2루 주자 박동원이 3루로 진루했다. 이후 김도영이 우전 적시타를 뽑았다. 한국은 6-1로 점수 차를 벌렸다. [도쿄 로이터=뉴스핌] 한지용 인턴기자 = 이정후가 9일 일본 도쿄돔에서 열린 2026 WBC 1라운드 C조 조별리그 4차전 호주전에서 득점한 이후 동료들과 하이파이브 하고 있다. 2026.03.09 football1229@newspim.com 박영현이 6회를 깔끔하게 막은 후 7회 데인 더닝(시애틀)이 등판했다. 그러나 선두타자를 볼넷으로 내보낸 후 후속 타자의 땅볼을 유도했으나 배트 끝에 맞아 내야 안타로 연결되고 말았다. 무사 1, 2루 상황에서 전 타석 홈런을 쳤던 글렌디닝을 상대했지만, 더닝은 침착했다. 유격수 앞 땅볼을 유도해 병살을 만든 후 릭슨 윈그로브를 3구 삼진 처리하며 포효했다. 그러나 8회말 대표팀은 추가 실점을 했다. 바뀐 투수 김택연이 선두 타자를 볼넷으로 출루시켰고, 이후 상대 희생 번트 작전으로 1사 2루 실점 위기에 놓였다. 이어 트레비스 바자나에 적시타를 맞고 말았다. 6-2가 된 상황, 김택연 대신 등판한 조병현이 스트레이트 볼넷을 내줬지만, 후속 타자를 삼진과 내야 플라이로 처리해 추가점을 허용하지 않았다. 한국은 6-2로 앞선 가운데 8강 진출을 위해 반드시 1점을 뽑아야 하는 상황에서 운명의 9회를 맞이했다. 선두타자 김도영이 볼넷을 골라내며 출루했고, 박해민이 김도영 대신 대주자로 나섰다. 2번 타자 존스가 우익수 플라이로 아웃된 후 이정후가 땅볼을 쳤다. 하지만 투수 글러브를 맞고 흐른 공을 유격수 데일이 잡았으나 악송구 실책을 범했다. 이 공이 우익수까지 빠졌고, 이 틈을 타 박해민은 3루까지 진출했다. 이어 조별리그 내내 타점이 없던 안현민이 우익수 방면 희생플라이로 경우의 수 마지노선인 7-2를 완성했다. 9회 마운드는 조병현이 그대로 지켰다. 조병현은 선두타자 데일을 풀카운트 승부 끝에 루킹 삼진을 만들었다. 그러나 다음 타자 크리스 버크에게 볼넷을 내줬다. 다음 타자 윙그로브가 우익수 방향으로 강한 타구를 보냈지만, 이정후가 전력질주로 잡아내 2아웃을 만들었다. 호주는 대타 로건 웨이드를 냈지만, 내야 뜬공을 문보경이 잡아냈다. 극적으로 17년 만에 WBC 8강 진출을 이룬 순간 한국 선수들은 마운드로 뛰쳐 나와 기쁨을 나눴다. [도쿄 로이터=뉴스핌] 한지용 인턴기자 = 한국 선수단이 9일 일본 도쿄돔에서 열린 2026 WBC 1라운드 C조 조별리그 4차전 호주전에서 승리 직후 기뻐하고 있다. 이날 4타점을 친 문보경(왼쪽 상단)이 마지막 아웃카운트를 잡았다. 2026.03.09 football1229@newspim.com2026.03.09 football1229@newspim.com 타선에서는 문보경 이날 5타수 3안타 1홈런 4타점을 기록하며 한국 8강 진출을 이끌었다. 이정후도 5타수 2안타 1타점 1득점을 기록했고, 9회 결정적인 수비로 팀의 승리를 도왔다. 전날 영웅이었던 김도영도 1안타 1볼넷 1타점으로 힘을 보탰다. 한국 마운드는 지난 조별리그 경기와 달리 좋은 모습을 보였다. 선발 손주영이 두 명의 주자를 내보냈지만 후속타자 두 명을 범타 처리하며 1회를 무실점으로 막았다. 손주영의 갑작스런 부상 속에 2회 등판한 노경은은 2이닝을 삼자범퇴 처리하며 베테랑의 관록을 보여줬다. 4회부터 5회까지 던진 소형준은 솔로홈런을 내줬지만 이외에 주자를 출루시키지 않았다. 6회와 7회는 박영현과 데인 더닝이 무실점으로 막았다. 8회 김택연이 1실점 했지만, 조병현이 1.2이닝을 무실점으로 막고 끝까지 버텨냈다. football1229@newspim.com 2026-03-09 22:41

사진

모텔 연쇄살인 피의자 신상 공개 [서울=뉴스핌] 조준경 기자 = 검찰이 강북 모텔 연쇄살인 20대 여성 피의자의 신상을 공개했다. 서울북부지검은 9일 신상정보공개심의위원회를 열고 강북 모텔 연쇄살인 사건 피의자 김소영(20) 씨 이름과 나이, 머그샷을 공개했다. 신상은 이날부터 오는 4월 8일까지 30일간 공개된다. [사진=서울북부지방검찰청] 강북 모텔 연쇄살인 피의자 20세 김소영 중대범죄신상공개법에 따라 검찰은 강력범죄 등 특정중대범죄 혐의가 있는 피의자를 신상정보공개심의위원회에 회부해 신상 공개 여부를 결정할 수 있다. 김씨는 지난해 12월 중순부터 지난달 9일까지 20대 남성 3명에게 벤조디아제핀계 약물이 든 음료를 건네 의식을 잃게 하거나 사망에 이르게 한 혐의(살인·마약류관리법 위반 등)를 받는다. 피해자들 중 2명은 숨졌고 1명은 치료를 받고 회복한 것으로 알려졌다. 김씨는 경찰 조사에서 병원에서 처방받은 약물을 숙취해소제에 타서 들고 다녔다고 진술했다. 또 남성들에게는 모텔 등에서 의견이 충돌해 이를 건넸다고 주장했다. 그러나 경찰은 김씨가 첫 범행 이후 약물 양을 늘렸다고 진술한 점, 휴대전화 포렌식 자료 등을 볼 때 사망 가능성을 충분히 인지했던 것으로 판단하고 상해치사가 아닌 살인죄를 적용해 지난달 19일 검찰에 송치했다. 경찰은 김 씨가 피해 남성으로부터 고급 식사 등을 제공받는 등 본인 경제력으로는 불가능한 경험을 할 기회로 삼은 것으로 보고 있다. 김씨가 사이코패스에 해당한다는 결과도 나왔다. 서울 강북경찰서는 김 씨에 대한 사이코패스 진단 평가(PCL-R) 결과 사이코패스에 해당한다는 판명 결과를 검찰에 송부했다. 사이코패스 진단검사는 냉담함, 충동성, 공감 부족, 무책임 등 사이코패스 성격적 특성을 지수화해서 도출한다. 총 20문항으로 이뤄졌으며 40점 만점이다. 통상 25점 넘으면 사이코패스로 분류되는데 김씨는 기준치 이상 점수를 받았다고 알려졌다. 한편 피해자로 추정되는 남성 2명이 추가로 드러나면서 경찰은 김 씨 여죄를 수사 중이다. calebcao@newspim.com 2026-03-09 14:40