전체기사 최신뉴스 GAM
KYD 디데이
글로벌·중국 미국·북미

속보

더보기

AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다. 

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다. 

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다. 

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다. 

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다. 

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다. 

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다. 

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다. 

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다. 

[사진= 구글 홈페이지]

wonjc6@newspim.com

 

[뉴스핌 베스트 기사]

사진
'마이 케이팝 스타' 예선 영상 공개 [서울=뉴스핌] 정태이 기자 = 종합뉴스통신사 뉴스핌이 주최·주관하는 글로벌 오디션 프로그램 '마이 케이팝 스타(MY KPOP STAR)'의 예선 진출자 10팀의 영상이 24일 공개됐다. 이번에 공개된 국내 참가자는 개똥(류진), 마틴(MARTI:N), 박희주, 차밍(Mingi Cha), 김승주(캐치)이며, 해외 참가자는 제이엑스알(JXR, 태국), 앨리스(Alice, 러시아), 하린(Harin, 독일), 젤리캣(JELLYCAT, 미얀마), 케이시야 탄(Keisya Tan, 인도네시아) 등이다. [서울=뉴스핌] 정태이 기자 = 마이 케이팝 스타 예선 진출자들의 모습 2026.06.23 taeyi427@newspim.com 이번 예선에서는 다양한 국적을 가진 지원자들의 개성 있는 모습을 만나볼 수 있다. 우선 국내 참가자인 개똥(류진)은 감미로운 목소리로 마로니에의 '칵테일 사랑'을 가창했으며, 마틴(MARTI:N)은 숀의 '웨이 백 홈(Way Back Home)'을 선보였다. 박희주는 에일리의 '첫눈처럼 너에게 가겠다'와 베이비몬스터의 '위 고업(WE GO UP)'을 통해 반전 매력을 보여준다. 차밍은 지코의 '터프쿠키(Tough Cookie)'를, 김승주(캐치)는 캔트비블루(Can't be blue)의 '첫 눈에 널 사랑할 수는 없었을까'와 롱샷(LNGSHOT)의 '문워킨(moonwalkin')'을 부르며 폭발적인 가창력을 뽐냈다. 해외 참가자들의 활약도 돋보인다. 제이엑스알(JXR)은 언차일드의 '언차일드(UNCHILD)'를 파워풀한 댄스와 함께 선보이며 탄탄한 가창력을 증명했다. [서울=뉴스핌] 정태이 기자 = 마이 케이팝 스타 예선 진출자들의 모습 2026.06.23 taeyi427@newspim.com 앨리스는 베이비몬스터의 '드림(Dream)'을, 하린은 제니의 '라이크 제니(like JENNIE)'를, 젤리캣은 블랙핑크의 '핑크 베놈(Pink Venom)'을 본인만의 스타일로 재해석했다. 케이시야 탄 역시 전소미의 '덤덤(DUMB DUMB)'으로 눈도장을 찍을 예정이다. 화려한 경력을 자랑하는 참가자들도 눈에 띈다. 개똥(류진)은 JTBC '싱어게인2' 27호 가수 출연, Mnet '포커스' 출연, TBS '박스가왕 왕중왕전' 최종 우승 등 화려한 방송 이력을 가진 지원자다. 박희주 역시 영종청소년가요제(장려상), 광주시민가요제(대상), 용인명품가요제(장려상), 전국호수예술제(우수상) 등 여러 가요제를 휩쓴 인재다. 차밍(Mingi Cha) 또한 대구 끼페스티벌에서 12팀 중 3위를 차지했을 정도로 뛰어난 실력을 갖추고 있다. [서울=뉴스핌] 정태이 기자 = 마이 케이팝 스타 예선 진출자들의 모습 2026.06.23 taeyi427@newspim.com 이번 대회는 온라인 예선을 시작으로 온라인 라이브 본선, 오프라인 결선 순으로 진행된다. 최종 우승자 1명에게는 1억 원의 상금이 주어지며, 국내 참가자 중 2~10위에게는 각 200만 원의 상금이 수여된다. 해외 참가자에게는 결선 진출 시 왕복 항공권과 숙박비 등 체류 비용 전액을 지원하는 파격적인 혜택이 제공된다. 이 밖에도 글로벌 쇼케이스 및 공연 참여 기회, 언론 홍보와 인터뷰, 국내 엔터테인먼트사의 현장 캐스팅 등 다채로운 특전이 마련됐다. 아울러 전문 보컬·댄스 트레이닝 프로그램과 K팝 안무를 활용한 숏폼 콘텐츠 제작 지원 등 참가자들의 성장을 도울 다양한 프로그램도 운영될 예정이다. '마이 케이팝 스타' 예선 진출자들의 영상은 4주에 걸쳐 매일 10팀씩 순차적으로 업로드된다. 진출자들은 앞으로 2주간 영상의 '조회수'와 '좋아요' 수를 기반으로 한 평가를 받게 되며, 이를 통해 본선 진출 여부가 판가름 난다. taeyi427@newspim.com 2026-06-24 11:00
사진
심우정 前검찰총장, 종합특검 첫 출석 [과천=뉴스핌] 김영은 기자 = 12·3 비상계엄 당시 계엄 합동수사본부(합수부)에 검사 파견을 검토했다는 의혹을 받는 심우정 전 검찰총장이 24일 2차 종합특별검사팀(종합특검)에 출석했다. 심 전 총장이 종합특검 조사를 받는 것은 이번이 처음이다. 심 전 총장은 이날 오전 9시38분께 경기 과천시 종합특검 사무실에 내란중요임무종사 등 혐의 피의자 신분으로 출석했다. 그는 '계엄사령부(계엄사) 합수부에 검사 파견을 지시했느냐', '법원이 검찰의 내란 가담 정황이 있다고 판단했는데 입장이 있느냐', '계엄 당일 박성재 전 법무부 장관과 어떤 통화를 했느냐'는 취재진 질문에 아무런 답을 하지 않았다. [과천=뉴스핌] 김영은 기자 = 12·3 비상계엄 당시 계엄 합동수사본부(합수부)에 검사 파견을 검토했다는 의혹을 받는 심우정 전 검찰총장이 24일 2차 종합특별검사팀(종합특검)에 출석했다. 심 전 총장은 윤석열 전 대통령 구속취소 결정에 즉시항고를 제기하지 않은 이유 등에 대해서도 묵묵부답한 채 이동했다. 심 전 총장은 2024년 12월 3일 비상계엄 당시 박 전 장관의 지시로 계엄사 합수부에 검사 등 인력 파견을 검토한 혐의를 받는다. 박 전 장관은 계엄 선포 직후 법무부로 돌아와 간부회의를 소집해 '합수부 검사 파견 검토'를 지시했고, 이후 심 전 총장과 세 차례 통화한 것으로 알려졌다. 이와 관련해 서울중앙지법 형사합의33부(재판장 이진관)는 지난 22일 박 전 장관에게 징역 25년을 선고하면서, 박 전 장관이 계엄 선포 직후 심 전 총장에게 전화해 인력 파견 요청을 지시했고 심 전 총장이 소관 부서에 이를 이행하도록 했다고 판단했다. 검찰청법상 검사 파견 시 장관이 총장 의견을 들어야 하는 만큼, 박 전 장관이 심 전 총장에게 협조를 구할 필요가 있었다는 취지다. 심 전 총장은 또 윤 전 대통령의 구속취소 결정 이후 즉시항고를 제기하지 않은 혐의도 받는다. 아울러 김건희 여사가 연루된 도이치모터스 주가조작·디올백 수수 의혹 사건 수사를 무마하는 데 관여했다는 혐의도 있다. 종합특검은 이날 심 전 총장을 상대로 그가 계엄 이후 검사 파견을 지시했는지 여부, 총장 시절 직권을 남용했는지 여부 등을 구체적으로 조사할 방침이다. [과천=뉴스핌] 류기찬 기자 = 내란 가담 혐의를 받는 심우정 전 검찰총장이 24일 오전 경기 과천시 2차 종합특검 사무실에 피의자 조사를 받기 위해 출석하고 있다. 2026.06.24 ryuchan0925@newspim.com yek105@newspim.com 2026-06-24 09:55
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동