전체기사 최신뉴스 GAM
KYD 디데이
글로벌 일본

속보

더보기

AI의 무서운 진화...도쿄대 입시 '합격 수준' 도달

기사입력 : 2025년03월11일 09:50

최종수정 : 2025년03월11일 09:50

[서울=뉴스핌] 오영상 기자 = 2022년 11월 오픈AI가 챗GPT를 세상에 내놓은지 2년여가 지났다. 기업은 물론 국가까지도 AI를 핵심 전략으로 삼고 있는 지금 AI는 과연 어디까지 진화했을까.

11일 니혼게이자이신문은 이제 AI는 일본에서 가장 난이도가 높다는 도쿄대학교 2차 시험의 수학 문제를 '합격 수준'으로 풀 수 있게 됐다고 전했다.

AI 이미지 [사진=픽사베이]

◆ 'o1' 등 추론 모델 등장하며 AI 급진화

지금까지 다른 과목에 비해 수학은 AI가 약한 분야였으며, 오픈AI의 초기 대화형 AI인 챗GPT는 간단한 산수 문제에서도 실수를 자주 범했다. 하지만 2024년 9월 이후 오픈AI의 'o1', 'o3' 등 추론 모델로 불리는 AI들이 속속 등장하면서 상황이 급변했다.

일본국립정보학연구소의 아라이 노리코 교수는 "o1은 2025년 2월 출제된 도쿄대 2차 시험의 이과 수학 문제뿐만 아니라 과거의 난이도 높은 문제들도 거의 풀어낼 수 있다"며 "도쿄대의 합격선을 넘어 상위 합격자 수준에 도달한 것 같다"고 말했다.

2024년 2월까지만 해도 챗GPT는 도쿄대 수학 문제를 전혀 풀지 못했다. 하지만 1년 만에 비약적인 발전을 이룬 것은 추론 모델의 등장 덕분이다. 추론 모델은 단순한 대규모 언어 모델(LLM)이 아니라 수학 등 논리적 사고가 필요한 문제 해결에 특화된 AI다.

o1과 o3 외에도 중국 딥시크의 'R1', 일론 머스크가 이끄는 xAI의 'Grok(그록) 3', 앤스로픽의 'Claude(클로드) 3.7 소넷' 등이 추론 능력이 뛰어난 모델로 평가된다.

오픈AI 챗GPT와 딥시크.[사진=로이터 뉴스핌]

◆ 美 수학올림피아드 정답률 90%에 육박

미국 수학올림피아드(AIME)의 정답률을 보면 AI의 급격한 발전이 더욱 뚜렷하게 드러난다.

2024년 5월 오픈AI가 발표한 'GPT-4o'의 AIME 정답률은 9.3%에 불과했다. 하지만 같은 해 9월 출시된 'o1 프리뷰'는 56.7%로 높아졌다, 이어 12월 정식 버전 o1은 83.3%, 2025년 1월 발표된 o3-mini는 87.3%로 급격히 향상됐다. R1과 그록 3의 정답률도 80~90%에 도달했다.

수학이나 프로그래밍과 같이 논리적 사고가 필요한 문제에서 추론 모델이 높은 성과를 낼 수 있는 메커니즘은 아직 명확하게 밝혀지지 않았다.

다만 올바른 추론을 했을 때 보상을 주는 '강화 학습', 문제를 단계별로 해결하는 '사고의 연쇄', 그리고 추론에 필요한 계산량(계산 시간) 증가 등의 기술이 성능 향상의 요인으로 꼽히고 있다.

추론 모델의 수학적 성능이 높다고 해도, 아직 인간 수학자처럼 극도로 어려운 문제를 해결하거나 새로운 정리를 창출할 수 있는 수준에는 이르지 못했다.

니혼게이자이는 "인간처럼 광범위한 지적 활동을 수행할 수 있는 범용 인공지능(AGI)이나, 인간 능력을 월등히 초월하는 인공지능(ASI)의 실현을 위해서는 여전히 기술적 돌파구가 필요하다"고 지적했다.

goldendog@newspim.com

[뉴스핌 베스트 기사]

사진
[단독] 李정부 국정 5개년 책자 나왔다 [서울=뉴스핌] 윤채영 지혜진 기자 = 이재명 정부의 국정운영 5개년 계획이 담긴 책자가 발간된 것으로 20일 확인됐다. 이날 뉴스핌이 확보한 '이재명 정부 국정운영 5개년 계획(안)' 책자에는 123대 국정과제에 대한 주요 내용과 구체적인 입법 방향 등이 담겼다. [서울=뉴스핌] 이재명 대통령이 13일 서울 종로구 청와대 영빈관에서 열린 국정기획위원회 국민보고대회에서 발언하고 있다. [사진=대통령실] 2025.08.13 photo@newspim.com 국정기획위원회가 지난 13일 1호 과제로 발표한 개헌에는 대통령 권력 구조 개편도 포함됐다. ▲4년 연임제 및 결선투표제 도입 ▲감사원 국회소속 이관 ▲대통령 거부권 제한 ▲비상명령 및 계엄 선포 시 국회 통제권 강화 ▲국무총리 국회 추천제 도입 ▲중립성 요구 기관장 임명 시 국회 동의 의무화를 추진하겠다고 명시했다. 또 5·18 광주 민주화운동 정신 등 헌법 전문 수록과 검찰 영장 청구권 독점 폐지, 안전권 등 기본권 강화 및 확대, 지방자치와 균형발전을 위한 논의기구 신설, 행정수도 명문화 등이 개헌 과제로 포함됐다. 개헌을 위한 국민투표법 개정도 추진된다. 헌법불합치 결정을 받은 재외국민 투표 관련 규정을 개정해 국민투표법 위헌을 해소하겠다는 계획이다. 개헌 찬반 투표는 2026년 지방선거나 2028년 국회의원 선거 때 실시하겠다고 명시했다. [서울=뉴스핌] 뉴스핌이 확보한 이재명 정부 국정운영 5개년 계획(안) 책자. 2025.8.20 ycy1486@newspim.com 이번 책자에는 국정기획위가 지난 13일 대국민보고대회에서 공개한 123대 국정과제보다 훨씬 세부적인 내용이 담겼다. 당초 국정위는 이날 국정운영 5개년 계획도 공개하려 했다가, 돌연 비공개 결정을 내렸다. 비공개 결정에는 이재명 대통령의 의중이 강하게 작용한 것으로 알려졌다. 국정위 소속으로 활동했던 한 위원은 뉴스핌과 통화에서 "갑자기 보안을 강조하면서 내부 자료는 절대 공개하지 말라고 했다"며 "이유는 모른다"고 전했다.  ycy1486@newspim.com 2025-08-20 15:55
사진
美, 인텔 이어 삼성도 지분 내놔라? [서울=뉴스핌] 최원진 기자= 도널드 트럼프 미국 행정부가 반도체법(CHIPS Act)상 보조금을 활용해 인텔 지분 확보를 추진 중인 가운데, 삼성전자와 대만 TSMC 등 다른 반도체 기업에도 같은 방식을 적용하는 방안을 검토 중이라고 로이터 통신이 두 명의 소식통을 인용해 19일(현지시간) 보도했다. 보도에 따르면 하워드 러트닉 상무부 장관은 삼성전자, 마이크론, TSMC 등 미국 내 공장 건설과 투자를 진행 중인 반도체 기업들을 상대로, 조 바이든 전임 행정부 시절 약속된 정부 보조금 제공과 맞바꿔 지분을 확보하는 방안을 모색하고 있다. 현실화하면 글로벌 반도체 업계에 파장이 불가피하다. 미국 정부에 지분을 넘기고 싶지 않다면 보조금을 포기해야 할 수 있는데 이 경우 기업들의 순익 전망과 투자 계획도 차질을 빚을 수 있다. 미국의 산업정책이 정권에 따라 오락가락한다는 업계의 불만과 비난 또한 커질 수 있지만 트럼프 행정부의 성격상 귀담아 들을 가능성은 높지 않다. 러트닉 장관은 CNBC 인터뷰에서 "트럼프 대통령은 미국이 거래에서 실질적 이익을 얻어야 한다고 본다"며 "왜 1천억 달러 규모의 기업에 돈을 줘야 하는가. 우리는 약속한 보조금을 지급하되, 그 대가로 지분을 받아 미국 납세자들에게 혜택을 돌릴 것"이라고 말했다. 트럼프 행정부가 인텔 지분 10%를 확보할 경우 최대 주주가 될 수 있지만, 러트닉 장관은 "경영권에 개입하지는 않을 것"이라고 선을 그었다. 그럼에도 불구하고 이러한 조치는 전례가 없는 것이며, "이는 대기업에 대한 미국의 영향력 확대라는 새로운 시대를 열게 될 것"이란 진단이다.  로이터는 "마이크론은 인텔에 이어 반도체법 보조금을 가장 많이 받는 미국 기업이며, 삼성전자와 TSMC 역시 주요 수혜 대상"이라며 "이번 검토는 미국 정부가 반도체 산업에 대한 직접적 영향력을 확대하려는 움직임"이라고 분석했다. 올해 6월에도 비슷한 조치가 있었는데, 트럼프 정부는 일본제철의 U.S.스틸 인수 승인 조건으로 '황금주(golden share)'를 확보해 주요 경영 결정에 거부권을 행사할 수 있게 됐다. 삼성전자 미국 텍사스주 테일러 공장 건설 현장. [사진=삼성전자] wonjc6@newspim.com   2025-08-20 08:31
안다쇼핑
Top으로 이동