전체기사 최신뉴스 GAM
KYD 디데이
글로벌 기타

속보

더보기

"딥시크 최신 버전, 코딩 능력에서 오픈AI 압도"

기사입력 : 2025년05월30일 10:51

최종수정 : 2025년05월30일 10:52

[베이징=뉴스핌] 조용성 특파원 = 중국의 AI 업체인 딥시크(DeepSeek)가 공개한 추론 AI 모델인 R1의 업그레이드 버전이 일부 영역에서 오픈AI의 성능을 앞섰다는 주장이 나오고 있다.

딥시크는 지난 1월 R1 모델을 공개하며 전 세계에 이른바 '딥시크 충격'을 안겼다. 이어 딥시크는 R1의 업그레이드 버전을 지난 28일 밤 공개했다. 업그레이드 버전의 명칭은 공개일을 사용해 'R1-0528'이라고 명명했다.

독립적 벤치마크 플랫폼인 라이브코드벤치는 R1-0528의 성능이 오픈AI의 최신 모델인 o3(하이) 모델에 버금간다는 평가를 내렸다.

중국 커촹반(科創板)일보는 R1-0528과 o3(하이)를 실제 비교해 본 결과 일부 영역에서 딥시크의 성능이 오픈AI를 넘어섰다고 30일 전했다.

커촹반일보는 AI 벤치마크 테스트 플랫폼인 엑스벤치가 사용하는 예제 중 5가지를 사용해 비교 테스트했다. 5가지 문제는 각각 ▲코딩 능력 ▲높은 난이도의 수학 추론 ▲사실 검색 및 데이터 통합 기능 ▲역사적 고증과 세부 분석 능력 ▲다차원 정보 추출과 데이터 통합 기능을 검증했다.

딥시크는 코딩 능력 문제에서 클릭하면 바로 실행되는 웹게임을 만들어냈다. 반면 오픈AI가 구현한 게임은 바로 실행되지 않았으며, 실행 시 오류가 빈번히 발생했다. 매체는 "딥시크의 모델은 코딩 분야에서 상당한 경쟁력을 갖추고 있음을 증명했다"고 평가했다.

수학 추론 문제에서 오픈AI는 41초 만에 정답을 제시했지만, 딥시크는 351초의 시간을 들여 정답을 내놓았다.

사실 검색 및 데이터 통합 문제에서 오픈AI는 정답을 제시했지만, 딥시크는 오답을 내놓았다.

역사적 고증과 분석 능력 문제에서도 오픈AI는 정답을 제시했고, 딥시크는 오답을 내놓았다. 

다차원 정보 추출과 데이터 통합 기능 문제에서는 딥시크와 오픈AI는 모두 정답을 내놓았다. 다만 딥시크는 1분이 소요됐지만, 오픈AI는 6분이 소요됐다.

매체는 딥시크는 코딩 작업에서 오픈AI를 압도했으며, 나머지 영역에서도 안정적인 발전을 보여줬고, 전체적으로 오픈AI에 근접한 제품을 만들어냈음을 증명했다고 평가했다.

한편 R1-0528은 라이브코드벤치의 코딩 성능 평가에서 챗GPT 개발사인 오픈AI('o4-미니-하이', 'o3-하이', 'o4-미니-미디엄')에 이어 2위를 차지했다.

중국 딥시크 이미지 [사진=로이터 뉴스핌]

ys1744@newspim.com

[뉴스핌 베스트 기사]

사진
정부조직 개편 방식 '안갯속' [서울=뉴스핌] 윤채영 기자 = 이재명 정부의 조직 개편 발표가 오는 8월 13일로 정해진 것으로 확인됐다. 국정기획위원회는 이달 말 대국민보고를 할 계획이었지만 미뤄지면서 정부조직 개편의 구체적인 방식은 안갯속이다. 26일 뉴스핌 취재를 종합하면, 국정위는 정부 조직 개편안 등을 이재명 대통령에게 보고하며 막바지 정리 작업 중에 있다. 개편이 유력한 기획재정부와 검찰 조직 등에 대한 추가 검토가 이뤄지고 있는 것으로 알려졌다. [서울=뉴스핌] 이길동 기자 =이한주 국정기획위원회 위원장.2025.07.22 gdlee@newspim.com 국정위는 당초 이달 중 대국민보고 등 주요 일정을 마칠 계획이었다. 국정위의 법적 활동 기한은 60일로 오는 8월 14일까지 활동할 수 있다. 1회 한해 최장 20일까지 연장할 수 있지만 국정위는 조기에 활동을 마무리 하겠다고 했다. 국정위의 속도전에 제동이 걸린 데는 정부의 첫 조직 개편인 만큼 조금 더 신중해야 한다는 목소리가 크게 작용한 것으로 알려졌다. 환경부와 산업자원통상부의 기후와 에너지 파트를 분리해 기후에너지부를 신설하는 과정에서 각 부처의 반발도 나오는 점 등이 대표적이다. 또 이 대통령이 이달 말에서 내달 초 방미 일정이 잡힐 수 있다는 점도 정부조직 개편이 늦어진 배경인 것으로 전해졌다. 1차 정부조직 개편안에는 기재부의 예산 분리 기능과 검찰청 폐지가 담길 것이 유력하다. 조승래 국정위 대변인은 앞서 "기재부 예산 기능을 분리하는 것과 (검찰청의) 수사와 기소 분리는 공약 방향이 명확하다"고 말했다. 기재부 조직 개편은 ▲예산 편성 기능을 분리해 과거의 기획예산처를 되살리고 나머지 기능은 재정경제부로 개편하는 안 ▲예산처가 아니라 재무부를 신설하는 안 ▲기재부 내에서 기능을 조정하는 안 등이 거론돼 왔다. 이 방안들을 놓고 국정위는 검토하고 있다. 현재는 기획재정부를 기획예산처와 재정경제부로 나누는 안이 유력한 것으로 알려졌지만, 국정위는 초안 등과 관련해서는 말을 아끼고 있는 상황이다. 검찰청 폐지 골자의 검찰 조직 개편안도 이번 조직 개편에 포함될 가능성이 높다. 이미 여당에서는 검찰의 수사권과 기소권을 분리하는 내용의 '검찰개혁 4법'을 발의했다. 김용민 더불어민주당 의원 등이 발의한 법안에는 검찰 권력의 핵심인 기소권은 법무부 산하에 공소청을 신설해 여기로 이관하는 내용이 담겼다. 수사권은 행정안전부 산하에 중대범죄수사청을 신설해 이곳으로 넘기기로 했다. 다만 수사권을 행안부 산하에 둘지 법무부 산하에 둘지를 두고는 여권 내에서도 이견이 있어 더 논의 중인 것으로 알려졌다. 금융위원회와 금융감독원 개편 방안을 놓고도 논의가 이어지고 있는 것으로 전해졌다. 당초 금융위 해체 차원의 '금융위 정책과 감독 기능 분리' 조직 개편안이 유력했다. 그러나 최근 여당에서 기획재정부 내 국제금융 업무를 금융위로 이관하는 내용의 법안을 발의하며 '금융위 존치론'이 급부상하고 있다. 금융위 해체론에 제동이 걸렸다는 목소리가 나오면서 이 역시도 오리무중인 상황이다. ycy1486@newspim.com 2025-07-26 07:00
사진
특검, 한덕수 자택·총리공관 압수수색" [세종=뉴스핌] 양가희 기자 = 내란특검팀이 24일 국무총리 서울공관에 대한 압수수색에 들어갔다. 국무총리실은 이날 문자 공지를 통해 특검팀의 수사에 적극 협조하고 있다며 이같이 밝혔다.   특검은 이날 한덕수 전 총리 자택 압수수색에도 나섰다. [서울=뉴스핌] 이형석 기자 = 한덕수 전 국무총리가 2일 오후 서울 서초구 서울고등검찰청에 마련된 내란 특검 사무실에서 조사를 마치고 차량으로 이동하고 있다. 2025.07.02 leehs@newspim.com 한 전 총리는 윤석열 전 대통령의 비상계엄 선포 계획을 알고도 이를 묵인 또는 방조했다는 의혹을 받고 있다. 특검은 압수물 분석을 마치는 대로 한 전 총리 등을 다시 조사한 뒤 구속영장 청구 여부 등을 검토할 전망인 것으로 알려졌다. sheep@newspim.com 2025-07-24 13:54
안다쇼핑
Top으로 이동