전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 생활경제

속보

더보기

[단독] 3천억 디지털뉴딜 사업에 '복사·붙이기·해외DB 도용'

기사입력 : 2020년12월02일 06:00

최종수정 : 2020년12월02일 06:00

AI학습용 데이터구축 사업, 넉달간 2925억원 졸속 집행
"데이터 품질이 AI사업 성공의 핵심…초기 관리 철저해야"
NIA "품질문제 일부 있을 수도"...TTA "오류개선 노력중"

[서울=뉴스핌] 이서영 기자 = 정부가 3000억원 가량을 쏟아부은 'AI학습용 데이터구축' 사업이 시작부터 삐걱거리고 있다. 지난 9월 공모를 통해 584개에 이르는 기업과 기관으로부터 수집한 데이터 중 활용 불가한 '저품질 데이터'가 걸러지지 않았다는 지적이다. 

이번 사업의 데이터 품질관리를 담당하는 스타트업 내부 관계자에 따르면 이번 과제에 선정된 참여 기업의 경우 몇백 억개 데이터를 모아야 하는데도 불구하고 기본 천여 개 정도 데이터만 모은 뒤, 복사와 붙여넣기 등의 방법으로 제출한 경우가 포착됐다. 또, 유명 데이터 셋인 MS코코(COCO, Common Object in COntext)나 구글 오픈 이미지 등의 해외 데이터를 그대로 가져온 경우도 더러 드러났다는 것.

'AI 학습용 데이터 구축' 사업은 한국정보화진흥원(NIA) 주관 아래 지난 9월부터 12월까지 진행중이다. 예산은 2925억원. 사업은 자연어·헬스케어·자율주행 등 150개 과제이며 참여 기업과 기관도 584개다. 다만 공모 선정기업들의 데이터에서 발견되는 '저품질' 이슈는 향후 관련사업 진행에 상당한 애로가 될 수 있다.

사실 '데이터 품질'은 AI 서비스의 신뢰성과 안정성으로 이어진다. 사업을 주관하는 NIA가 발간한 'AI 학습용 데이터 사업의 실효성 향상을 위한 정책 방향' 보고서에 따르면 아주 작은 실수로도 실제 쓸 수 없는 정밀도가 나오는 경우가 많아 성능적 측면에서 품질 관리는 상당히 중요하다.

다시말해, 유사 데이터를 그대로 복사·붙여넣기 하는 경우 AI로 활용되기 어렵다는 의미다. 또 해외 데이터인 코코나 구글 오픈 이미지의 데이터를 그대로 가져오는 것 역시 의미가 없다. 해당 정보는 이미 오픈돼 벌써 활용되고 있기 때문이다.

특히 'AI 학습용 데이터 구축 사업'은 정부가 제시한 '디지털 뉴딜'의 핵심 토대가 되는 사업이다. '디지털 뉴딜'을 위해 2025년까지 D·N·A(데이터, 네트워크, AI) 생태계를 만들어야 하고, 이를 위해선 생태계가 제대로 작동하도록 하는 '데이터 구축'이 필수. 정부는 앞서 2025년까지 D·N·A 기반 생태계를 만들기 위해 총 38조5000억 투입 계획을 밝히기도 했다.

[서울=뉴스핌] 이서영 기자 = 한국판 뉴딜의 큰 축, 디지털 뉴딜사업. 2020.12.01 jellyfish@newspim.com

 

이에 대해 NIA 측은 "품질이 안 좋다고 말한 곳이 어디인지 모르겠지만 전체 150종 데이터를 다루는데 품질이 좋지 않은 일부가 있을 수는 있다"면서 "다만 이것이 전체를 대표하는 것은 아니다"는 입장이다.

품질관리에도 만전을 기하고 있다고 강조했다. 품질관리를 맡은 한국정보통신기술협회(TTA)측 AI 담당자는 "사업 기간이 짧은데 비해 종류는 150종이다보니 저품질 데이터가 생산될 수는 있다"면서도 "그래도 짧은 기간 동안 품질 검증을 해 오류를 개선하려고 노력 중"이라고 답했다.

그러면서 유사 데이터 등 저품질 데이터 문제에 대해 "간혹 작업자들 오류로 비슷한 데이터가 연달아 올라오는 경우도 있다고 듣긴 했다"며 "이에 같은 카테고리 내에서 유사 데이터가 20-30개 이상이 되지 않도록 가이드라인은 제시했다"고 했다.

jellyfish@newspim.com

[뉴스핌 베스트 기사]

사진
신지애, 135억 JLPGA 통산 상금 1위 [서울=뉴스핌] 박상욱 기자 = 올해로 프로 20년째를 맞이한 '골프 지존' 신지애(37)가 일본 여자 프로골프(JLPGA) 통산 상금왕이라는 또 하나의 금자탑을 세웠다. 신지애는 9일(한국시간) 일본 오키나와현 류큐 골프클럽(파72)에서 열린 JLPGA 시즌 개막전 다이킨 오키드 레이디스 골프토너먼트(총상금 1억2000만엔) 최종 라운드에서 3언더파 69타를 쳐 최종 합계 6언더파 282타로 공동 2위를 차지했다. 공동 준우승 상금 872만엔을 받은 신지애는 13억8074만3405엔(135억3708만원)을 쌓아 후도 유리(13억7262만382엔·일본)를 제치고 JLPGA투어 통산 상금왕에 올랐다. 이날 JLPGA 투어 300번째 출전 경기에 나선 신지애는 한때 공동 선두에 나서 개인 통산 66번째 우승과 JLPGA 투어 통산 31번째 우승을 바라보기도 했다. 후도가 총 495개 JLPGA 투어에서 거둔 통산 상금을 신지애는 300번째 경기에서 뛰어넘었다. 오는 10월 만 49세가 되는 후도는 JLPGA 투어에서 50승을 거둬 영구 시드를 지녀 대회 출전은 계속하고 있지만 컷 통과조차 버거워 그동안 상금을 거의 보태지 못했다. 이번 대회에서도 후도는 공동 83위로 컷을 통과하지 못해 신지애는 2라운드 컷 통과 뒤 이미 통산 상금왕을 예약했었다. 신지애. [사진 = JLPGA] 지난해 파리 올림픽 출전권을 따려고 미국여자프로골프(LPGA) 투어 원정에 많이 출전한 신지애는 올해는 그동안 숙원이던 JLPGA 투어 상금왕을 노리고 JLPGA 투어에 전념할 계획이라서 JLPGA 투어 통상 상금 1위는 당분간 독주할 전망이다. JLPGA 투어 통산 상금 3위는 586경기에서 13억1983만엔을 쌓은 전미정, 4위는 610경기에서 12억5661만엔을 벌어들인 이지희, 5위는 255개 대회에 11억엔을 번 안선주다. 이들은 최근 거의 대회에 나서지 않는다. 이날 우승컵은 쌍둥이 골프 자매 중 동생인 이와이 치사토가 차지했다. 지난달 혼다 LPGA 타일랜드에서 준우승을 차지한 이와이는 최종 합계 10언더파 278타로 2년 연속 우승했다. 쌍둥이 언니 이와이 아키에는 공동 7위(3언더파 285타)에 올랐다. 신지애는 타고난 재능에 부단한 노력과 뜨거운 열정을 더해 슬럼프 없이 20년 넘게 세계 여자 골프계를 주름잡고 있다. 2006년 KLPGA투어로 프로 생활을 시작해 2009년 미국여자프로골프(LPGA) 투어에 진출해 활약했고, 2014년 JLPGA투어로 활동 무대를 옮겼다. 신지애. [사진 = LPGA] 미국여자프로골프(LPGA) 투어 11승, 레이디스 유러피언 투어 6승, JLPGA 투어 30승, KLPGA 투어 21승, 호주여자프로골프 5승을 거뒀고 레이디스 아시안 투어에서도 한 차례 정상에 올랐다. 이를 더하면 74승이 되지만 공동 주관 대회가 있기 때문에 통산 우승 횟수는 65승이다. 한국 남녀 골퍼를 통틀어 프로 대회 최다 우승 기록이다. 37세의 나이에 신지애가 리빙 레전드로 활약하는 원동력은 강한 멘털과 집중력이다. 지난해 메이저대회 AIG여자오픈에서 준우승하며 건재를 과시했고 생애 마지막이 될 가능성이 큰 파리 올림픽에 도전하기도 했다. 신지애는 올해도 일본뿐 아니라 호주, 대만에서 정상급 경기력을 뽐내고 있다.   psoq1337@newspim.com 2025-03-09 14:52
사진
"제2딥시크" 中 마누스 성능 알고보니 [베이징=뉴스핌] 조용성 특파원 = 중국의 한 벤처기업이 지난 5일 공개한 '마누스(Manus)'라는 이름의 AI 모델에 중국 IT 업계가 "제2의 딥시크(DeepSeek)가 나타났다"며 술렁이고 있다. 중국 관영 경제지인 중신징웨이(中新經緯)는 "6일 새벽 중국 IT 전문가들은 마누스의 충격으로 잠을 이루지 못했다"라며 "이는 딥시크 충격 당시의 현상과 유사하다"라고 전했다. 또한 "AI 게시판은 모두 마누스로 도배되다시피 하고 있다"라고 덧붙였다. 이 매체는 "마누스가 중국 AI 업계에 충격을 주면서 6일 중국 증시 AI 섹터에 상한가 종목들이 속출했다"라고도 평가했다. 마누스를 개발한 업체는 '후뎨샤오잉(蝴蝶效應)'이라는 이름의 벤처기업이다. 후뎨샤오잉은 '나비효과'라는 뜻이다. 후뎨샤오잉은 지난 5일 마누스 테스트 버전을 공개했다. 사용을 원하는 사람은 테스트 신청을 할 수 있으며, 회사는 테스트 코드를 부여하고 있다. 신청자가 몰리면서 6일 마누스의 서버는 다운됐고, 테스트 코드 부여를 중단했다. 한때 테스트 코드는 7000달러에 거래될 정도로 가격이 치솟았다. 이에 6일 저녁 후뎨샤오잉은 성명을 발표했다. 회사는 "이처럼 많은 관심이 쏟아질 줄 몰랐고, 우리의 서버 용량은 확실히 한계가 있다"라며 "앞으로 더 많은 사용자가 마누스를 경험할 수 있도록 하겠다"라고 발표했다. 또한 "현재 마누스는 갓난아이 상태로 아직 개선해야 할 점이 많다"라며 "우리가 마누스 정식 버전에서 구현하고 싶은 경험과는 차이가 크다"라고 밝혔다. 마누스는 챗GPT, 딥시크와 달리 사용자의 질문에 답변할 수 있을 뿐만 아니라, 업무 혹은 임무를 수행할 수 있다. 마누스는 이력서 심사, 부동산 연구, 주식 분석 등의 임무를 수행할 수 있다. 회사 측은 "GAIA 벤치마크라는 AGI(범용 인공지능) 성능 평가에서 오픈AI보다 높은 점수를 받았다"라며 "마누스는 생각과 행동을 연결하는 AI"라고 설명했다. 후뎨샤오잉의 수석 엔지니어인 지이차오(季逸超)는 애플의 생태계 혁신 대회에서 '맥월드 특등상'을 수상한 경력이 있다. 이 기업의 핵심 인원들은 텐센트와 바이트댄스의 엔지니어 출신들이다. 마누스를 개발한 벤처기업 후뎨샤오잉의 수석 엔지니어인 지이차오. [사진=후뎨샤오잉] ys1744@newspim.com 2025-03-07 08:39
안다쇼핑
Top으로 이동