전체기사 최신뉴스 GAM
KYD 디데이
경제 과학기술

속보

더보기

[단독] 내달 '데이터댐' 수문 열린다…과기부, AI 학습용 데이터 170종 공개

기사입력 : 2021년04월21일 14:00

최종수정 : 2021년07월02일 11:09

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

작년 본예산 390억원·추경예산 2925억 투입
데이터 자체생산 어려운 중견·중기 활용 기대

[편집자] 이 기사는 4월 21일 오전 11시09분 프리미엄 뉴스서비스'ANDA'에 먼저 출고됐습니다. 몽골어로 의형제를 뜻하는 'ANDA'는 국내 기업의 글로벌 성장과 도약, 독자 여러분의 성공적인 자산관리 동반자가 되겠다는 뉴스핌의 약속입니다.

[세종=뉴스핌] 이경태 기자 = 디지털 뉴딜의 대표분야로 손꼽히는 데이터댐 사업이 다음달 본격화된다. 공공 빅데이터를 민간 영역에 대폭 공개하는 만큼 인공지능(AI), 데이터업계에는 '가뭄 속 단비'가 될 것으로 보인다. 

21일 과학기술정보통신부와 IT업계에 따르면, 정부는 지난해 AI 개발에 필수적인 양질의 데이터를 대규모로 구축·개방하는 'AI 학습용 데이터 구축 사업'을 통해 얻은 10개 분야 170종에 대한 빅데이터를 다음달 AI 통합 지원 플랫폼인 'AI 허브(www.aihub.or.kr)'를 통해 무료로 개방한다.

[서울=뉴스핌] 최상수 기자 = 이해찬 더불어민주당 대표, 김용우 더존ICT 대표를 비롯한 참석자들이 19일 오후 서울 중구 더존을지타워에서 열린 'K-뉴딜위원회 데이터댐 정책간담회'에서 기념촬영을 하고 있다. 2020.08.19 kilroy023@newspim.com

이번 사업을 위해 지난해 본예산 390억원과 추가경정예산 2925억원이 투입됐다. 본예산을 통해서는 자연어처리 분야·자율주행기술 분야·융합 분야·헬스케어 분야·딥페이크 방지기술 분야·장애인 삶 향상 분야와 관련, 지정공모 10종, 자유공모 10종 등 20종이 마련됐다.

추경예산을 통해서는 10대 분야 150종에 걸쳐 데이터가 공개된다. 추가 제공하는 데이터는 ▲자연어 35종 ▲헬스케어 23종 ▲자율주행 14종 ▲농축수산 12종 ▲국토환경 10종 ▲안전 16종 ▲미디어 14종 ▲기타분야 8종 ▲지역특화(경제) 과제 6종 ▲자유과제 12종 등이다. 2017~2019년에 마련해놓은 21종까지 합하면 올해 191종을 구축하는 셈이다.

특히, 이번에 공개되는 데이터는 인공지능 업계가 곧바로 이용할 수 있도록 '데이터 라벨링'이 완료됐다. '데이터 라벨링'은 은 인공지능이 데이터를 판단하고 학습할 수 있도록 적절하게 가공하는 과정을 말한다.

업계로서도 고품질의 데이터를 활용할 수 있다보니 기대도 높다. 대기업보다는 중견·중소기업의 체감도가 높을 것으로 예상된다.

대기업이 신시장을 개척하기 위해 자체적으로 데이터를 생산, 수집하는 것과 달리, 중견·중소기업은 데이터를 생산할 여력이 없다보니 시장 수요 등을 파악하는 게 쉽지 않았다. 그만큼 데이터와 인공지능 산업은 중견·중소기업에는 넘을 수 없는 문턱일 수 밖에 없다는 지적이 들리는 이유다.

이번 데이터댐 부분 개방을 통해 중견·중소기업의 공공 데이터 활용이 활발해질 것으로 정부는 바라보고 있다. 이를 위해 데이터 바우처 사업도 마련됐다. 정부는 한국데이터산업진흥원을 통해 올해 2580개 중소기업을 대상으로 1230억원을 지원해 데이터를 활용할 수 있도록 기회를 제공하고 있다. 이번 사업은 데이터 산업의 마중물 역할을 할 것이라는 평가를 받기도 한다.

창업 시장에서도 이번 데이터 공개에 시선을 모으고 있다. 

함성룡 (재)글로벌청년창업가재단 이사장은 "현시점에서 데이터나 인공지능 산업이 우리나라의 경우, 초보적인 수준이다보니 일단 데이터를 쌓을 필요가 있다"며 "데이터 라벨링이 된 데이터의 경우, 인공지능 시스템에 곧바로 적용시켜볼 수 있다는 측면에서 업계로서도 손쉽게 접근이 가능해질 것"이라고 내다봤다. 

과기부 한 관계자는 "현재 데이터 공개를 위해 최종적으로 점검하는 상황이며 민간에서 필요로 하는 데이터 분야의 수요를 살펴보면서 민간에 필요한 데이터를 생산할 수 있도록 노력할 것"이라며 "데이터댐을 지속적으로 추진해나가면서 오는 2025년까지 1300종의 데이터를 구축해 공개할 예정"이라고 말했다.

biggerthanseoul@newspim.com

[뉴스핌 베스트 기사]

사진
노벨문학상 크러스너호르커이는 누구? [서울=뉴스핌] 오광수 문화전문기자 = 올해 노벨문학상은 헝가리의 소설가이자 각본가인 라슬로 크러스너호르커이에게 돌아갔다. 스웨덴 한림원은 9일 오후 8시(한국 시간) 라슬로 크러스너호르커이(71)를 올해의 수상자로 호명했다. 한림원은 라슬로 크러스너호르커이가 "종말적 공포의 한가운데서도 예술의 힘을 재확인시키는 강렬하고 예지적인 작품 세계"를 인정받아 이 상을 수상하게 됐다고 밝혔다. [서울=뉴스핌] 오광수 문화전문기자 = 헝가리 작가 라슬로 크러스너호르커이. [사진 = 노벨상위원회] 2025.10.09 oks34@newspim.com 라슬로 크러스너호르커이는 헝가리 현대문학의 거장으로 평가받으며, 그의 작품들은 난해한 문체와 종말론적인 테마로 유명하다. 1954년생인 크러스너호르커이는 대학에서 법학과 헝가리문학을 전공하면서 출판사에서 편집자로 일했다. 대학졸업후 전업 작가의 길을 택한 그는 1985년 데뷔작인 '사탄탱고'로 문학성을 인정받으면서 명성을 얻었다. 1990년대 초반에는 몽골, 중국에서 거주했으며 '저항의 멜랑꼴리'와 '전쟁과 전쟁'을 발표한 이후 미국, 스페인, 일본 등 다양한 지역에서 생활해왔다. 2015년에는 헝가리 최초로 맨부커상 국제 부문을 수상했고, 매년 노벨문학상 후보의 한 사람으로 거론돼 왔다. '파멸''사탄탱고''런던에서 온 사나이''토리노의 말'등 각본을 쓰기도 했다. 수전 손택은 "크러스너호르커이는 현존하는 묵시록 문학 최고 거장이다"라고 평하기도 했다. 국내에도 번역되어 소개된 '사탄탱고'는 공산체제 하에서 무기력하고 비참하고 곤궁하게 살아가는 인간 군상들의 이야기를 담고 있다. oks34@newspim.com 2025-10-09 20:47
사진
'국정자원 화재' 1등급 복구율 62.5% [서울=뉴스핌] 고다연 기자 = 국가정보자원관리원(국정자원) 화재로 마비된 정부 전산시스템이 709개로 정정됐다. 화재로 멈춘 일부 시스템은 대구센터나 대전센터 내 타 전산실로 이전해 복구에 속도를 높인다는 계획이다.  김민재 중앙재난안전대책본부(중대본) 제1차장은 9일 브리핑을 통해 화재 관련 상황과 복구 진행현황을 발표했다. [서울=뉴스핌] 윤호중 중앙재난안전대책본부장(행정안전부 장관)이 9일 오전 정부서울청사에서 국가정보자원관리원 행정정보시스템 화재 관련 중대본 회의를 주재하고 모두 발언을 하고 있다. [사진=행정안전부] 2025.10.09 photo@newspim.com 브리핑에 따르면 국가정보자원관리원 통합운영관리시스템인 엔탑스(nTOPS)의 데이터가 복구돼 대전센터의 전체 시스템 목록을 확인할 수 있었다. 이후 부처와 확인 과정을 거쳐 시스템 목록을 709개로 확정했다. 기존에 정부가 공지한 647개에서 62개가 추가된 것이다.  이는 우체국금융, 공직자통합메일과 같은 일부 시스템이 기능별로 세분화돼 시스템 수가 증가했고, 온나라문서 시스템은 기관별로 있던 목록이 정부업무관리시스템으로 통합되는 등 목록 변화에 따른 것이다. 현재 목록의 등급별 시스템 수는 1등급 40개, 2등급 68개, 3등급 261개, 4등급 340개다. 화재로 장애가 발생한 정부 전산시스템은 이날 12시 기준으로 193개(27.2%) 시스템이 복구됐다. 1등급 시스템 40개 중에서는 25개(62.5%)가 복구돼 운영 중이다. 또 이달 말까지 도입 예정이던 장비를 연휴 중 도입해 현재까지 서버 90식, 네트워크 장비 64식 등 198식의 전산장비를 신규로 도입했다. 중대본은 장비 설치가 완료되는 15일 이후부터는 복구되는 시스템이 빠르게 늘어날 것으로 예상된다고 전했다.  중대본에 따르면 분진 및 화재 피해를 입은 5층 전산실의 시스템은 소관 부처와의 협의 및 세부 검토를 거쳐 대구센터로 이전하거나 대전센터 내 타 전산실로 이전해 복구할 예정이다. 김 차장은 "5층의 시스템 전체를 대구센터로 이전하는 것보다 대전센터에서 신속히 장비를 수급하여 복구하는 것이 효율적일 것이라는 기술적 판단을 반영했다"고 밝혔다. 대전센터는 5전산실 및 6전산실에 신규장비를 설치해 시스템을 복구하고, 대구센터 이전 시스템은 민간 클라우드사와 소관부처 간의 협의가 완료되는 대로 조속히 이전할 계획이다. gdy10@newspim.com 2025-10-09 14:43
기사 번역
결과물 출력을 준비하고 있어요.
기사제목
기사가 번역된 내용입니다.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동