[서울=뉴스핌] 양태훈 기자 = 비투엔은 14일 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 '2022년 인공지능(AI) 학습용 데이터 구축 사업'에서 8개 컨소시엄의 품질 점검을 완료했다고 밝혔다.
AI 학습용 데이터 구축 사업은 AI 연구, 기술 및 서비스 개발을 위한 학습용 데이터를 구축하고 누구나 활용할 수 있도록 개방해 AI 산업 활성화에 기여하는 국가 데이터 댐 사업이다.
비투엔이 이번에 품질 점검을 완료한 AI 학습용 데이터는 ▲ 이미지 272만 건 ▲ 텍스트 19만 건 ▲ 교통 12만 건 ▲ 음성 1만8000시간 등 총 9종, 474만 건에 달한다.
비투엔 로고. [사진=비투엔] |
비투엔 측은 "음성·자연어, 비전, 헬스케어, 교통, 축산업, 지역 특화, 데이터 고도화 등 광범위한 분야의 학습용 데이터의 품질을 지원함으로써 기술력을 다시 한 번 입증했다"며 "반려견, 반려묘 건강 정보 데이터 과제에서는 구문 정확성, 통계 다양성 검사와 더불어 구축된 학습용 데이터의 AI 알고리즘을 활용한 품질 점검 항목인 모델 유효성까지 업무 영역을 확장했다"고 전했다.
또 "이를 통해 모델 유효성 검증 지표 설정, 구축된 학습용 데이터 기반의 모델 학습 및 목표 달성 여부 점검, 모델 유효성 관련 TTA 협의 및 분석 결과 제출 등 세부 업무를 완벽하게 수행하는 성과를 거뒀다"며 "비투엔의 AI 학습용 데이터 품질관리 솔루션 SDQ for AI를 활용해 대량의 학습 데이터에 대한 처리 속도를 보장하고, 단순 통계뿐만 아니라 빅데이터 분석을 통한 다양성 검사까지도 지원함으로써 강화된 품질관리 요건들을 완벽하게 충족했다"고 덧붙였다.
한편, 비투엔은 지난해 AI 학습용 데이터 구축 사업에서 '방송콘텐츠 대화제 음성인식 데이터(솔트룩스 컨소시엄)', '한국어 SNS 데이터 고도화(와이즈넛 컨소시엄)', '디스플레이 안구 움직임 영상 데이터(피씨엔 컨소시엄)', '반려견, 반려묘 건강정보 데이터(이노그리드 컨소시엄)', '산업용 헴프 생육 이미지 및 환경 데이터(데이터헌트 컨소시엄)', '전문분야 심층 인터뷰 데이터(솔트룩스 컨소시엄)', '의료 음성 데이터(타이거컴퍼니 컨소시엄)', '교통수단판별 데이터(모토브 컨소시엄)' 등 과제에 품질관리 전담 기업으로 참여했다.
dconnect@newspim.com