[서울=뉴스핌] 이영기 기자 = AI테크 기업 크라우드웍스가 AI 데이터 거래 플랫폼 오픈에 소식에 강세를 보이고 있다.
크라우드웍스는 'A1 데이터 거래소'를 오픈하고 베타 서비스를 시작한다고 12일 밝혔다. 'A1 데이터 거래소'는 AI 학습용 데이터 구매와 거래 내역 인증을 제공하는 플랫폼이다. 크라우드웍스에서 데이터를 구매하면 블록체인 기반 인증 시스템을 통해 거래 내역을 확인할 수 있어 추후 라이선스 관련 법적 분쟁 리스크를 최소화할 수 있다.
이러한 AI 데이터 거래소 오픈 배경에는 최근 확산되고 있는 데이터 라이선스 소송이 있다. 해외에서는 여러 AI 기업들이 관련 소송으로 몸살을 앓고 있다. 최근 5곳의 캐나다 언론이 오픈 AI를 상대로 손해배상 청구 소송에 나선 사실이 알려졌으며, 뉴욕타임스도 지난 10월에 AI 스타트업 퍼플렉시티(Perplexity)에 자사 콘텐츠 사용 중단 명령을 발송한 바 있다.
이에 따라 AI 서비스 개발을 위한 라이선스 문제없는 양질의 데이터 구하기는 점점 어려워지고 있다. 예전에는 웹 상에서 아무 제약 없이 데이터를 수집해 사용했지만 최근에는 저작권 문제가 대두되면서 자유로운 데이터 수집이 어려워졌기 때문이다.
이에 AI 기업들이 점차 라이선스 계약을 체결해 데이터를 수집해 나가는 추세다. 앞서 소송에 휘말린 오픈AI도 최근 언론사와 직접 라이선스 계약을 맺는 등 소송 위험에 대비하고 있으며, 구글도 뉴스코프와 연간 500만~600만 달러(약 71억~86억원) 규모의 콘텐츠 이용 계약을 체결했다. 국내에서도 한국언론진흥재단이 9월 30일부터 신문사, 방송사, 인터넷신문사 등 97개 매체의 과거 뉴스 콘텐츠와 실시간 뉴스 정보 등 AI 학습용 뉴스 데이터 판매에 나섰다.
김우승 크라우드웍스 대표이사는 "혹시 모를 소송 우려를 피하기 위해서는 반드시 라이선스 문제가 해결된 안전한 데이터를 가지고 AI 서비스 개발에 나서야 한다"며 "A1 데이터 거래소에서 발급되는 인증서는 위변조가 불가능한 블록체인으로 발급되므로 거래 내역이 명확히 증명할 수 있다는 점에서 소송 위험에 대비할 수 있다"고 밝혔다.
한편 최근 AI 시장에서 데이터 라이선스와 투명성이 강조되고 있는 추세다. 유럽연합(EU)은 AI 기업들에게 학습 데이터 정보 공개를 의무화했고, 미국에서는 저작권 침해 소송이 증가하고 있다. 이에 따라 관련 시장 규모도 갈수록 확대되고 있다. 글로벌 시장 조사 기업 '마켓 데이터 포캐스트(Market Data Forecast)'에 따르면 2024년 글로벌 AI 학습 데이터셋 시장은 26억 3천만 달러(약 3조 7천억원) 규모로 추정되며, 2028년까지 연평균 21.5% 증가해 57억 3천만 달러(약 8조 2천억원)에 이를 것으로 예상된다.
크라우드웍스 로고. [사진=크라우드웍스] |
007@newspim.com