전체기사 최신뉴스 GAM 라씨로
KYD 디데이

[기고] AI 시대의 새로운 도전 : 데이터 고갈과 저작권의 딜레마

기사입력 : 2024년11월19일 15:10

최종수정 : 2024년11월19일 15:10

AI 학습 데이터의 공정 이용 논의 활발
한국의 고품질 콘텐츠 활용 기회 예상
AI 기본법 통과 후 한국형모델 마련 필요

인공지능(AI) 기술이 급속도로 발전하면서 예상치 못한 새로운 위기가 찾아왔다. 바로 AI를 학습시킬 양질의 데이터가 고갈되고 있다는 것이다.

챗GPT와 같은 거대 언어모델이 등장한 이후, 전 세계 AI 기업들은 더 나은 성능을 위해 양질의 데이터를 찾아 헤매고 있다. 그러나 이미 인터넷상의 고품질 데이터는 대부분 소진된 상태다.

이러한 데이터 고갈 현상의 핵심에는 저작권 문제가 있다. 양질의 텍스트 데이터는 대부분 책, 논문, 전문 기사 등 저작권으로 보호받는 콘텐츠다. 유럽연합(EU)과 미국에서는 AI 학습을 위한 데이터 사용이 공정 이용(fair use)에 해당하는지에 대한 법적 논의가 활발히 진행되고 있다.

김현철 한국인공지능협회장 [사진=한국인공지능협회] 2024.10.23 biggerthanseoul@newspim.com

한국어와 같은 비영어권 언어의 경우 상황은 더욱 심각하다. 영어는 그나마 공개된 데이터의 양이 방대하지만, 한국어의 경우 양질의 데이터를 확보하기가 매우 어렵다.

이에 대응해 일부 AI 기업들은 데이터 제공자들과 라이선스 계약을 맺기 시작했으며, 블록체인 기술을 활용한 저작권 보호 및 보상 시스템도 제안되고 있다.

각국은 이 문제 해결을 위해 다양한 시도를 하고 있다. EU는 AI Act를 통해 AI 학습 데이터의 투명성을 요구하고 있다.  미국에서는 AI 학습을 위한 데이터 활용을 공정 사용의 범주로 포함시키려는 논의가 진행 중이다. 일부 AI 기업들은 데이터 제공자들과의 직접적인 계약을 통해 문제를 해결한다.

주목할 만한 것은 합성 데이터(Synthetic Data) 활용이다. 그러나 이 역시 법적 문제를 완전히 해결하지는 못하는 한계가 있다. 결국 근본적인 해결책은 데이터 제공자와 AI 기업 간의 새로운 협력 모델을 만드는 것이다.

한국 정부도 이 문제의 심각성을 인식하고 있다. 문화체육관광부와 한국저작권위원회는 AI저작권에 대한 가이드라인을 발표했으며, 정부는 민간 주도의 클라우드 산업 확대를 통해 AI 경쟁력을 강화하려는 계획을 추진중이다.

더욱 주목할 점은 한국이 가진 특별한 기회다. 우리나라는 세계적 수준의 고품질 콘텐츠를 보유한 문화 강국이다. K-문학, K-드라마부터 전문적인 학술, 의료, 법률 자료까지, 질적으로 우수한 한국어 데이터가 풍부하다. 이러한 자산들을 AI 학습에 활용할 수 있는 체계를 구축한다면, 글로벌 AI 시장에서 독보적인 경쟁력을 확보할 수 있다.

이러한 가능성을 실현하기 위해서는 제22대 국회의 인공지능 기본법이 조속히 통과돼야 한다. 인공지능 기본법이 시행되면 저작권과 AI 발전이 공존할 수 있는 체계를 마련하는 토대가 될 수 있으며, 데이터 중개 플랫폼과 데이터 활용 동의 시스템도 법적 근거 하에 구축될 수 있다. 이 법안은 AI 산업의 미래를 위한 핵심적인 첫걸음이 될 것이다.

이 문제를 해결하기 위해서는 저작권 제도와 AI 발전이 상생할 수 있는 새로운 모델이 필요하다. 가장 현실적인 방안은 저작권 등록 시스템에 'AI 학습 동의' 옵션을 도입하는 것이다. 저작권자가 자신의 콘텐츠를 AI 학습에 활용하는 것을 사전에 동의하고, 이에 따른 적절한 보상을 받을 수 있는 체계를 만드는 것이다.

이를 위해서는 저작권 데이터의 등록과 거래, 수익 분배를 전문적으로 관리할 수 있는 중개 플랫폼이 필요하다. 이러한 플랫폼은 저작권자의 권리를 보호하면서도 AI 기업들이 필요한 데이터를 효율적으로 확보할 수 있게 해주는 중요한 역할을 할 수 있다. 

챗GPT가 그린 데이터센터의 모습 [사진=챗GPT]

이러한 체계가 성공적으로 구축된다면, 한국은 데이터 경제의 새로운 장을 열 수 있다. 단순히 AI 기술의 발전을 넘어, 저작권자의 권리 보호와 수익 창출, AI 기업의 기술 혁신이 선순환하는 새로운 경제 생태계를 만들 수 있는 것이다.

더 나아가 이러한 한국형 모델은 글로벌 표준이 돼야 한다. 저작권 보호와 AI 발전의 조화, 공정한 데이터 거래와 수익 분배 등 이 모든 것을 아우르는 혁신적인 모델을 한국이 먼저 제시해야 한다.

AI 시대에서 데이터는 새로운 원유라고 불린다. 그러나 무분별한 데이터 수집과 활용은 저작권 침해와 같은 심각한 문제를 야기할 수 있다. 동시에 지나친 저작권 보호는 AI 발전을 저해할 수 있다.

우리에게 필요한 것은 이 두 가치가 조화를 이루는 새로운 체계다. 저작권 등록 시스템의 혁신과 데이터 중개 플랫폼의 구축은 그 첫걸음이 될 수 있다. 각국의 사례와 시도들은 이미 이러한 변화의 필요성을 보여준다. 이제 한국이 이 분야에서 선도적인 모델을 제시할 때다.

◇ 김현철 한국인공지능협회장은 1984년 서울 출신으로, 머신러닝 기반 추천 알고리즘 개발회사 대표를 역임했다. 2017년 (사)한국인공지능협회 사무총장을 맡으면서 협회를 설립, 국내 최초 250개 인공지능 기술기업 클러스터를 구축하고, 전자정부 사업 '혁신성장첨단기술전' 공동주관, 국제인공지능대전 개최, 인공지능 경진대회, KOREA AI Startups 편찬 등을 추진하며 협회 발전에 기여했다. 2019년부터 현재까지 협회장을 맡고 있다.

[뉴스핌 베스트 기사]

사진
헌법재판관들 "공정" 49.3% "불공정" 44.9% [서울=뉴스핌] 이바름 기자 = 윤석열 대통령의 탄핵 심판을 맡은 헌법재판관들의 공정성을 묻는 질문에 '공정하다' 49.3%, '공정하지 않다' 44.9%로 팽팽했다. 종합뉴스통신사 뉴스핌이 미디어리서치에 의뢰해 지난 18~19일 전국 만 18세 이상 남녀 1000명을 대상으로 진행해 20일 발표한 ARS(자동응답 시스템) 조사에서 윤 대통령 탄핵 심판 헌법재판관들의 공정성을 묻는 질문에 49.3%가 '공정하다'고 응답했다. '불공정하다'는 답변은 44.9%로 오차범위 내였다. 5.8%는 '잘모름'이었다. 연령별로 보면 30·40·50대는 '공정'이 우세했고, 만18세~29세·60대·70대 이상은 '불공정' 응답이 많았다. 만18세~29세는 공정하다 44.7%, 불공정하다 47.8%, 잘모름은 7.5%였다. 30대는 공정하다 52.2%, 불공정하다 40.4%, 잘모름 7.3%였다. 40대는 공정하다 61.3%, 불공정하다 34.8%, 잘모름 3.9%였다. 50대는 공정하다 61.3%, 불공정하다 35.2%, 잘모름 3.6%였다. 60대는 공정하다 40.7%, 불공정하다 53.8%, 잘모름 5.5%였다. 70대 이상은 공정하다 31.6%, 불공정하다 60.4%, 잘모름은 8.0%였다. 지역별로는 서울과 경기·인천, 광주·전남·전북은 '공정'으로 기울었다. 대전·충청·세종과 강원·제주, 부산·울산·경남, 대구·경북은 '불공정'하다고 봤다. 서울은 공정하다 52.9%, 불공정하다 41.5%, 잘모름 5.6%였다. 경기·인천은 공정하다 50.8%, 불공정하다 44.0%, 잘모름 5.1%였다. 대전·충청·세종은 공정하다 41.8%, 불공정하다 50.7%, 잘모름은 7.4%였다. 강원·제주는 공정하다 44.6%, 불공정하다 48.6%, 잘모름 6.8%였다. 부산·울산·경남은 공정하다 43.8%, 불공정하다 49.3%, 잘모름 6.9%였다. 대구·경북은 공정하다 37.7%, 불공정하다 56.4%, 잘모름은 5.9%였다. 광주·전남·전북은 공정하다 28.2%, 불공정하다 67.6%, 잘모름 4.2%였다. 지지정당별로는 더불어민주당 지지자들은 88.7%가 공정하다고 답했다. 반면 국민의힘 지지자들은 90.0%가 불공정하다고 응답했다. 조국혁신당 지지자들은 84.4%가 공정하다고 봤다. 개혁신당 지지자들은 공정하다 48.0%, 불공정하다 46.9%로 팽팽했다. 진보당 지지자들은 59.5%가 공정하다, 잘모름 27.0%, 불공정하다는 13.5%였다. 무당층은 51.8%가 공정하다, 32.9%는 불공정하다. 잘모름은 15.3%였다. 성별로는 남성 53.6%는 공정하다, 42.1%는 불공정하다였다. 여성은 45.1%가 공정하다, 47.7%는 불공정하다고 답했다. 박상병 정치평론가는 "우리사회의 마지막 성역이었던 헌법재판관의 양심까지도 공격하는 시대"라며 "대통령 탄핵 인용 또는 기각 이후 다음 정권에도 이러한 갈등은 더 심해질 것으로 예상한다"고 전했다. 김대은 미디어리서치 대표는 "지지층에 따라 서로 상반된 입장이 나오고 있어 향후 헌재에서 대통령 탄핵 기각과 인용중 어떠한 판결을 내리더라도 상당한 혼란이 있을 것으로 보인다"고 말했다. 이번 여론조사는 무선 RDD(무작위 전화 걸기)를 활용한 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 7.2%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. right@newspim.com 2025-02-20 11:00
사진
민주 42.3%·국힘 39.7%…오차 범위 내 역전 [서울=뉴스핌] 한태희 기자 = 더불어민주당의 지지율이 청년층·수도권 등 보수 결집으로 힘을 받았던 국민의힘 지지율을 오차 범위 안에서 역전한 것으로 조사됐다. 20~30대 청년층과 서울·경기·인천 등 수도권에서 집권 여당에 대한 호감도가 줄어든 영향으로 분석된다. 종합뉴스통신사 뉴스핌이 여론조사 전문기관 미디어리서치에 의뢰해 지난 18일부터 19일까지 이틀 동안 전국 만 18세 이상 남녀 1000명을 대상으로 진행해 20일 발표한 자동 응답시스템(ARS) 조사에서 '어느 정당을 지지하거나 약간이라도 더 호감을 가지고 있냐'는 질문에 민주당 지지율은 직전 조사(41.4%) 대비 0.9%포인트(p) 오른 42.3%로 나타났다. 국민의힘 지지율은 직전 조사(43.2%) 대비 3.5%p 하락한 39.7%다. 같은 기간 조국혁신당은 4.5%에서 3.5%로 1%p 떨어졌다. 개혁신당은 1.5%에서 2.3%로 0.8%p 올랐다. 진보당은 0.7%로 지지율에 변동이 없었다. '지지 정당 없음'은 5.9%에서 7.6%로 1.7%p 늘었다. '기타 다른 정당'은 2.3%에서 3.1%로 0.8%p 상승했다. '잘모름'은 0.5%에서 0.6%로 0.1%p 올랐다. [서울=뉴스핌] 한태희 기자 = 2025.02.20 ace@newspim.com 연령별로 보면 만 18~29세와 60대 이상은 국민의힘에 대한 지지도가 높았다. 30~50대는 민주당을 더 지지했다. 만 18~29세 정당 지지도를 보면 국민의힘 39.6%, 민주당 36.9%, 개혁신당 7.9%, 조국혁신당 3.6%, 기타 다른 정당 1.9%, 지지 정당 없음 9.5%, 잘모름 0.6%등이다. 직전 조사와 비교하면 민주당은 35.5%에서 36.9%로 1.4%p 올랐고 국민의힘은 46.3%에서 39.6%로 6.7%p 떨어졌다. 30대는 민주당 41.3%, 국민의힘 35.2%, 개혁신당 2.7%, 조국혁신당 1.4%, 진보당 1.3%, 기타 다른 정당 5.3%, 지지 정당 없음 11.4%, 잘모름 1.3% 등이다. 직전 조사 대비 민주당은 39.9%에서 41.3%로 1.4%p 상승했고 국민의힘은 41.1%에서 35.2%로 5.9%p 하락했다. 40대는 민주당 52.2%, 국민의힘 32.9%, 조국혁신당 3.8%, 개혁신당 2.9%, 진보당 0.5%, 기타 다른 정당 1.1%, 지지 정당 없음 1.1% 등이다. 50대는 민주당 50.2%, 국민의힘 27.8%, 조국혁신당 6.4%, 진보당 1.4%, 기타 다른 정당 4.5%, 지지 정당 없음 9.7% 등이다. 60대는 국민의힘 51%, 민주당 38.4%, 조국혁신당 3.2%, 개혁신당 0.5%, 기타 다른 정당 2.7%, 지지 정당 없음 3.7%, 잘모름 0.5% 등이다. 70대 이상은 국민의힘 54.7%, 민주당 31.5%, 조국혁신당 1.8%, 진보당 1.3%, 개혁신당 0.7%, 기타 다른 정당 3.2%, 지지 정당 없음 5.1%, 잘모름 1.7% 등이다. 지역별로 보면 직전 조사와 비교해 서울과 경기·인천 등 수도권에서 민주당이 국민의힘을 역전했다. 반대로 대전·충청·세종에서는 국민의힘이 민주당보다 앞섰다. 서울은 민주 42.5%, 국민의힘 37.4%, 조국혁신당 3.0%, 개혁신당 2.2%, 진보당 2.0%, 기타 다른 정당 3.5%, 지지 정당 없음 9.5% 등이다. 경기·인천은 민주 43.5%, 국민의힘 36.9%, 조국혁신당 4.1%, 개혁신당 3.2%, 진보당 0.3%, 기타 다른 정당 2.5%, 지지 정당 없음 8.6%, 잘모름 0.9% 등이다. 대전·충청·세종은 국민의힘 45.2%, 민주당 41.7%, 개혁신당 1.9%, 조국혁신당 0.8%, 기타 다른 정당 4.4%, 지지 정당 없음 6.0% 등이다. 강원·제주는 민주당 42%, 국민의힘 31.4%, 개혁신당 7.3%, 조국혁신당 4.3%, 진보당 2.4%, 기타 다른 정당 8.1%, 지지 정당 없음 4.4% 등이다. 부산·울산·경남은 국민의힘 47.1%, 민주당 34.7%, 조국혁신당 4.2%, 개혁신당 2.0%, 기타 다른 정당 2.1%, 지지 정당 없음 8.8%, 잘모름 1.1% 등이다. 대구·경북은 국민의힘 57.3%, 국민의힘 29.1%, 조국혁신당 3.8%, 기타 다른 정당 3.1%, 지지 정당 없음 6.7% 등이다. 광주·전남·전북은 민주당 63.7%, 국민의힘 22.1%, 조국혁신당 3.9%, 진보당 1.9%, 개혁신당 1.0%, 기타 다른 정당 2.3%, 지지 정당 없음 3.1%, 잘모름 2.0% 등이다. 성별로 보면 남성은 민주당 41.1%, 국민의힘 38.7%, 조국혁신당 4.2%, 개혁신당 3.3%, 진보당 1.1%, 기타 다른 정당 2.4%, 지지 정당 없음 8.6%, 잘모름 0.6% 등이다. 여성은 민주당 43.5%, 국민의힘 40.7%, 조국혁신당 2.9%, 개혁신당 1.4%, 진보당 0.4%, 기타 다른 정당 3.8%, 지지 정당 없음 6.7%, 잘모름 0.7% 등이다. 박상병 정치평론가는 "윤석열 대통령에 대한 탄핵이 기각될 수 있다는 예상과 극우 인사 준동, 국민의힘까지 힘을 합치며 (보수) 세력이 뭉치는 밴드왜건 효과로 국민의힘 지지율이 상승했으나 이제는 (보수 결집이) 정점에 이르렀다"며 "윤석열 대통령의 헌법재판소 법정 발언에 반감이 생기고 일부 극우 인사들이 밖에서 탄핵 무효를 외치는 게 중도층에는 꼴불견으로 비춰지고 있다"고 분석했다. 이어 "극우 인사들의 준동이 해도 너무 한다는 생각을 하는 사람이 늘며 국민의힘 지지율이 정점에서 하향 추세를 보이고 있다"고 부연했다. 이번 여론조사는 무선 무작위 전화걸기(RDD)를 활용한 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 8.1%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. ace@newspim.com 2025-02-20 11:00
안다쇼핑
Top으로 이동