전체기사 최신뉴스 GAM 라씨로
KYD 디데이
경제 과학기술

속보

더보기

[기고] AI 시대의 새로운 도전 : 데이터 고갈과 저작권의 딜레마

기사입력 : 2024년11월19일 15:10

최종수정 : 2024년11월19일 15:10

AI 학습 데이터의 공정 이용 논의 활발
한국의 고품질 콘텐츠 활용 기회 예상
AI 기본법 통과 후 한국형모델 마련 필요

인공지능(AI) 기술이 급속도로 발전하면서 예상치 못한 새로운 위기가 찾아왔다. 바로 AI를 학습시킬 양질의 데이터가 고갈되고 있다는 것이다.

챗GPT와 같은 거대 언어모델이 등장한 이후, 전 세계 AI 기업들은 더 나은 성능을 위해 양질의 데이터를 찾아 헤매고 있다. 그러나 이미 인터넷상의 고품질 데이터는 대부분 소진된 상태다.

이러한 데이터 고갈 현상의 핵심에는 저작권 문제가 있다. 양질의 텍스트 데이터는 대부분 책, 논문, 전문 기사 등 저작권으로 보호받는 콘텐츠다. 유럽연합(EU)과 미국에서는 AI 학습을 위한 데이터 사용이 공정 이용(fair use)에 해당하는지에 대한 법적 논의가 활발히 진행되고 있다.

김현철 한국인공지능협회장 [사진=한국인공지능협회] 2024.10.23 biggerthanseoul@newspim.com

한국어와 같은 비영어권 언어의 경우 상황은 더욱 심각하다. 영어는 그나마 공개된 데이터의 양이 방대하지만, 한국어의 경우 양질의 데이터를 확보하기가 매우 어렵다.

이에 대응해 일부 AI 기업들은 데이터 제공자들과 라이선스 계약을 맺기 시작했으며, 블록체인 기술을 활용한 저작권 보호 및 보상 시스템도 제안되고 있다.

각국은 이 문제 해결을 위해 다양한 시도를 하고 있다. EU는 AI Act를 통해 AI 학습 데이터의 투명성을 요구하고 있다.  미국에서는 AI 학습을 위한 데이터 활용을 공정 사용의 범주로 포함시키려는 논의가 진행 중이다. 일부 AI 기업들은 데이터 제공자들과의 직접적인 계약을 통해 문제를 해결한다.

주목할 만한 것은 합성 데이터(Synthetic Data) 활용이다. 그러나 이 역시 법적 문제를 완전히 해결하지는 못하는 한계가 있다. 결국 근본적인 해결책은 데이터 제공자와 AI 기업 간의 새로운 협력 모델을 만드는 것이다.

한국 정부도 이 문제의 심각성을 인식하고 있다. 문화체육관광부와 한국저작권위원회는 AI저작권에 대한 가이드라인을 발표했으며, 정부는 민간 주도의 클라우드 산업 확대를 통해 AI 경쟁력을 강화하려는 계획을 추진중이다.

더욱 주목할 점은 한국이 가진 특별한 기회다. 우리나라는 세계적 수준의 고품질 콘텐츠를 보유한 문화 강국이다. K-문학, K-드라마부터 전문적인 학술, 의료, 법률 자료까지, 질적으로 우수한 한국어 데이터가 풍부하다. 이러한 자산들을 AI 학습에 활용할 수 있는 체계를 구축한다면, 글로벌 AI 시장에서 독보적인 경쟁력을 확보할 수 있다.

이러한 가능성을 실현하기 위해서는 제22대 국회의 인공지능 기본법이 조속히 통과돼야 한다. 인공지능 기본법이 시행되면 저작권과 AI 발전이 공존할 수 있는 체계를 마련하는 토대가 될 수 있으며, 데이터 중개 플랫폼과 데이터 활용 동의 시스템도 법적 근거 하에 구축될 수 있다. 이 법안은 AI 산업의 미래를 위한 핵심적인 첫걸음이 될 것이다.

이 문제를 해결하기 위해서는 저작권 제도와 AI 발전이 상생할 수 있는 새로운 모델이 필요하다. 가장 현실적인 방안은 저작권 등록 시스템에 'AI 학습 동의' 옵션을 도입하는 것이다. 저작권자가 자신의 콘텐츠를 AI 학습에 활용하는 것을 사전에 동의하고, 이에 따른 적절한 보상을 받을 수 있는 체계를 만드는 것이다.

이를 위해서는 저작권 데이터의 등록과 거래, 수익 분배를 전문적으로 관리할 수 있는 중개 플랫폼이 필요하다. 이러한 플랫폼은 저작권자의 권리를 보호하면서도 AI 기업들이 필요한 데이터를 효율적으로 확보할 수 있게 해주는 중요한 역할을 할 수 있다. 

챗GPT가 그린 데이터센터의 모습 [사진=챗GPT]

이러한 체계가 성공적으로 구축된다면, 한국은 데이터 경제의 새로운 장을 열 수 있다. 단순히 AI 기술의 발전을 넘어, 저작권자의 권리 보호와 수익 창출, AI 기업의 기술 혁신이 선순환하는 새로운 경제 생태계를 만들 수 있는 것이다.

더 나아가 이러한 한국형 모델은 글로벌 표준이 돼야 한다. 저작권 보호와 AI 발전의 조화, 공정한 데이터 거래와 수익 분배 등 이 모든 것을 아우르는 혁신적인 모델을 한국이 먼저 제시해야 한다.

AI 시대에서 데이터는 새로운 원유라고 불린다. 그러나 무분별한 데이터 수집과 활용은 저작권 침해와 같은 심각한 문제를 야기할 수 있다. 동시에 지나친 저작권 보호는 AI 발전을 저해할 수 있다.

우리에게 필요한 것은 이 두 가치가 조화를 이루는 새로운 체계다. 저작권 등록 시스템의 혁신과 데이터 중개 플랫폼의 구축은 그 첫걸음이 될 수 있다. 각국의 사례와 시도들은 이미 이러한 변화의 필요성을 보여준다. 이제 한국이 이 분야에서 선도적인 모델을 제시할 때다.

◇ 김현철 한국인공지능협회장은 1984년 서울 출신으로, 머신러닝 기반 추천 알고리즘 개발회사 대표를 역임했다. 2017년 (사)한국인공지능협회 사무총장을 맡으면서 협회를 설립, 국내 최초 250개 인공지능 기술기업 클러스터를 구축하고, 전자정부 사업 '혁신성장첨단기술전' 공동주관, 국제인공지능대전 개최, 인공지능 경진대회, KOREA AI Startups 편찬 등을 추진하며 협회 발전에 기여했다. 2019년부터 현재까지 협회장을 맡고 있다.

[뉴스핌 베스트 기사]

사진
이정후, MLB 첫 2경기 연속 대포 [서울=뉴스핌] 장환수 스포츠전문기자= 이정후가 미국 진출 후 처음으로 2경기 연속 홈런포를 쏘아 올렸다. 샌프란시스코는 그동안 이정후가 홈런을 친 6경기(지난해 2경기)에서 100% 승률을 거뒀지만 처음으로 승리 공식이 깨졌다. 이정후는 15일(한국시간) 샌프란시스코 오라클파크에서 열린 애리조나와 홈경기에서 4-8로 추격한 7회 투런 홈런을 날렸다. [샌프란시스코 로이터=뉴스핌] 장환수 스포츠전문기자= 샌프란시스코 이정후가 15일 애리조나와 홈경기에서 7회 2점 홈런을 날린 뒤 맷 윌리엄스 코치의 환영을 받으며 3루 베이스를 돌고 있다. 2025.05.15 zangpabo@newspim.com 전날 애리조나전 8회 3점 홈런에 이어 이틀 연속 아치를 그린 이정후는 시즌 6호 홈런을 기록했다. 그러나 샌프란시스코는 7-8로 아쉽게 졌다. 지난해 데뷔한 이정후가 2경기 연속 홈런을 친 것은 이번이 처음이다. 지난달 14일 뉴욕 양키스전에서 연타석 홈런을 쳐 한 경기 홈런 2개를 발사한 적은 있었다. 3번 7회 무사 1루에서 네 번째 타석에 선 이정후는 애리조나 세 번째 투수인 우완 라인 넬슨을 맞아 원볼 투스트라이크에서 4구째 시속 138㎞ 체인지업을 받아쳐 우중간 펜스를 넘겼다. 타구 속도는 시속 164㎞가 나왔고 비거리는 120m였다. 넬슨은 지난해 애리조나에서 선발로 뛰며 10승(6패 평균자책점 4.24)을 기록한 빅리그 4년차 유망주다. 3번 중견수로 출전한 이정후는 1회 3루수 파울 플라이, 3회 3루수 땅볼, 5회 좌익수 뜬공으로 물러났다. 5회 타구는 애리조나 좌익수 루어데스 구리엘 주니어가 펜스 앞까지 달려가 잡아내는 호수비가 아니었으면 장타가 됐을 타구였다. 2점 차로 뒤진 9회에는 선두 타자로 나가 좌익수 뜬공으로 아웃됐다. 이날 범타로 물러난 네 타석에선 공이 모두 왼쪽으로 밀렸다. [샌프란시스코 로이터=뉴스핌] 장환수 스포츠전문기자= 애리조나 좌익수 루어데스 구리엘 주니어가 15일 샌프란시스코와 원정경기에서 5회 이정후의 깊숙한 타구를 러닝 캐치로 잡아내고 있다. 2025.05.15 zangpabo@newspim.com 5타수 1안타 2타점 1득점을 기록한 이정후는 4경기 연속 안타 행진을 벌였지만 시즌 타율은 0.286로 약간 내려갔다. 2경기에서 5타점을 쓸어 담은 이정후의 타점은 29개로 늘어나 윌머 플로레스(33개)에 이어 팀 내 2위를 기록했다. 전날 애리조나를 10-6으로 꺾고 4연패에서 탈출했던 내셔널리그 서부지구 3위 샌프란시스코는 이날 패배로 4위 애리조나에 2경기 차로 쫓기게 됐다. 샌프란시스코는 9회 이정후가 아웃된 뒤 1사 만루 기회를 만들었다. 마이크 여스트렘스키의 삼진 후 라몬테 웨이드 주니어의 밀어내기 볼넷으로 1점 차까지 추격했으나 크리스천 코스가 중견수 뜬공으로 잡혀 역전에 실패했다. 샌프란시스코는 하루 휴식 후 17일 애슬레틱스와 홈 3연전을 시작한다. zangpabo@newspim.com 2025-05-15 08:58
사진
'서부지법 난동' 첫 선고 2명 모두 실형 [서울=뉴스핌] 조승진 기자 = 윤석열 전 대통령의 구속영장 발부 전후인 지난 1월 18∼19일, 서부지법에서 발생한 난동 사건으로 구속기소된 95명 중 2명이 1심에서 실형을 선고받았다. 서울서부지법 형사6단독(재판장 김진성)은 14일 오전 특수건조물침입 등의 혐의로 기소된 김 모 씨와 소모 씨에 대한 선고 공판에서 김 모 씨에게 징역 1년 6개월, 소모 씨에게 징역 1년을 선고했다. 이날 선고는 서부지법 난동 사태 발생 4개월여 만에 나온 첫 선고다.  앞서 검찰은 김씨에게 징역 3년, 소씨에게 징역 2년을 구형했다. 지난 1월19일 오전 서울 마포구 서울서부지방법원 청사 유리창과 벽면이 파손되어 있다. 이날 윤석열 대통령 구속영장이 발부되자 윤 대통령 지지자들이 서울서부지법에 난입해 유리창을 깨고 집기를 훼손하는 등 난동을 부려 경찰이 강제진압에 나섰다. [사진=뉴스핌 DB] 선고는 김 씨부터 진행됐다. 재판부는 "이 사건은 특수건조물 침입, 공용 물건 손상, 특수 공무집행 방해"라며 "피고인이 증거에 관해서 자백하고 있고 보관 증거가 있어서 유죄로 인정된다"고 했다. 이어 "이 사건은 다중위력을 보인 범행이고, 범행 대상은 법원"이라며 "피고인을 포함해서 많은 사람들이 하나의 사건에 연관되었고, 당시 발생한 전체 범행의 결과는 참혹하다"고 설명했다. 그러면서 "대한민국 사법부의 영장 발부 여부를 정치적 음모로 해석 규정하고, 그에 대한 즉각적인 응징, 보복을 이뤄야 한다는 집념과 집착이 이뤄낸 범행"이라고 했다. 재판부는 "다만 이 사건은 공동 범행이 아니라 단독 범행이기 때문에 피고인의 행위에 대해서만 평가한다"면서도 "다중의 위력을 보였다는 부분은 범죄사실에 포함되므로 고려한다"고 말했다. 이어 "피고인은 벽돌 등을 던져, 법원 건물 외벽 타일을 깨뜨렸고, 법원 경내로 들어가 침입했다"며 "법원 내부 진입을 막고 있던 경찰관들을 몸으로 밀어 폭행했다"고 했다. 다만 "피고인이 진지한 반성 태도를 보이고, 우발적으로 범행에 이르게 된 점, 초범인 점, 그밖에 양형 제반 사항을 고려해 징역 1년 6개월에 처한다"고 밝혔다. 이어진 소 씨의 선고에서 재판부는 "피고인이 자백하고 있고 보관 증거 있어 유죄"라고 했다. 그러면서 "피고인은 법원 경내로 들어간 다음 당직실 유리창을 통해 건물 1층 로비까지 들어가 침입했다"며 "화분 물받이로 창고 플라스틱 문을 긁히게 하고, 부서진 타일 조각을 던져 법원 건물 외벽 타일을 손괴했다"고 말했다. 다만 "피고인이 진지한 반성으로 보이고, 우발적 범행에 이르게 된 점, 초범인 점, 그밖에 양형 제반 사항을 고려해 징역 1년에 처한다"고 밝혔다. 이번 선고에 앞서 재판부는 "어제 딸에게 산책하며 '아빠가 어려운 사건을 선고한다'고 했더니 '이재명 사건이냐, 윤석열 사건이냐?'고 묻더라"며 "더 어려운 사건이 있겠구나 싶었지만, 결단과 선고 순간에는 어렵고 쉬운 사건이 없다고 생각한다"고 말했다. 이어 "이 판결문을 머릿속으로 썼다가 지웠다 수없이 반복했다. 오늘 선고를 할지 말지도 많이 고민했다"고 했다. 그러면서 "오늘 선고가 정답이라고 생각지 않는다. 다만 결정과 결단의 문제라고 생각한다"며 "이 선고가 피고인의 남은 인생을 좌우하지 않는다고 생각하고, 남은 생은 피고인 본인답게 살아달라"고 당부했다. 또 "이 사건과 같은 날 있던 전체 사건을 포함해 법원, 경찰 모두 피해자라고 생각한다"며 "그날 직접 피해를 본 법원, 경찰 구성원분들과 지금도 피해를 수습할 관계자분들 노고에 감사하다. 기자들을 포함해 지금도 피해를 수습하는 과정인 거 같다"고 덧붙였다. 이어 "마지막으로 대한민국 어려운 시기에 시민들께서 사법부뿐 아니라 경찰, 검찰, 법원 전체에 지속적으로 관심을 가져주시길 바란다"고 강조했다. chogiza@newspim.com 2025-05-14 11:05
안다쇼핑
Top으로 이동