전체기사 최신뉴스 GAM
KYD 디데이
산업 재계·경영

LG가 만든 AI는 달랐다...오픈AI·메타도 외면한 '이것' 챙긴다

기사입력 : 2025년02월21일 15:19

최종수정 : 2025년02월21일 15:19

초거대 AI 학습 자료, 저작권 등 문제 없을까
오픈AI·메타 등 저작권 문제로 미국서 줄소송
LG가 개발한 '넥서스' 1분 만에 리스크 판단
인간 대비 속도는 45배 빨라지고 비용은 '0'
"글로벌 AI와 경쟁할 수 있는 역량 있다"

[서울=뉴스핌] 서영욱 기자 = #. 지난 2023년 유명 코미디언이자 작가인 세라 실버먼은 챗GPT 개발사 오픈AI와 메타를 상대로 소송을 냈다. 오픈AI와 메타가 대규모 언어 모델(LLM)을 훈련하기 위해 동의 없이 저작권 있는 자료를 사용했다는 주장이다. 메타 최고경영자(CEO) 마크 저커버그는 자체 인공지능(AI) 모델 '라마(LLaMA)'의 학습을 위해 불법 자료 제공 사이트인 'Z-라이브러리'나 '립젠'에서 데이터를 사용할 수 있도록 허가했다는 의혹을 받고 있다.

챗GPT와 딥시크와 같은 대규모 언어 모델(LLM)이 속속 등장하면서 산업계 판도를 바꾸고 있다. LLM은 수십억~수천억개에 달하는 방대한 데이터를 학습, 최대한 인간의 생각과 유사한 답변을 내놓도록 훈련을 받는다. 이 과정에서 저작권과 같은 타인의 권리를 침해하거나 낮은 신뢰도, 또는 비윤리적인 정보까지 받아들이는 등 무분별한 데이터 학습 문제가 조만간 수면위로 부상할 것이란 게 업계 관측이다.

배경훈 LG AI연구원장 [사진=LG]

◆초거대 AI 학습 자료, 저작권 문제 없을까?
21일 관련 업계에 따르면 LG AI연구원은 최근 AI 모델에 사용된 학습 데이터셋이 법적 리스크는 없는지, 또 사전에 이 데이터를 사용하는데 위험 요소는 없는지를 검증할 수 있는 AI 에이전트(AI Agent) '넥서스(NEXUS)'를 공개했다.

수천, 수만개의 데이터소스가 연결된 데이터셋은 수없이 재배포 되면서 사람이 일일이 출처를 추적하는 것이 사실상 불가능하다. 또 재배포되는 각 단계마다 수십 개 혹은 수백 개의 데이터셋들과 연결돼 있기도 하다. 이렇게 복잡하게 연결된 데이터셋의 안전성을 파악하기는 매우 어렵다. 데이터셋의 복잡성은 결국 메타의 사례처럼 심각한 법적 리스크로 연결될 수 있다.

실제로 LG AI연구원이 지난 한 해 동안 잠재적 위험 요소를 식별해 보완한 결과 '저작권 관련 법적 문제', '민감 데이터 사용으로 인한 프라이버시 침해' 등 데이터 관련 내용이 전체 46%로 가장 많았다. LG AI연구원은 '모든 문제는 데이터 문제로부터 시작된다'는 인식 아래 데이터셋의 법적 투명성과 안정성 확보를 중심으로 개선 방안을 고민했다.

LG AI연구원이 공개한 NEXUS [사진=LG AI연구원]

◆LG AI가 1분 만에 리스크 판단, "변호사 선임 비용 줄었네"
LG AI연구원의 '넥서스'는 데이터셋의 복잡한 계층 구조까지 찾아 자동으로 분석한다. AI가 미국, 영국, EU, 한국, 중국을 포함한 다양한 관할권의 저작권법, 판례 및 AI 규제 등을 고려해 리스크를 평가, 각 단계에서 발생할 수 있는 라이선스 충돌, 권리관계 불일치, 개인정보 포함 여부 등을 자동으로 감지한다. 이에 대한 구체적인 리스크 평가 결과를 7개의 위험 등급으로 나눠 제공해준다. 라이선스를 명백히 위반했을 경우 가장 낮은 등급을 부여하는 식이다.

LG AI연구원이 개발한 AI 모델 '엑사원 3.5(EXAONE 3.5)'를 기반으로 한 넥서스는 정확성과 속도 면에서 높은 성과를 달성했다. 자체 검증 결과 인간 대비 45배 이상 빠른 속도로 작업을 완료하면서 비용은 700분의 1 수준으로 절감할 수 있었다. 인간이 하나의 데이터셋에 대해 라이선스 정보를 찾고 이를 종합해 법적 위험을 평가하는 전체 프로세스의 수행 시간은 2400초가 걸린 반면 넥서스는 단 53.1초 만에 끝냈다. 비용도 0.29달러(약 300원 내외)로 변호사와 같은 전문가가 검토하는 것 보다 큰 폭의 비용 절감 효과를 끌어낼 수 있게 됐다.

LG는 넥서스가 대규모로 라이선스 검토가 이뤄져야 하는 산업 현장, 연구 기관, 법무 부서 등에서 신속성과 정확성은 물론 경제성까지 모두 충족시켜줄 수 있을 것으로 기대하고 있다. 궁극적으로 넥서스를 AI 개발자를 위한 법적 리스크 관리 시스템으로 발전시켜 안전하고 책임 있는 AI 생태계 구축에 기여하는 것을 목표로 하고 있다.

LG AI연구원 관계자는 "향후 세상에 존재하는 모든 데이터의 라이프 사이클을 파악할 수 있는 규모로 확대할 계획"이라며 "현재 18개 평가 항목은 AI 모델과 데이터 사용 패턴의 변화를 반영해 지속적으로 고도화하고, 글로벌 AI 커뮤니티 및 법률 전문가와 협력해 국제 표준으로 발전시킬 계획"이라고 말했다.

구광모 LG그룹 회장 [사진=LG]

◆"개발 비용이 딥시크 보다 싸다고?"...LG "글로벌 경쟁력 충분"
넥서스의 기반이 된 '엑사원'을 개발한 LG그룹과 LG AI연구원은 최근 어느 때 보다 바쁜 행보를 보이고 있다. 특히 배경훈 LG AI연구원장이 지난 6일 "엑사원 3.5 모델을 개발하는데 70억원이 들었다"고 밝히면서 주목을 끌었다. 딥시크의 개발비용(약 78억원) 보다 더 낮은 비용이 들었다는 이야기다. 우리나라도 적은 비용으로 딥시크에 뒤지지 않는 AI를 개발할 수 있는 사례로 알려졌다. 정부가 '3대 AI 강국' 도약을 선언한 지난 17일 최상목 대통령 권한대행 부총리 겸 기획재정부 장관 주재 회의에서도 배 원장이 정책 제언에 나서기도 했다.

이 자리에서 배 원장은 "LG AI연구원도 현재 엑사원 추론 강화 모델을 준비하고 있으며 조만간 공개 가능하다"며 "우리나라 AI 기술도 글로벌에서 충분히 경쟁할 수 있는 역량이 있다"고 강조했다. 엑사원 3.5 32B 모델은 최근 미국 에포크(Epoch) AI가 선정한 '주목할 만한 AI(Notable AI Model)'에 등재됐다. 에포크 AI는 과학자들로 구성된 미국의 비영리 AI 연구 기관으로 모델의 성능, 사용 빈도, 학습 비용 등 AI 모델 주요 요소 심사를 통과해야 등재가 가능하다. 우리나라도 외부 전문가들로부터 인정받는 글로벌 수준의 AI 모델을 보유하고 있다는 의미다.

다만 엑사원은 LG그룹 전 계열사에 접목해 신약 개발을 비롯한 신사업 발굴에 초점이 맞춰진 산업분야에 특화된 모델이다. 개인이 자유롭게 사용할 수 챗GPT나 딥시크와는 현재 성격이 다르다. LG AI연구원은 지난해 12월 엑사원 3.5의 오픈소스를 공개하며 AI 연구 생태계를 촉진시키는 역할을 하고 있다. 이는 구광모 LG그룹 회장의 경영이념과도 맞닿아 있다. 구 회장은 올해 신년사에서 "AI와 같은 첨단 기술을 일상에서 편리하게 사용할 수 있게 해 소중한 시간을 보다 즐겁고 의미 있는 일에 쓰는 새로운 라이프 스타일을 만들어 가겠다"고 강조한 바 있다.  

syu@newspim.com

[뉴스핌 베스트 기사]

사진
'소년공'에서 대통령까지…이재명은 누구? [서울=뉴스핌] 박성준 기자 = '흙수저' 출신 이재명 더불어민주당 대선 후보가 4일 제21대 대통령으로 당선됐다. 1964년 12월 22일 경북 안동에서 태어난 그는 가난한 집안에서 성장했으며, 경제적 어려움으로 경기도 성남시 상대원공단에서 5년간 '소년 노동자'로 일하며 생계를 이어갔다. 검정고시로 중학교와 고등학교 학력을 취득했고, 중앙대학교 법학과에 장학생으로 진학해 1986년 제28회 사법시험에 합격했다. 이재명 대통령은 당시 변호사로서 산업재해 피해자, 노동자 등 사회적 약자를 위한 소송을 맡았다. 성남시립의료원 설립 운동과 지역사회 부정부패 고발 등 시민운동을 주도하며 사회 문제 해결에 적극 참여했다. 이러한 활동을 통해 정치의 필요성을 느껴 2006년 열린우리당 소속으로 성남시장 선거에 처음 출마했으나 낙선했고, 2010년 제5회 지방선거에서 성남시장에 당선됐다. 성남시장으로 재임하면서 무상교복, 청년배당, 시립의료원 설립 등 복지 정책을 도입하고 재정개혁을 추진했다. 특히 2015년에는 국내 최초로 기본소득 개념을 도입한 '청년배당' 정책을 추진해 주목을 받았다. [서울=뉴스핌] 윤창빈 기자 = 제21대 대통령 당선이 확실시 되는 이재명 더불어민주당 대선 후보가 4일 서울 여의도 국회 정문 앞에 마련된 개표방송 야외무대에서 연설을 하고 있다. 2025.06.04 pangbin@newspim.com  이후 2018년 제7회 전국동시지방선거에서 경기도지사로 선출돼 2021년 10월 25일까지 재임하며, 경기도 전역으로 복지정책을 확대하고 재정 건전성을 강화했다는 평가를 받았다. 성남시장과 경기도지사 재임 중 추진한 복지·개혁 정책으로 전국적인 주목을 끌었다. 2022년 8월 더불어민주당 제5차 전당대회에서 77.8%의 득표율로 당대표로 선출됐다. 앞서 2021년 민주당 경선에서 50.29%의 득표율로 제20대 대통령 선거 후보로 확정됐으나, 윤석열 당시 국민의힘 대선 후보에 0.73%p 차이로 낙선했다. 이후 21대 대선 경선에서는 '어대명'(어차피 대통령은 이재명)이라는 신드롬을 형성하며 지지를 모았다. 그는 정치 경력 전반에서 가족과 관련된 논란으로 주목받았다. 부인 김혜경 씨의 법인카드 유용 의혹, 아들의 도박 및 성적 게시글 논란, 친형 강제입원 논란 등 가족 문제는 꾸준히 제기됐다. 국회에서는 그의 체포동의안이 2023년 9월 21일 가결됐고, 위증교사, 대장동, 백현동 개발 등과 관련한 사법적 절차가 이어졌다. 관련 사건들에 대해서는 일부 무죄 판결이나 불기소 결정이 내려졌고, 일부 사건은 재판이 진행 중이다. 이 대통령은 민생, 복지, 공정, 민주주의 등 위기 극복을 국정 방향으로 제시했다. 출생기본소득, 사립대 등록금 완화, 남북관계 개선 등 공약을 통해 민생경제와 사회적 약자 지원을 주요 과제로 설정했다. 아울러 경제 불평등 해소, 사회적 약자 보호, 지역균형 발전 등 정책 과제를 강조하며 취임 초 국정 운영의 기조를 밝혔다. [서울=뉴스핌] 정일구 기자 = 이재명 더불어민주당 대선 후보가 2일 오후 서울 여의도공원 문화의마당에서 열린 마지막 유세에서 애국가를 부르고 있다. 2025.06.02 mironj19@newspim.com 이 대통령은 자신의 정치 경력과 맞닿아 있는 경제적 약자 정책을 통해 복지와 공정에 방점을 찍었다. 실용, 미래비전을 강조하며 청년층의 일자리, 자산 형성, 주거 안정, 사회 안전망 강화를 위한 다양한 정책을 발표하기도 했다. 공약 이행을 위한 재원 확보와 정책 추진은 앞으로 국정 운영에서 중요한 과제로 남아 있다. 정치 경력 외적으로 이재명 대통령은 가족과의 갈등, 어린 시절의 경제적 어려움 등을 수차례 언급했다. 그는 과거를 돌아보며 가족 간 갈등과 빈곤을 극복하는 과정을 개인적으로 중요한 계기로 설명해 왔다. 이러한 개인사와 정치 경력은 이재명 대통령의 이미지를 형성하는 요소로도 함께 거론되고 있다. 그는 취임 초기 국정 과제를 중심으로 업무를 준비할 전망이다. 출생기본소득, 사립대 등록금 완화, 남북관계 개선 등 공약 이행에 따른 정책 결정과 추진, 재정 부담 문제 등이 현안으로 부각되고 있다. 가족과 관련된 논란, 사법 리스크 등은 앞으로도 정치적 논쟁의 한 축으로 계속 제기될 것으로 관측된다. 그의 당선은 대한민국 정치사에서 대표적인 '흙수저' 출신 대통령으로 기록된다. 이 대통령 출신과 정치 경력, 복지·개혁 중심의 정책 기조는 향후 국정 운영의 방향을 가늠하는 주요 지표로 꼽히고 있다. 앞으로의 행보는 취임 초기 공약 이행과 동시에 정치적 신뢰와 국민통합 과제에 직면할 것으로 보인다. parksj@newspim.com 2025-06-04 02:34
사진
이재명 49.42 김문수 41.15 이준석 8.34% [서울=뉴스핌] 박성준 기자 = 제21대 대통령선거에서 이재명 더불어민주당 후보가 최종 승리를 확정지었다. 중앙선거관리위원회가 4일 오전 발표한 개표 결과에 따르면 이 후보는 총 1728만7513표(득표율 49.42%)를 얻어 제21대 대통령으로 당선됐다. 김문수 국민의힘 후보는 1439만5639표(41.15%)를 기록해 2위에 머물렀다. 두 후보 간 표 차이는 약 220만 표로 벌어졌다. 이준석 개혁신당 후보는 291만7523표(8.34%)를 득표했다. 권영국 민주노동당 후보는 34만4150표(0.98%), 무소속 송진호 후보는 3만5791표(0.10%)를 각각 얻었다. [서울=뉴스핌] 윤창빈 기자 = 제21대 대통령 당선이 확실시 되는 이재명 더불어민주당 대선 후보가 4일 서울 여의도 국회 정문 앞에 마련된 개표방송 야외무대에서 인사를 하고 있다. 2025.06.04 pangbin@newspim.com 이재명 후보는 호남권에서 압도적인 지지를 받았다. 광주(84.77%), 전남(85.87%), 전북(82.65%)에서 80%를 넘는 득표율을 기록하며 전체 승리를 견인했다. 최대 승부처로 꼽혔던 수도권에서도 우위를 보였는데, 서울에서는 47.13%, 인천에서는 51.67%를 기록했다. 특히 경기도에서는 52.20%의 득표율로 과반을 확보해 승리를 굳혔다. 반면 김문수 후보는 대구(67.62%), 경북(66.87%), 경남(51.99%) 등 영남권에서 강세를 보이며 지지 기반을 결집했다. 부산에서도 51.39%를 득표해 이재명 후보(40.14%)를 앞섰으나, 수도권과 호남에서의 열세를 극복하지는 못했다. 이준석 후보는 세종(9.89%), 제주(8.83%), 대전(9.76%) 등에서 두 자릿수에 육박하는 지지를 받았다. 권영국 후보는 노동과 진보정치의 메시지를 내세웠지만 1% 미만의 득표율에 그쳤고, 무소속 송진호 후보도 상징적 득표에 머물렀다. 이번 대선의 최종 투표율은 79.42%로 집계됐다. 전체 선거인 수는 4439만1871명이며, 투표자 수는 3523만6497명, 유효투표수는 3498만616표, 무효표는 25만5881표였다. 중앙선관위는 이날 오전 중으로 최종 당선인을 공식 발표할 예정이다. parksj@newspim.com 2025-06-04 05:25
안다쇼핑
Top으로 이동