전체기사 최신뉴스 GAM
KYD 디데이

"한국형 LLM 본격화"…'비큐AI' 실시간 솔루션 주목

기사입력 : 2025년07월07일 08:38

최종수정 : 2025년07월07일 08:38

[서울=뉴스핌] 이나영 기자= 최근 한국형 대형언어모델(LLM) 개발이 본격화될 것으로 예상되면서 인공지능에 필요한 양질의 데이터 확보가 주요 전략 과제로 부상하고 있다. 이와 관련해 국내 기업 '비큐AI'는 데이터 저작권 문제 해결과 동시에 AI모델의 신뢰성 향상을 위한 데이터 파이프라인 솔루션 'RDPLINE(Real-time Data Pipeline)'을 제공하고 있어 주목받고 있다.

과학기술정보통신부는 최근 '소버린 AI(자주적 AI)' 구축을 위한 독자 AI 파운데이션 모델 개발을 공식화하며, 고품질 데이터의 중요성을 강조했다. 김경만 과기부 정보통신정책관은 고품질 데이터는 AI의 성능을 좌우하는 핵심 자산이라고 언급하면서 신뢰도 높은 콘텐츠 확보에 나설 것임을 강조했다.

비큐AI 로고. [사진=비큐AI]

7일 업계에 따르면 뉴스는 정치, 사회, 문화, 과학 등 다양한 카테고리를 포함하며 사실 기반의 정제된 문장, 이미지, 통계 자료 등을 포괄하고 있어 AI 모델 학습에 가장 이상적인 데이터셋이라는 평가를 받고 있다.

실제로 챗GPT-3의 학습에 사용된 4990억 토큰 중 4320억 토큰이 웹에서 수집됐으며, 그 중 높은 비율로 뉴욕타임즈 등 주요 언론사들의 뉴스데이터가 활용된 것으로 알려져 있다. 네이버의 하이퍼클로바X의 경우에도 5618억 토큰 중 뉴스데이터는 800억 가량으로 높은 비중을 차지하고 있다.

또한 뉴스데이터는 AI 서비스의 고도화와 실시간성 확보를 위한 핵심 데이터로도 주목받고 있다. AI의 대표적 부작용인 할루시네이션 현상과 정보 편향 문제를 해결하기 위해서 신뢰할 수 있는 실시간 데이터의 지속적 반영이 필수적이다. 이러한 측면에서 매일 새롭게 생성되는 뉴스데이터는 그 역할을 효과적으로 수행할 수 있는 최적의 자산으로 주목된다.

최근 '소버린AI' 구축을 목표로 개발이 본격화되고 있는 한국형 대형언어모델(LLM)은, 한국어의 문맥 이해는 물론 사회·정치적 맥락과 문화적 배경까지 정밀하게 반영해야 하는 과제를 안고 있다. 이에 따라 신뢰도 높은 AI서비스를 제공하기 위해서는 매일 생성되는 최신정보를 반영할 수 있는 '실시간 데이터 파이프라인'의 연결이 필수적이며, 이러한 측면에서 뉴스데이터가 AI의 핵심자산으로 주목받고 있는 것이다.

하지만 뉴스데이터는 '저작권' 문제라는 현실적 장벽에 부딪히고 있다. 생성형 AI 확산에 따라 뉴스 콘텐츠의 무단 활용, 재가공, 요약·생성 등과 관련된 법적 분쟁이 늘고 있으며, 해외에서는 디즈니·유니버설 스튜디오와 오픈AI·뉴욕타임스 간의 소송전이 벌어지고 있다. 국내에서도 뉴스콘텐츠 저작권 침해 여부가 쟁점이 되고 있으며, AI 산업 확산과 유료화 흐름 속에서 뉴스데이터의 경제적·기술적 가치가 재조명되고 있다.

이런 배경에서 민간의 행보도 주목된다. 국내 기업 '비큐AI'는 데이터 저작권 문제 해결과 동시에 AI모델의 신뢰성 향상을 위해 데이터 파이프라인 솔루션 'RDPLINE'을 제공하고 있다.

이 솔루션은 합법적으로 확보하고 정제한 뉴스데이터를 실시간으로 AI의 학습 및 고도화를 위해 공급함으로써, 정확하고 시의성 있는 응답을 가능하게 한다. 또한 할루시네이션, 정보편향 등 생성형AI의 주요 부작용을 완화할 수 있는 현실적인 대안을 제시하고 있다.

비큐AI 관계자는 "데이터 구축과 AI기술에 대한 전문성을 바탕으로, 저작권자와 데이터 수요자 간의 신뢰기반 거래 구조를 제안하고 있다"며 "신뢰할 수 있는 AI를 위한 데이터 확보와 기술개발에 지속적으로 힘쓰며 국내에 바람직한 AI생태계가 구축될 수 있도록 노력하겠다"고 전했다.

 

nylee54@newspim.com

[뉴스핌 베스트 기사]

사진
온열질환 사망자 전년 대비 2배 증가 [서울=뉴스핌] 조민교 기자 = 찜통더위가 이어지면서 올여름 온열질환자 수가 작년 대비 급증했다. 온열질환 추정 사망자는 최근 2명이 추가돼 현재까지 7명으로 집계됐다. 7일 질병관리청의 온열질환 응급실감시체계 신고 현황에 따르면 지난 6일 59명이 온열질환으로 응급실에 내원했다. 이중 2명은 온열질환으로 인해 사망했다. 질병청이 지난 5월 15일부터 전국 의료기관 517곳 응급실을 대상으로 온열질환 감시체계를 가동한 이래 전날까지 누적 온열질환자는 모두 875명이다. [서울=뉴스핌] 김학선 기자 = 서울 전역에 올해 첫 폭염주의보가 발효된 30일 오후 서울 성동구 마장역 인근에서 시민들이 무더위에 힘겨워하고 있다. 2025.06.30 yooksa@newspim.com 지난해 같은 기간(5월 20일~7월 6일)과 비교하면 온열질환자는 469명에서 859명으로 83.2% 증가했다. 올해 온열질환 추정 사망자는 모두 7명으로, 작년 같은 기간(3명)과 비교해 2배 이상 늘어났다. 현재까지 발생한 온열질환자의 76.5%는 남성이었으며 여성은 23.5%였다. 연령별로는 60대가 19.5%로 가장 많았으며 이어 50대, 40대, 30대, 80세 이상, 70대, 20대 순이었다. 65세 이상 고령층이 전체 온열질환자의 33.3%를 차지했다. 직업별로는 단순 노무 종사자(21.0%), 무직(12.0%), 농림어업 숙련 종사자(10.4%)가 많았다. 발생 시간을 보면 오후 4~5시(12.2%), 오후 3~4시(11.5%), 오후 1~2시(9.5%), 오전 10~11시 (9.0%) 등으로 나타났다. 실외 발생이 81.4%였으며 작업장 25.6%, 논밭 16.6%, 길가 14.1% 등이었다. 온열질환은 열로 인해 발생하는 급성질환으로 통상 두통, 어지러움, 근육경련, 피로감 등의 증상을 동반한다. 제때 조치하지 않으면 의식 저하가 나타나면서 자칫 생명이 위태로울 수도 있다. 흔히 일사병으로 불리는 열탈진과 열사병이 대표적이다. 평소 온열질환을 예방하려면 한낮에는 가급적 외출과 야외활동을 삼가고, 갈증을 느끼지 않더라도 물을 자주 마시면서 체내 수분을 적절히 공급해 주는 게 좋다. mkyo@newspim.com 2025-07-07 20:26
사진
삼성전자, 2Q 영업익 56% 뒷걸음 [서울=뉴스핌] 서영욱 기자 = 삼성전자가 전년 동기 대비 절반 이상 하락한 2분기 잠정 영업 실적을 내놨다. 삼성전자가 8일 올해 2분기 잠정 실적을 공시하고 매출 74조원, 영업이익은 4조6000억원을 달성했다고 밝혔다. 전 분기 보다 매출은 6.5%, 영업이익은 31% 줄었다. 작년 동기 대비 매출은 비슷했지만, 영업이익은 56% 가까이 내려앉았다. 서울 서초구 삼성전자 서초사옥 전경 [사진=뉴스핌DB] 이번 잠정치는 한국채택 국제회계기준(IFRS)에 따라 추정한 수치다. 결산을 마치기 전 투자자들의 편의를 위해 먼저 공개한 것이다. 삼성전자는 2009년 7월 국내 기업 처음으로 분기 실적 예상치를 내놨다. 2010년 IFRS를 먼저 적용해 글로벌 기준에 맞춘 정보 제공을 이어가며 투자자들이 보다 정확히 실적을 가늠하고 기업 가치를 판단할 수 있도록 하고 있다. 삼성전자는 이번에도 주주와 소통을 꾀한다. 실적발표 콘퍼런스콜에서 사전에 받은 질문을 중심으로 관심 높은 사안에 답할 계획이다. syu@newspim.com 2025-07-08 07:52
안다쇼핑
Top으로 이동