국내 언론사의 저작권 한 번에 해결…합법적으로 AI 학습에 최적화된 뉴스 데이터 제공
텍스트, 이미지, 영상 등 다양한 뉴스데이터를 dAIa(다이아) 기술로 정교하게 가공
[서울=뉴스핌] 오경진 기자 = 다하미커뮤니케이션즈(이하 다하미)는 AI 학습을 위한 뉴스 데이터 공급 서비스인 NDPT(News data for Pre-Training)를 출시했다고 5일 밝혔다.
'NDPT'는 고품질의 인공지능 학습용 뉴스 데이터 제공 서비스로 25년간 국내 저작권 유통 사업으로 확보한 지면뉴스에서 온라인, 방송 뉴스, 보도사진까지 저작권이 해결된 안전한 데이터를 제공한다.
![]() |
또한, AI빅테크 기업에서 필요로 하는 대형 언어모델(LLM) 및 대형 다중유형 모델(LMM) 구축에 자사의 기술이 접목된 학습용 데이터인 'NDPT'를 사용하면 AI 학습에 최고의 결과를 얻을 수 있을 거라고 다하미 관계자는 말했다.
이번에 출시한 'NDPT' 서비스는 국내 최대의 뉴스 데이터를 텍스트, 이미지, 영상 등 다양한 형태로 보유하고 있다. 여기에 163만 건(하루 평균 200여개)의 정부부처 보도자료까지 확보하고 있어 다양하고 신뢰성 있는 데이터 학습으로 최적의 품질과 데이터 유용성을 보장한다.
뉴스는 정치, 경제, 사회, 문화 등 다양한 주제의 정보를 다루며 지속적으로 발생하기 때문에 AI가 최신 정보를 학습하고 실시간으로 변화하는 상황을 이해하는데 적합하지만, 데이터가 정확하지 않은 경우 학습이 제대로 진행되지 않을 수 있어 양질의 신뢰성 있는 데이터 확보가 관건이다.
'NDPT'는 정확하고 신뢰성 높은 AI 학습 데이터를 제공하기 위해 자사의 특화된 AI 프레임워크인 'dAIa(Dahami Artificial Intelligence Application)'를 적극 활용한다. 이 프레임워크는 국내 뉴스 데이터를 세밀하게 정제하고 검수하는 과정을 거쳐, 데이터의 품질을 극대화한다.
다하미에서 출시한 'NDPT' 서비스는 데이터 제공 범위 및 가격 등이 구체적으로 정해지지 않은 시장 환경에서 많은 언론사와 개별적으로 계약하는 번거로움을 줄이고 국내 언론사와의 저작권 계약을 한 번에 해결 가능하도록 설계된 서비스이다.
2008년 이래 한국언론진흥재단의 공식 유통사로 국내 최대 뉴스 유통 전문업체인 다하미는 지면, 온라인, 방송뉴스를 스크랩하고 보고서로 완성하는 '스크랩마스터'를 세계 최초로 개발했으며, 피알꼭(보도자료 집계 시스템) 등 뉴스 콘텐츠 솔루션을 접목시킨 기술에 대해 개발, 적용시키는 연구를 계속 진행 중이다.
또한, 2016년부터 매년 고용노동부에서 선정하는 '청년친화강소기업'에 (청년들이 선호하는 근로여건을 갖춘 기업) 2024년에도 선정, 9년째 자격을 유지 중이다.
ohzin@newspim.com