실제 사용자 데이터 없이 LL 학습 데이터 만들어 뉴스 추천
가상의 사용자 시뮬레이션 'LAUS' 개발, 개인정보 침해 등 해결
[서울=뉴스핌] 채송무 기자 = 업비트 운영사 두나무(대표 오경석)는 본사 머신러닝팀의 개인화 뉴스 추천 연구 논문이 세계 최고의 정보검색학회인 'SIGIR 2025' 메인 컨퍼런스에서 발표됐다고 16일 밝혔다.
![]() |
[서울=뉴스핌] 채송무 기자 = 업비트 운영사 두나무(대표 오경석)는 본사 머신러닝(ML)팀의 개인화 뉴스 추천 연구 논문이 세계 최고 수준 정보검색학회 'SIGIR 2025'에 채택, 메인 콘퍼런스에서 발표했다고 밝혔다. [사진=두나무]2025.07.17 dedanhi@newspim.com |
발표 논문의 제목은 'LLM 기반 사용자 시뮬레이터: 실제 사용자 상호작용 없이 뉴스 추천 모델을 학습하기 위한 방법론'으로, 실제 사용자 데이터 없이 LLM(대규모 언어 모델)으로 가상의 이용자를 생성해 학습 데이터를 만들고, 이를 바탕으로 뉴스를 추천하는 방안에 대해 다뤘다. 기존 뉴스 추천 시스템에 필요했던 이용자 로그에 대한 의존도를 대폭 해소했다.
기존 뉴스 추천 방식은 머신러닝 모델의 학습을 위해 클릭 로그나 뉴스 선호도 등의 사용자 데이터를 수집해야 했으나, 이는 대규모 데이터 확보의 어려움과 개인정보 침해 우려 문제가 있었다. 두나무 머신러닝팀은 이를 해결하기 위해 가상의 사용자를 시뮬레이션하는 'LAUS'라는 프레임워크를 개발, 새로운 대안을 제시했다.
이번 연구 결과, LAUS는 기존 학습 데이터 없이도 뉴스를 추천하는 '제로샷(zero-shot)' 방식 대비 높은 성과를 보였고, 동시에 지연 시간(latency)도 짧게 유지하는 것으로 검증됐다.
또한 노르웨이어, 영어 등 다양한 언어권의 뉴스 추천 시스템 비교평가에서 실제 사용자 데이터로 학습된 모델과 유사한 수준의 성능을 보였다. 이를 통해 방대한 데이터를 별도로 수집하지 않아도 고품질 개인화 서비스를 빠르게 구축할 수 있는 가능성이 확인됐다.
박충원 두나무 머신러닝팀 연구원은 지난 14일 현장에서 이 시스템의 연구 성과를 발표하며 "개인화 뉴스 추천 시스템 품질은 이용자가 원하는 정보를 얼마나 정확히 제공하는가와 직결돼 서비스 만족도를 높이는 핵심 요소"라며 "이번 연구를 통해 고객 정보 보호와 운영 효율성을 모두 충족하면서 더욱 정교한 추천 서비스를 제공할 수 있는 기반을 마련하게 돼 기쁘다"고 소감을 밝혔다.
두나무 머신러닝팀은 주식 및 디지털 자산 시장을 위한 AI 모델을 연구하고 있으며, 지난해 11월 금융 허위정보 탐지 챌린지에서 성과를 올리는 등 글로벌 연구력 역시 인정받고 있다.
dedanhi@newspim.com