데이터 재학습 없이 삭제 요청 즉시 반영
[서울=뉴스핌] 황혜영 기자 = 중앙대학교는 산업보안학과 김호기 교수 연구팀이 산업 AI(인공지능) 시스템에서 특정 데이터를 선택적으로 잊게 만드는 머신 언러닝 기술을 개발하고 관련 논문을 국제 학술지에 게재했다고 10일 밝혔다.
연구팀은 최근 논문 'Adversarial Retain-Free Unlearning for Bearing Prognostics and Health Management'를 SCIE 기준 상위 약 5%에 해당하는 산업 인공지능·스마트 제조 분야 권위지로 평가되는 국제 학술지 'IEEE Transactions on Industrial Informatics'에 게재했다.

연구팀이 제안한 기술은 데이터 삭제 요청이 들어와도 기존 모델을 처음부터 다시 학습시키지 않고 문제 데이터를 효과적으로 제거할 수 있도록 한 것이 핵심이다.
해당 연구는 한국연구재단(NRF)과 정보통신기획평가원(IITP)의 지원을 받아 진행됐다.
산업 현장에서는 베어링 등 핵심 부품의 고장 진단을 위해 AI 기반 예지·진단 시스템이 널리 활용되지만 대규모 데이터와 복잡한 모델 구조 때문에 삭제 요청이 있을 때마다 전면 재학습을 하는 것은 비용과 시간이 지나치게 많이 든다는 한계가 있었다.
개인정보 보호 규제와 데이터 거버넌스 요구가 강화되는 상황에서 이러한 제약은 시급한 기술 과제로 지적돼 왔다.
김 교수 연구팀은 이 문제를 해결하기 위해 적대적 공격(adversarial attack)과 의미 기반 손실 함수(semantic-driven loss)를 결합한 새로운 프레임워크 'ARU(Adversarial Retain-Free Unlearning)'를 제안했다.
ARU는 사전 학습된 모델과 삭제 대상 데이터로부터 '대체 유지 샘플(surrogate retain-like samples)'을 생성해 실제 유지 데이터를 다시 불러오지 않고도 모델의 구조적 안정성을 유지하도록 설계됐다.
이를 통해 삭제해야 할 데이터에 대한 영향은 지우면서 나머지 데이터에서 학습된 성능은 최대한 보존하는 것을 목표로 한다.
연구팀은 공개 베어링 데이터셋과 산업용 베어링 데이터를 활용해 ARU의 성능을 검증했다. 실험 결과 ARU는 기존 머신 언러닝 기법보다 더 높은 '망각 성능(삭제 대상 데이터에 대한 성능 저하)'을 보이면서도 고장 진단 정확도는 안정적으로 유지하는 것으로 나타났다.
연구팀은 이를 통해 실제 산업 설비 상태 진단 시스템에서도 데이터 삭제 요구를 효율적으로 처리할 수 있는 가능성을 입증했다고 설명했다.
김호기 교수는 "스마트 팩토리 등 산업 전반에 AI 활용이 확산되면서 데이터 권리 보호와 시스템 신뢰성 확보가 동시에 중요한 과제로 부상하고 있다"며 "이번 연구는 산업 AI 환경에서도 특정 데이터를 안전하게 제거할 수 있는 기술적 기반을 처음으로 제시했다는 점에서 의미가 크다"고 말했다.
그는 "앞으로도 머신 언러닝과 신뢰할 수 있는 인공지능(trustworthy AI) 연구를 지속해, 실제 산업 환경에 적용 가능한 기술로 발전시켜 나가겠다"고 덧붙였다.
hyeng0@newspim.com












