복지부·과기정통부 추진 'K-멜로디' 프로젝트 주관
데이터 활용 수익 나누는 '국민신약배당' 정책 제안
[서울=뉴스핌] 김신영 기자 = "선진국의 제약·바이오 산업은 이미 앞서가고 있습니다. 한국도 지금 이 시점에 AI를 잘 접목한다면 바이오 선진국으로 도약할 수 있는 터닝포인트가 될 겁니다."
정부 주관의 연합학습 기반 신약개발 가속화 프로젝트 'K-멜로디'가 출범한 지 1년이 지났다. 이 프로젝트를 이끄는 김화종 한국제약바이오협회 K-멜로디 사업단장(AI신약융합연구원장)은 "AI 신약개발이 활성화되려면 정부가 데이터 활용 인프라를 마련해야 한다"고 강조했다.
![]() |
[서울=뉴스핌] 김신영 기자 = 김화종 한국제약바이오협회 K-멜로디 사업단장(AI신약융합연구원장) 2025.09.18 sykim@newspim.com |
K-멜로디 프로젝트는 보건복지부와 과학기술정보통신부가 추진하고 한국제약바이오협회가 주관한다. 연합학습 기반의 공공 데이터 플랫폼을 구축해 AI 신약개발을 지원하는 것이 목표다. 사업 기간은 2024년부터 2028년까지이며 총 사업비는 348억 원이다. 주요 내용은 ▲연합학습 플랫폼 구축 ▲신약개발 데이터 활용 및 품질 관리 ▲연합학습 플랫폼 활용 활성화 등이다.
연합학습은 데이터를 중앙에 모으지 않고도 AI 모델을 학습시켜 성능을 높이는 기술이다. 2017년 구글이 처음 제안한 아이디어로, 데이터를 직접 모아 만든 모델과 유사한 성능을 낼 수 있다. 데이터 자체가 외부로 이동하지 않아 개인정보 유출 우려를 막으면서도 분산된 데이터를 활용할 수 있다는 장점이 있다.
김 단장은 "연합학습 기술을 국내에 도입해야겠다고 생각하던 당시 제약바이오협회 신약개발지원센터장을 맡고 있었고, 유럽에서 EU 멜로디 프로젝트가 진행되는 것을 참고해 한국형 AI 신약개발 프로젝트를 제안하게 됐다"고 설명했다.
그는 "각 제약사와 병원이 보유한 데이터가 모두 달라 개별적으로 AI 모델을 만들 경우 성능이 떨어진다"며 "K-멜로디는 20개 기관의 데이터를 모아 플랫폼을 구축한다"고 말했다.
해외에서 AI 모델을 도입하려면 최소 수천만 원이 소요되는 만큼, K-멜로디 플랫폼은 장기적으로 비용 절감에도 기여할 것으로 기대된다.
김 단장은 K-멜로디의 성과가 빛을 발하려면 AI 모델이 바이오 데이터를 연합학습할 수 있는 제도적 뒷받침이 이어져야 한다고 강조했다.
그는 "연합학습은 개인정보 유출 우려가 없지만, 제약사나 병원은 내부 데이터가 학습에 쓰였다는 사실만으로도 민감할 수 있다"며 "유권해석상 개인정보 침해가 아니라는 점이 이미 입증돼 활용되고 있고, 유럽도 이를 인정해 EU 멜로디 프로젝트를 진행했지만, 법제화가 뒷받침된다면 더욱 활성화될 것"이라고 말했다.
이어 "현재 일부 참여 기관은 데이터를 학습시키려면 임상연구심의위원회(IRB) 승인을 받아야 한다"며 "연합학습의 특성을 인지하면서도 병원 정보 등의 활용에는 절차가 필요하다는 의미"라고 덧붙였다.
그는 "앞으로 다양한 AI 모델이 필요할 텐데, 매번 IRB를 거치면 서류 업무 등에 시간이 소요돼 기존 방식과 다르지 않다"며 "제약사와 병원의 데이터를 연합학습을 통해 간접적으로 학습시키는 경우는 허용할 수 있도록 법적 장치가 필요하다"고 지적했다.
이재명 정부가 출범 직후 'AI 대전환'을 선언하며 대규모 투자를 예고한 가운데 김 단장은 "정부가 단순히 GPU 구매를 지원하거나 장비를 제공하는 것은 큰 의미가 없다"며 "파편화된 정보를 체계적으로 데이터화할 수 있는 제도 마련이 관건"이라고 강조했다.
김 단장은 우리나라의 건강보험 데이터를 AI 모델 학습에 활용할 경우 신약 개발에 큰 속도가 붙을 것으로 전망했다. 환자의 처방 및 치료 이력이 집적된 방대한 바이오 데이터가 일원화된 나라는 드물기 때문이다.
그는 "우리나라가 반도체, 디스플레이, 메모리, 스마트폰 등 IT 분야에서 막대한 수익을 올려왔지만 더는 성장세가 예전만 못하다"며 "바이오 산업으로 눈을 돌려야 한다. 선진국 가운데 바이오 산업이 빠진 나라는 우리뿐"이라고 했다.
이어 "바이오는 과학자의 경험과 노하우가 없으면 불가능한 영역으로 여겨졌으나 AI의 등장으로 상황이 달라졌다"며 "데이터를 잘 활용한다면 선진국과의 격차를 줄일 수 있다"고 말했다.
이를 구체적으로 실현할 방법으로 그는 '국민신약배당' 정책을 제시했다. 국민의 건강보험·진료·유전체 데이터를 직접 이동시키지 않고 연합학습 방식으로 활용해 신약 AI 예측모델을 개발하고, 여기서 발생한 수익 일부를 국민에게 환원하자는 구상이다.
연합학습으로 개인정보 침해 우려를 줄이면서 실제 의료 현장에서 축적된 리얼월드데이터(RWD)를 활용해 신약 AI 예측모델을 개발하고, 나아가 신약 개발 경쟁력을 높이겠다는 것이다. 여기에 국민에게 데이터 활용에 따른 배당을 제공한다면 선순환 구조가 만들어질 것으로 기대된다.
김 단장은 "내년은 K-멜로디 프로젝트가 시작된 지 3년 차로, 1차 성과를 보여줄 시점"이라며 "연합학습의 성능과 안전성을 입증해 활용 가능성을 확인하고, 이를 토대로 프로젝트를 확장해 나가고 싶다"고 전했다.
sykim@newspim.com