[서울=뉴스핌] 양진영 기자 = 문화체육관광부는 한국국제문화교류진흥원과 함께 'AI 기반 한류 빅데이터 대시보드' 서비스를 시작했다고 밝혔다.
해당 대시보드가 국내가 아닌 해외 소셜미디어 빅데이터를 실시간으로 자동 수집․분석한다는 점에서 한류 관련 업계와 학계에 유용하게 활용될 것으로 예측된다.
해외 한류 소셜미디어 데이터의 실시간 수집․분석 체계 구축
대시보드의 분석 체계는 크게 ▲실시간 빅데이터 수집․적재 ▲자동화 빅데이터 분석 ▲분석 결과 시각화 등 3가지 요소로 구성돼있다. 동영상 플랫폼 유튜브(YouTube), 해외 커뮤니티 레딧(Reddit)과 아이엠디비(IMDb), 언론 데이터베이스 렉시스넥시스(LexisNexis) 등 4개 소스, 862개 채널에서 한류 인물·콘텐츠의 소셜미디어 반응을 실시간으로 수집해 빅데이터를 구축한다. 적재된 데이터는 자연어처리, 한류 특화 개체명인식(NER) 등 AI 기술에 의해 정제된 뒤 장르별, 콘텐츠별로 다각도로 분석된다.
대시보드 메인화면. [사진=한국국제문화교류진흥원] |
주요 분석 항목은 ▲권역별 긍․부정 반응 및 변화 트렌드 ▲주요 게시글 원문 제공 ▲소셜미디어 토픽 분석 등이다. 분석된 결과는 대시보드에서 시계열 그래프, 키워드 연결강도 등 다양한 시각화 기법으로 제시된다. 이를 통해 사용자는 인물․콘텐츠의 연관 키워드, 연관 토픽, 긍․부정여론 등 종합적인 정보를 한눈에 파악할 수 있다.
AI 적용으로 데이터 정교화 및 분석 자동화 구현
한편 대시보드는 데이터 수집에서 분석, 시각화까지 AI 기술을 활용해 전 과정을 자동화했다. AI 머신러닝을 통해 분석 결과를 지속 학습․반영해 데이터 처리의 정교성을 높였다. 무엇보다 끊임없이 변화하는 한류 관련 키워드를 자동으로 학습해 데이터 수집을 위한 라이브러리를 업데이트하는 기능을 갖춘 점이 장점이다. 이뿐만 아니라 분석 과정에서도 AI 기술이 적용돼 키워드 빈도, 감성분석, 토픽모델링, 온톨로지 분석 등 자동화된 심화분석 결과를 제공한다.
대시보드 분석결과 예시(세계 권역별 감성 분석) [사진=한국국제문화교류진흥원] |
한류 산업계 비즈니스 전략 수립 및 학계 인사이트 제공 기대
진흥원은 한류 빅데이터 대시보드를 통해 대내외 수요에 부응하는 다양한 빅데이터 와 분석결과를 업계, 학계에 지속적으로 공유할 예정이다. 산업계에는 권역별 한류 트렌드, 인물·콘텐츠 반응 분석 등의 실시간 시장정보를 제공해 선제적 시장대응과 마케팅·유통전략 수립, 신규 한류 사업 발굴 등을 뒷받침한다. 한류 연구자들에게는 키워드 분석, 문화권·장르별 분석, 토픽모델링과 가속도 분석, 감성 분석, 원천데이터 등 다양한 연구자료를 제공해 한류 연구의 폭을 넓힐 수 있도록 지원할 계획이다.
정길화 진흥원 원장은 "시의성과 정확성을 겸비한 한류 정보 제공을 위해 수집범위와 분석방법을 지속적으로 확대․발전시켜 나갈 것"이라며 "한류 산업 진흥과 연구 지원에 기여할 수 있도록 다각도의 노력을 이어가겠다"고 밝혔다.
jyyang@newspim.com