외대 레이슨 리치, 3년 동안 4만2000편 읽고 분석
[뉴스핌=이영기 기자] 북한의 행태를 예측하기 위해 조선중앙통신 등 북한 언론의 보도 문구에 대한 연구가 진행되고 있다. 머신러닝을 활용해 북한 핵실험 시기의 73.2%를 예측하기도 하고 또 실질적인 군사공격으로 이어지지 않은 '무해한' 화법을 96.7% 식별해내는 필터도 만들어 내고 있어 주목된다.
13일(현지시간) 월스트리트저널(WSJ)은 북한의 핵과 미사일을 분석하는 군사 전문가들과는 달리, 언어 분석을 통해 북한의 행태를 예상하는 흥미로운 연구가 진행되고 있다 보도했다.
이들의 연구대상은 최근 도널드 트럼프 미국 대통령을 향했던 '늙다리 미치광이' 등에서 과거 조지 W 부시에 대한 '멍청이 소몰이꾼'에 이르기 까지 북한의 언론 보도문에서 사용한 모욕적인 단어들이다.
현재 한국 외대 국제지역대학원 교수인 미국인 메이슨 리치가 한 예로 그는 2010년 이런 방식의 연구를 시작했다. 1997∼2006년 조선중앙통신이 보도한 영문 기사 4만2000여편을 읽고 분석하는 데에만 3년이 걸렸다.
리치 교수는 "북한처럼 적대적인 언어를 집요하게 만들어서 사용하는 나라도 없을 것"이라며 북한의 수사법을 소개했다.
그는 프랑스의 컴퓨터 언어학자 나탈리아 그라바르와 공동으로 올해 미 육군대학원 학술지에 논문을 발표했다. 북한 언론보도를 주제에 따라 분류한 뒤 자연어 처리를 기반으로 기사 속 구문들의 차이점을 분석했다.
리치는 "북한이 그들이 부사나 형용사를 얼마나 많이 사용하는가에 따라 그들이 어떤 대상에 대해 얼마나 화가 나 있는지를 알 수 있다"고 말했다.
북한의 제8차 군수공업대회가 12일 폐막했다고 노동당 기관지 노동신문이 13일 보도했다. 사진은 관련 보도 일부.<사진=북한 노동신문 캡쳐> |
북한이 트럼프 대통령을 '늙다리 미치광이'라고 했을 때가 그 일례로 딱이다. 트럼프는 지난달에 "나는 김정은을 땅달보나 뚱뚱보라고 하지 않는데 왜 나를 '늙다리'라고 모욕을 퍼붓는지 모르겠다'고 트위터를 날린 적이 있다. 이후 조선중앙통신은 '늙다리 미치광이'라는 용어를 아홉번의 보도문에서 사용했다.
또 다른 예로 미 머시허스트대의 마이클 람브라우 교수는 북한이 쓰는 욕설을 통해 평양의 군사적 움직임을 분석할 수 있다고 봤다.
머신러닝을 활요한 람브라우 교수는 북한 핵실험 시기의 73.2%를 예측하는 컴퓨터 프로그램을 개발했다. 또 실질적인 군사 공격으로 이어지지 않은 '무해한' 북한의 레토릭을 식별하는 필터를 사용해 96.7%의 정확도를 얻었다.
그는 최근 논문에서 "북한은 실제로 물기 전 매우 크게 짖는 개의 행태를 보인다"며 "야구에서 투수가 공을 던지기 전에 자기도 모르게 움찔하듯이, 북한도 군사 공격을 하기 전 무의식적으로 어떤 패턴을 보여준다"고 설명했다.
[뉴스핌 Newspim] 이영기 기자 (007@newspim.com)