본문 바로가기 주요메뉴 바로가기

본문

광고

광고

기사본문

등록 : 2015.10.19 20:43 수정 : 2015.10.19 20:43

총 1994건 문건 빅데이터 기법 분석
전임자들보다 ‘당의 영도’ 더 강조
북 문헌 디지털화 낮아…작업 필요

김정은 제1비서가 북한 노동당 창건 70돌 열병식 연설에서 인민이란 단어를 97번 언급한 것은 얼마나 특별한 일이었을까?

지난 13일 서울 숭실대에서 열린 ‘2015 세계 북한학 학술대회’(조직위원장 조성렬 북한연구학회장)에서는 빅데이터 기법을 이용해 이를 규명하려는 논문이 발표돼 눈길을 끌었다. 송정호 우석대 교수와 이상원 원광대 교수의 ‘빅데이터 기법을 활용한 북한의 권력구조 분석’ 논문이 그것이다.

논문은 <김일성 저작집>, <김정일 선집>에 실린 문건들과 <노동신문> 등에 실린 김정은 제1비서의 31개 문건 등 총 1994건의 문건을 빅데이터 기법으로 분석했다. 분석에 의하면 열병식 연설에서의 인민에 대한 강조는 특별한 것이었다. 김정은 제1비서는 총 1467단어로 이루어진 열병식 연설에서 모두 97번 인민이란 단어를 사용했다. 이는 연설문을 10만 단어로 환산했을 때 인민을 6612번 사용한 것과 같다. 이것은 김 제1비서가 2013년의 경우 10만 단어 중 인민이란 단어를 평균 2500번가량 사용한 것과 비교할 때 매우 높은 수치다. 두 교수는 이와 함께 김 제1비서의 전체 문건을 분석한 결과 ‘인민생활’과 ‘경제’라는 단어가 ‘선군’과 ‘핵’이라는 단어에 비해 출현 빈도가 점차 높아졌다고 지적했다. 두 교수는 이를 통해 김정은 정권이 나아가려는 방향성을 짐작할 수 있을 것이라고 지적했다.

또 두 교수는 김 제1비서의 문건을 <김일성 저작집> <김정일 선집>의 문건과 비교할 때 ‘당의 영도’를 부쩍 강조하고 있다는 점도 지적한다. 두 교수는 이는 김정은 체제가 김정일 체제와 달리 “노동당이라는 정치시스템을 활용해 북한 사회를 통치해나가려 한다는 것을 의미한다”고 분석했다.

송정호 교수는 ‘대량의 정형·비정형 데이터로부터 가치 추출 및 결과 분석’을 행하는 빅데이터 분석을 북한 연구에 활용할 경우 북한 연구를 한 단계 높일 수 있을 것으로 내다봤다. 빅데이터가 그동안 정성적(定性的) 분석을 주로 해오던 북한 연구에 정량적(定量的) 분석이라는 새로운 방법을 활용할 수 있게 해줄 것이기 때문이다.

문제는 북한 문헌의 디지털화가 낮다는 점이다. 송 교수는 이번 논문 작성을 위해 <김정일 선집>의 절반가량과 김정은 제1비서 논문의 디지털 텍스트화를 직접 수행해야만 했다고 한다. 국내 어떤 연구기관도 이들 자료에 대한 디지털 텍스트화를 해놓지 않았거나 공개하지 않고 있기 때문이라고 한다.

송 교수는 “<노동신문>의 콘텐츠를 모두 디지털 텍스트화한다면 북한의 여러 정책의 시계열적 변화를 빅데이터 기법으로 분석해낼 수 있을 것”이라며 “이 밖에도 <근로자> <경제연구> <조선여성> 등 북한의 정간물을 디지털 텍스트화할 경우 북한의 부문별 정책에 대한 정량적 연구에 큰 도움이 될 것”이라고 지적했다. 송 교수는 이를 위해 한국연구재단이나 한국학중앙연구원 등에서 관련 작업을 본격 지원할 필요가 있다고 강조했다. 김보근 한겨레평화연구소장

광고

브랜드 링크

멀티미디어


광고



광고

광고

광고

광고

광고

광고

광고


한겨레 소개 및 약관