왜냐면
신뢰수준·표본오차 무시하고득표수 환산한 기괴한 방식
표본할당 추출방식 대표성 의문
무응답층 모두 소거 심각한 편향 한나라당 대통령 후보 경선과정의 국민 여론조사 반영 방식을 보면서 정치인들을 비롯한 많은 사람들이 여론조사를 지나치게 믿는 듯해 우려스럽다. 이번 경선 과정에서 여론조사를 이용함으써 발생된 세 가지 문제점을 짚어보고자 한다. 첫째, 기본적인 통계원리가 무시되었다. 일반적으로 여론조사는 모집단의 특성을 한정된 표본으로 추정하는 통계적 방법론을 통해 이루어진다. 다시 말해, 3700여만명 전체 유권자들의 후보지지도 성향을 추정하고자 이번 경선과 같이 총 6000명의 표본을 추출하여 이 표본의 특성으로서 전체 유권자들의 후보지지 의사를 추정하는 것이다. 따라서 여론조사와 같은 표본조사에서는 표본오차를 가지고 모집단의 특정 평균수치가 놓이게 되는 신뢰구간을 추정하는 것이 필수적이다. 이번 한나라당 경선 과정에서의 여론조사는 표본오차를 무시하고 세 여론조사 기관들을 통해 추출된 표본들로부터 후보자들의 지지율 평균치를 구하여 단순히 득표 수로 환산하는 방식이었다. 이와 같은 방식은 표본조사에서 필연적으로 나타나는 오차를 무시하는 기괴한 방식이다. 만약 어떤 두 후보의 평균 지지율 차이가 오차범위 안에 있다면, 전체 유권자를 조사대상으로 가정했을 때 두 후보의 평균 지지율에 유효한 차이가 없음을 의미한다. 오차범위도 조사자가 신뢰수준을 어떻게 정하는냐에 따라 그 범위가 축소되거나 확대될 수 있다. 한나라당 두 유력후보의 여론조사 지지율 차이가 8.8%포인트였는데, 이 경우도 신뢰수준을 어떻게 정하느냐에 따라 그 차이가 오차범위 안에 위치할 수도 있고 그것이 유효한 차이로 나타날 수도 있다. 두번째로 표본추출 방법상의 문제다. 표본추출에서 세 여론조사 기관에서는 지역·성·연령별 비례 할당 추출법을 사용한 것으로 알고 있는데, 엄밀히 말해 이것은 무작위 추출방법도 아니고, 표본의 동일확률 추출방법도 아니어서 표본이 정확히 전체 유권자를 대표했다고 보기 어려운 편향성의 문제가 제기될 수 있다. 현재 한국의 많은 여론조사 기관이 이 할당 추출법을 쓰고 있는데, 사실 이 방법은 학문적인 관점에서 편향성 문제로 그리 선호되는 방법이 아니다. 미국의 여론조사 기관들의 경우 전화조사에서 완벽한 무작위 추출법을 사용하며, 지역·성·연령 등의 변수는 인구조사 데이터로써 조사 이후에 조정하는 방식을 택하고 있다. 우리나라의 경우 많은 여론조사 기관이 사용하고 있는 할당 추출법은 표본의 대표성 문제가 있을 수 있다. 마지막 문제점으로 조사에서 단위 무응답에 대한 무관심이다. 이 조사는 지난 19일 일요일 오후 1시에서 저녁 8시까지 이루어졌다고 한다. 조사기관당 목표 표본 2000명의 인터뷰를 7시간 내에 끝낸 셈이다. 미국의 경우 표본의 크기가 약 1000명 정도이면, 물론 조사기관마다 약간의 차이는 있겠지만, 적어도 1주일 정도의 시간을 갖고 조사를 한다. 실제로 표본의 크기가 500명임에도 한 달 동안 전화조사를 하는 기관도 있다. 도대체 우리와 그들의 이러한 차이는 무엇을 의미하는가? 우리는 단위 무응답층을 고려하지 않고 있다는 증거다. 전화조사의 경우 인터뷰어가 미리 정해진 표본 내의 응답자에게 전화를 할때 부재 중이어서 접촉이 안 된 경우는 모두 단위 무응답층에 해당된다. 이번 조사의 경우 조사기간 7시간 동안 부재 중이었던 표본 대상들은 조사에서 아예 배제될 수밖에 없게 되었다. 이 부분은 표본추출의 심각한 편향성을 다시 한번 드러내는 대목이다. 이상과 같은 방법상의 문제점들을 고려할 때 국가의 대통령 후보를 결정하는 정당의 경선 과정에서 여론조사 반영 부분이 반드시 필요했는지 한나라당에 묻지 않을 수 없다. 더군다나, 여론조사 부분에서 후보가 바뀌었다. 이건/일리노이대 행정학 박사과정
기사공유하기