선거여론조사에서 표본의 대표성
선거여론조사에서 표본의 대표성
  • 류제복 청주대학교 통계학과 교수
  • 승인 2019.10.30 20:10
  • 댓글 0
이 기사를 공유합니다

기고
류제복 청주대학교 통계학과 교수
류제복 청주대학교 통계학과 교수

 

내년 4월15일에는 제21대 국회의원선거가 시행된다. 벌써부터 선거를 앞두고 여론조사가 시행되고 있는데, 많은 국민들은 선거여론조사가 유권자들의 생각을 제대로 반영하고 있는지 의문을 제기한다. 특히 정치가들이나 정당에서 자신들에 불리한 조사 결과가 나오면 더욱 선거여론조사를 신뢰할 수 없다고 난리다.

국민들은 물론 정치가들과 언론들이 선거여론조사를 믿기 어렵다고 생각하는 주된 이유 중의 하나는 조사대상 표본이 너무 적어 전체 유권자들의 의견을 제대로 대변하지 못한다는 것이다. 선거여론조사심의위원회의 선거여론조사기준에 의하면 전국단위 조사의 경우 최소 표본 수는 1000명인데 이는 전체 유권자의 0.002%(19대 대통령선거에서 유권자 수는 4247만9710명)에 불과하다.

과거 미국의 조사기관들도 정확한 조사결과를 얻기 위해서는 표본이 커야 한다고 생각하였다. Literary Digest사는 1936년 미국대통령선거 여론조사에 구독자명부, 전화번호부, 자동차등록명부들로부터 1000만 명을 표본 추출하여 조사하였고, 그중에서 237만여 명의 응답을 얻어 공화당의 랜던후보가 민주당의 루즈벨트후보에게 57:43으로 승리할 것이라고 예측하였다. 그러나 실제 선거결과는 민주당의 루즈벨트후보가 62.5%를 득표하여 당선되었다. Literary Digest사가 많은 표본을 사용하였는데도 조사결과가 실제 결과와 큰 차이가 나는 중요한 이유들이 있었다. 미국에서도 1936년 당시에는 전화나 자동차를 소유하고 있거나 잡지를 구독하는 가정들은 대부분이 소득이나 교육수준이 높은 가정들이었다. 그러므로 이들로부터 뽑은 표본들은 미국 전체 가정을 제대로 대표할 수 없었다. 또한 그 당시의 표본추출은 할당추출(Quota Sampling)이라는 방식을 주로 사용하였는데, 이는 성별, 연령별, 교육수준별 등이 모집단 비율에 따르도록 표본을 추출하는 방법이다. 할당추출은 언 듯 보기에는 매우 합리적인 방법 같지만 성별, 연령 등과 같은 몇 개의 특성만으로 모집단의 모든 특성을 반영하기가 불가능하므로 모집단 전체를 대표하는 표본을 선정할 수 없었다.

보통 가정에서 찌개를 끓일 때 간이 잘 되었는지 확인하기 위해서 솥 전체를 맛보는 경우는 없다. 보통 작은 스푼으로 조금만 떠서 맛을 보고 판단하지만, 적은 양으로도 한 솥에 있는 찌개의 간을 알 수 있다. 그러기 위해서 먼저 솥 안을 휘저은 다음 한 스푼을 뜨는데, 이렇게 휘저음으로써 소금 농도가 같은 한 스푼들을 뜨게 될 가능성이 동일하게 되어 한 스푼으로도 전체 솥은 간을 잘 가늠할 수 있게 된다.

선거여론조사에서도 전체 유권자나 국민들의 의견을 대변할 수 있는 대표성 있는 소수의 표본을 뽑기 위해 이와 유사한 과정인 확률추출 방법을 사용한다. 과거 우리나라 선거여론조사에서도 할당추출법을 사용하였는데, 최근에는 확률추출법으로 전환하여 사용하고 있다. 전화조사에서 사용되는 임의번호전화걸기(RDD: Random Digit Dialing)가 대표적인 확률추출방법인데, 이는 전화를 소유하고 있는 가정(또는 개인)을 같은 확률로 추출하는 방법이다. 전체 집단을 잘 대표할 수 있는 추출틀과 확률추출방법을 사용하여 표본을 추출하면 표본의 규모도 현재와 같이 대폭 축소할 수 있고 대표성도 높아져서 조사결과는 더 정확해진다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.