d라이브러리









 

2018년 6월 13일 수요일은 제7회 전국동시 지방선거 날입니다. 집권당의 승리는 현 정부에게 힘을 실어 주고, 패배는 현재 정권이 내놓은 정책에 제동을 걸 수 있어 여당, 야당 할 것 없이 지방선거에 온힘을 다하고 있습니다. 선거에 여론은 유권자에게 영향을 미치는 중요한 요소기 때문에 출마자들은 여론의 움직임에 예민합니다. 여론을 조작하기 위해 온갖 수법을 동원하기도 하지요. 어떤 수법이 유권자의 판단을 흐려놓고 있을까요?

 

 

전국동시 지방선거는 지방자치단체장과 지방의원을 뽑는 선거입니다. 시장, 도지사, 구의원, 군장 등 여러 대표를 뽑습니다. 여기에 자리가 비어 있는 지역구 국회의원까지 추가로 뽑습니다. 사는 곳 마다 뽑아야 하는 사람은 다르지만 선거는 전국에서 같은 날, 같은 시간 동안 진행하기 때문에 ‘전국동시’라는 말이 붙습니다. 청소년의 교육 정책을 좌지우지할 교육감 선거까지 있으니 눈여겨봐야 합니다.

 

출마자들의 공략만큼 유권자의 마음을 흔드는 요소는 지지율 여론조사입니다. 여론조사는 여론의 동향을 알아보는 목적으로 선거 전에 이뤄지는 통계적인 사회조사입니다. 일정한 수의 사람을 무작위로 뽑아 응답을 받고, 이 의견을 토대로 유권자 전체의 의견을 추측해 선거 결과를 예측하는 것이지요.

 

이런 통계 조사 방법을 ‘표본조사’라고 합니다. ‘모집단’이라고 하는 전체 집단에서 이 집단을 대표 할 ‘표본’을 뽑아 조사합니다. 선거 여론조사의 경우 유권자가 모집단이 되고 여론조사기관에서 무작위로 뽑아 응답을 받은 사람이 표본이 됩니다.

 

물론 모든 사람의 의견을 들어보는 ‘전수조사’만큼 정확한 방법은 없습니다. 그러나 시간과 비용이 많이 들 뿐 아니라 현실적으로 며칠 동안 전 국민 대상으로 조사를 하는 것은 불가능하니, 여론조사기관은 효율적인 표본조사를 합니다.

 

 

유선전화와 무선전화의 황금비율


여론조사를 할 때는 공정성과 신뢰도를 높이기 위해 무작위로 사람을 뽑아 전화를 겁니다. 이 경우 응답자에 대한 어떤 정보도 알 수 없어 유권자의 성향을 이용해 결과를 원하는 대로 꾸며낼 수 없습니다. 그런데도 신뢰성을 의심받고 있습니다. 일부 여론기관의 결과가 편향돼서 문제가 된 사례가 있기 때문이지요. 왜 이런 일이 벌어졌을까요?

 

표본 추출은 유선전화, 무선전화, 그리고 유·무선 병합조사 방식 등으로 나뉩니다. 보통 조사기관은 유선과 무선의 비율을 미리 결정하고 조사를 시작합니다.

 

그런데 과거와 달리 집에 있는 유선 전화는 받지않는 경우도 많고, 유선 전화가 없는 곳도 많습니다. 지난해 통계청이 발표한 결과에 따르면 2016년 기준 우리나라의 전체 휴대전화 가입자 수는 6028만 7000명으로 우리나라 인구보다 많았습니다. 국민 대부분이 휴대폰을 사용하고 있다는 뜻이지요. 반면 유선전화 사용 인구는 1574만 6000명으로 휴대전화 사용자와 약 4배 차이가 납니다.

 

이런 상황에서 유·무선 비율을 비슷하게 한다면 정확한 결과를 얻기 힘듭니다. 특정 정당 지지자가 유선전화를 사용하는 계층에 몰려있을 때, 유선전화 조사비율을 높이면 그 정당의 후보를 과대추정하게 되는 것이지요. 실제로 지난 대선 때 한 여론조사기관이 특정 정당 후보를 과대추정했다는 연구 결과도 있었습니다.

 

 

어차피 예측일 뿐인데 어떠냐고 얘기할 수도 있습니다. 하지만 유·무선 비율을 조금만 조정해도 특정 후보의 지지율을 높게 만들 수 있기 때문에 문제가 됩니다. 지난 대선 여론조사를 분석한 연구에서 유선전화의 비율을 40% 이상으로 한 여론기관의 결과와 40% 미만으로 한 여론기관의 대선후보 지지율 결과는 정반대로 나타났습니다. 실제 결과와 가장 비슷한 수치를 예측했던 여론조사기관이 책정한 유선 대 무선의 비는 2 : 8이었습니다.

 

이번 서울시장 선거에 출마한 김문수, 박원순, 안철수 후보(왼쪽부터 오른쪽 순서). 여론조사기관 리얼미터에서 지난 4월 8일 유•무선의 비를 2 : 8로 책정하고 세 후보의 가상대결을 실시했다. 그 결과 지지율은 각각 16.6%, 50.3%, 20.4%로 박원순 후보가 압도적으로 높은 결과를 보였다. 실제 선거 결과가 나오면 비교해보고, 여론조사의 정확성도 직접 확인해보자.

 

 

 

여론조사도 검증이 필요해


여론조사는 여론 형성에도 영향을 미치기 때문에 어떻게 조사를 했는지가 매우 중요합니다. 여론조사의 객관성을 높이기 위해 조사 방법이 여론조사 정확성에 미치는 영향을 분석한 연구도 있습니다. 실제 득표율을 얼마나 비슷하게 추정했는지 조사의 정확성을 가늠해 본 것이지요. 이때 로그함수로 만든 정확성 척도를 기준으로 편향 비율과 예측 오차까지 추정할 수 있습니다.

 

 

S당과 T당이 있다고 해봅시다. y=logax와 같은 로그함수에서 a를 ‘밑’, x를 ‘진수’라고 합니다. 만약 여론조사와 투표결과가 정확히 일치한다면 진수에 있는 분자와 분모의 값이 같아지므로 진수는 1이 되겠지요. 밑과 상관없이 진수가 1이 되면 y값은 0이 됩니다. 따라서 A값이 0이 되면 결과를 정확히 예측했다는 뜻입니다.

 

 

여론조사 결과를 바꾸는 유·무선 비율


지난 대선을 앞두고 여론조사기관 리얼미터가 2017년 4월 25일과 26일 이틀 동안 전국을 대상으로 두 가지 방법으로 조사한 결과입니다.

 

 

첫 번째는 유선 대 무선 비가 2 : 8입니다. 유선은 ARS를 20% 이용, 무선은 ARS를 60%, 전화면접을 20% 이용했습니다. 두 번째는 유선 대 무선 비를 8 : 2로 조사한 결과입니다. 유선은 ARS를 80% 이용, 무선은 스마트폰 앱 조사를 20% 이용했습니다. 표본의 크기는 각각 1015, 1016으로 거의 같았으나, 응답률은 11.9%, 5.1%였습니다.

 

그 결과 첫 번째 경우는 문재인 후보와 홍준표 후보의 지지율이 각각 44.7%, 13.1%로 나왔습니다. 두 번째 경우는 각각 23.4%, 33.7%로 결과가 바뀌어 버렸습니다.


실제 대선 결과는 문재인 후보의 득표율이 41.03%, 홍준표 후보의 득표율은 24.03%였습니다.

 

또 진수가 1보다 크면 로그함수값은 0보다 크고, 진수가 1보다 작으면 로그함수값은 0보다 작습니다. 따라서 A가 0보다 크면

 

 

가 1보다 크다는 뜻입니다. 즉 s값이 크거나 t값이 작게 나왔다는 뜻이므로, 여론조사 결과가 S정당 후보를 과대추정한 것을 의미합니다.

 

 

매크로로 조회수도 저절로


선거와 관련된 기사에 달린 댓글도 여론에 영향을 줍니다. 만약 가짜 뉴스나 악성 댓글의 조회수가 높아지면 큰 타격을 줄 수 있습니다. 최근에는 매크로 프로그램을 사용해 포털 사이트 검색어나 댓글을 조작하기도 합니다.

 

매크로는 단순하고 반복적으로 처리해야 하는 일을 프로그래밍해 놓으면 자동으로 처리해주는 소프트웨어입니다. 키보드 입력 횟수나 마우스 클릭 횟수를 줄여 시간을 단축해주는 편리한 프로그램이지요.

 

간단히 프로그래밍할 수 있어 이 소프트웨어를 악용하는 경우가 많습니다. 대표적으로 온라인에서 정해진 시간에 맞춰 티켓을 판매하는 공연예매에 매크로 프로그램을 이용하는 사람이 있습니다. 예매의 모든 절차를 컴퓨터가 자동으로 처리해주는 데다, 1초에 수십~수백 번씩 구매할 수 있습니다. 이렇게 짧은 시간 내에 다량으로 티켓을 구매한 뒤 웃돈을 붙여 파는 사람이 있어 문제가 되지요.

 

그런데 선거를 앞두면, 후보자와 관련된 악성 댓글의 추천수가 매우 짧은 시간 동안 빠르게 증가하는 일이 벌어집니다. 그러니 여당, 야당을 막론하고 매크로 사용을 의심하고 있지요. 너무나 쉽게 이용할 수 있는 프로그램이기 때문에 여론 조작도 어렵지 않게 할 수 있다는 게 문제입니다. 그러니 기사에 달린 댓글 추천수도 쉽게 믿지 마세요.

 

선거를 앞두고 한껏 예민해진 출마자와 지지자들의 모습이 보입니다. 부정 없이 깨끗하고 공정한 선거를 기대합니다.

2018년 06호 수학동아 정보

  • 조혜인 기자(heynism@donga.com)
  • 참고자료

    ‘2016년 국회의원선거 전화여론조사 정확성 분석’

🎓️ 진로 추천

  • 정치외교학
  • 행정학
  • 언론·방송·매체학
이 기사를 읽은 분이 본
다른 인기기사는?