d라이브러리









[10년 후 나를 디자인한다] 빅데이터로 유권자의 마음을 훔치다

SW in Science ➋ 맞춤선거


‘빅데이터 선거’. 2012년 미국 대선에서 버락 오바마 재선캠프가 들고 나온 색다른 선거전략이었다. 오바마 캠프는 대선 18개월 전부터 IT전문가 300여 명을 영입했다. 2억 명에 이르는 유권자 개개인의 정치적 성향을 파악하기 위해서였다. 이들은 트위터나 페이스북, 구글플러스, 링크드인 같은 소셜네트워킹서비스(SNS)에 유권자들이 올린 정보를 긁어모았다. 또 기부자나 자원봉사자 명단, 여론조사기관이나 광고사에서 모은 개인정보, 휴대전화․총기라이선스․신용카드․대출정보 같은 정보도 수집했다.

 
오바마 캠프는 수집한 정보를 바탕으로 유권자의 특성을 파악했다. 이런 식이다. 할리우드 주변 유권자들의 소비․정치성향을 분석해 ‘선거자금 모금파티에서 40대 여성이 돈을 낼 가능성이 가장 높다’는 결론을 얻었다고 가정하자. 맞춤형 선거전략을 세울 수 있게 된다. 오바마 캠프는 실제 40대 여성에게 가장 어필할 수 있는 배우인 조지 클루니를 이용했다. 그의 집에서 모금파티를 연 것이다. 결과는 대성공. 여기서만 1500만 달러를 모금했다.

짐 메시나 오바마 캠프 총괄책임자는 ‘타임’지와의 인터뷰에서 “선거운동의 일거수일투족을 수치화했다”고 말했다. 슈퍼컴퓨터로 매일 6만6000번에 달하는 시뮬레이션을 실시했으며, 다양한 정책과 공약, 전달방식에 따라 여론이 어떻게 달라지는지 예측했다. 캠프는 미국 인터넷기업인 아마존의 클라우드 서버를 이용했는데, 최대 5000대의 서버에서 초당 4GB에 이르는 작업을 처리했다. 맞춤형 선거전략은 성공했다. 오바마 대통령은 2012년 11월 재선에 성공해 임기를 4년 연장했다.

고도의 기술 필요

빅데이터의 위력을 보고 가장 놀란 건 정치권이다. 전 세계 정당들이 오바마 캠프의 선거전략을 공부하기 시작했다. 하지만 빅데이터를 다루는 일이 호락호락하지 않다는 사실을 곧 깨달았다. 많은 양의 비정형 데이터를 처리하는 능력이 필요하기 때문이다. 비정형 데이터는 그림이나 영상, 문서처럼 형태와 구조가 복잡해서 정형화되지 않는 정보를 말한다. 성별이나 연령, 소득수준처럼 표 형태로 바꿀 수 있는 정보(정형 데이터)가 아니라서 단순하게 처리할 수 없다.

가장 대표적인 비정형 데이터는 우리가 트위터나 페이스북, 블로그에 남긴 글이다. 이런 글을 분석하려면 고도의 자연어 처리기술과 컴퓨터 언어학 기술이 필요하다. “박근혜 대통령 잘한다”라는 글이 칭찬인지 비꼼인지 알려면 전체 글의 맥락을 파악해야 한다. 사람 수준의 해독능력을 가진 소프트웨어가 필요하다.

분석이 끝이 아니다. 비정형 데이터는 정형 데이터보다 용량이 커서 저장하기도 힘들다. 컴퓨터 여러 대에 데이터를 나눠 저장하는 기술이 필요하다. 하둡(Hadoop), H베이스, 몽고DB는 대용량 데이터를 분산처리하는 대표적인 소프트웨어다. 컴퓨터 수천 대를 연결시켜 테라바이트(TB) 크기의 데이터도 무리 없이 처리할 수 있다.

아직 우리나라에선 시기상조

오바마 대통령의 성공이 워낙 유명해져서, 우리나라에서도 금방 빅데이터 선거혁명이 일어날 것으로 생각하는 사람이 많다. 실제 새누리당과 새정치민주연합 같은 정당에도 ‘선거에 빅데이터를 활용하라’는 지지자들의 요구가 빗발쳤다. 하지만 우리나라 정당에선 아직 빅데이터를 다룰 엄두도 못 내고 있다. 일단 선거비용이 미국에 비해 너무 적고, 법으로 개인정보 거래를 금지하고 있는 데다 기술도 없기 때문이다.

“저희도 당연히 (빅데이터 선거전략을) 하고 싶죠. 생존이 걸린 문제인데.” 배철순 새누리당 뉴미디어국 기획팀장은 아쉬움을 담아 말했다. “오바마 캠프는 민간에서 이용하던 빅데이터 기술을 그대로 가지고 왔습니다. 미국은 기업에서 이미 빅데이터를 활발히 이용하고 있었거든요. 그런데 우리는 그렇지 않아요. 정당에서 앞장서서 기술을 개발하기는 무리입니다.”

그래도 빅데이터 선거는 거스를 수 없는 대세인 것만은 분명하다. 배 팀장은 “여론의 흐름을 정확히 읽어야 직접민주주의에 다가갈 수 있다”며 “당장 오바마 캠프 수준의 빅데이터 활용은 못하더라도 일단 비정형 데이터를 쌓는 공간부터 만들려고 한다”고 말했다.

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2015년 04월 과학동아 정보

  • 변지민 기자
  • 기타

    [공동기획] 미래창조과학부

🎓️ 진로 추천

  • 컴퓨터공학
  • 정보·통신공학
  • 통계학
이 기사를 읽은 분이 본
다른 인기기사는?