그래프로 나타내면 더 알기 쉽다
우리 같은 학생에게 유용한 통계 중 하나는 시험이나 입시 정보가 아닐까 해. 수학을 예로 들면 지난해 가을 중간고사에서 방정식 문제가 50% 나왔다는 정보가 통계지. 경시대회나 입시 정보에서는 전 대회 지원자수, 문제 경향 등이 통계가 돼.
그런데 통계는 수치로 볼 때보다 그래프로 그리면 이해하기가 더 쉬워. 한눈에 볼 수 있어 비교하기 쉽고 경향을 금방 알 수 있기 때문이지. 다음에 제시한 고등학생 대상의 경제 경시대회 자료를 그래프로 표현해 볼게.
① 제2회 대회의 개인별 지원자수는 1학년 1417명, 2학년은 4117명으로 지난 1회 대회에 비해 각각 685명, 1207명이 증가.
② 고등학교 교육과정 문제 40%, 경제 개론 수준 30%, 시사문제 30% 출제. 경제의 기본개념과 미시, 거시, 국제경제 등 4개 분야의 균형을 고려해 출제
그래프를 그리려면 우선 값을 표로 만드는 게 좋아. 그런 다음 이 표를 이용해서 그래프를 그리면 돼. ①에서 가로에는 학년을 세로에는 대회별 참가자수를 넣으면 그래프가 만들어져. ①처럼 변화되는 값이 있는 자료는 꺾은선그래프나 막대그래프를 이용하면 변화도를 바로 확인할 수 있어. 반면 ②처럼 비율만 있는 자료는 원그래프로 볼 때 한눈에 보기 좋지. 물론 막대그래프를 이용해도 문제 없어. 이처럼 자료의 특성에 따라서 적절한 그래프를 선택하면 돼.
모기가 많을수록 아이스크림이 잘 팔린다?
지금까지 본 것처럼 보통 통계라고 하면 매우 과학적인 것으로 생각해. 그래서 통계적으로 어떤 값이 나왔다고 하면 모두 믿는 편이지. 그런데 선생님은 통계의 이런 특성을 잘못 이용하는 경우가 있대. 통계 자료를 잘못 이해하거나 실수로 생긴 오류와 나쁜 의도로 통계의 단점을 이용하는 경우지.
둘 모두 피해를 줄 수 있는 만큼 통계에 대한 올바른 이해가 필요해. 여기서는 선생님이 알려준 통계를 잘못 이용한 예를 소개할게.
대표적인 예가 이혼율이야. 2009년 OECD 통계에 따르면 우리나라 이혼율은 OECD가입국 중 1위야. 그런데 여기에 문화적 차이가 빠져 있어. 외국은 동거 문화가 익숙해 혼인신고를 미루고 동거를 하는 사람이 많은 반면, 우리나라는 결혼 문화여서 대부분 혼인신고를 한다는 것이지. 그러다보니 외국은 헤어지더라도 기록되지 않는 반면, 우리나라는 그대로 나타나지. 따라서 자료에 따라 문화적 차이를 함께 생각해야 한다는 거야.
또 통계 자료로 인과관계를 함부로 추정하는 경우야. 인과관계는 어느 하나가 다른 하나에 영향을 주는 경우를 말해. 다음은 어느 동네에서 기록한 통계야. 모기가 적을수록 아이스크림이 적게 팔렸고, 모기가 많을 때는 아이스크림도 많이 팔린 걸 볼 수 있어. 이걸 보고 ‘모기가 많을수록 아이스크림이 많이 팔린다’라고 할 수 있을까?
답은 ‘할 수 없다’야. 모기와 아이스크림은 직접적인 관련이 없기 때문이지. 즉 서로 인과관계가 성립되지 않는데 통계 자료만 보고 인과관계가 성립된다고 착각하면 안 돼. 그런데 왜 서로 관련이 있는 것처럼 보일까? 그건 이 둘에게 똑같이 영향을 주는 다른 요인이 있어서야. 바로 날씨지. 날이 더울수록 모기도 늘고, 아이스크림도 많이 팔리거든.