중고차 10대 중 6대는 사고차?
“정비소에서 새로 산 중고차에 사고 흔적이 있다고 확인해 줘 더 싸게 사기로 했어요.”
“거봐요. 자동차 사고 기록부터 확인해 보고 사라고 했잖아요.”
“아는 사람이 소개시켜 준 중고차를 전문적으로 파는 사람이라서 그대로 믿었는데….”
“중고차 10대 중 6대가 사고차라는 통계를 신문에서 봤다고 말했잖아요. 통계를 무시하면 안 된다고요.”
“그러게 말이에요. 다행히 큰 사고가 난 건 아니어서 계속 타는데 지장이 없다니…. 당신이 재촉해서 알아봤기에 망정이지 안 그랬으면 사고가 난 차를 비싼 값에 살 뻔 했네요.”
난 수동중학교 2학년 영호야. 얼마 전에 우리 아빠가 중고차를 샀어. 그런데 중고차 사고기록을 확인하지 않아 곤란을 겪었지. 다행히 지금은 잘 해결돼서 문제가 없지만. 울 아빠는 덤벙대는 게 장기야. 반면 엄마는 아주아주 꼼꼼쟁이지. 한 번 본 걸 꼭 활용하시거든. 특히 통계 활용은 귀신 같아서 수동초등학교 6학년인 내동생 소희랑 내가 곤란할 때가더 많아.
대표적인 게 용돈 사건이야. 내 한 달 용돈은 3만 원이야. 최근에 한 기관에서 조사해서 발표한 자료에는 초등학생 한 달 용돈 평균이 3만 3450원, 중학생 4만 7300원이라는 거야. 그래서 당당하게 이 자료를 내밀며 용돈을 올려 달라고 말씀드렸지. 그런데 엄마는 다른 자료를 보여 주셨어. 초등학생 1만 8300원, 중학생 3만 1500원이었지.
엄마는 “용돈은 특정 지역이나 조건에 영향을 많이 받아 조사에 따라 편차가 큰 편”이라며 “어떤 조사를 그대로 받아들일 수 없다”고 하셨어. 앞에 조사만 봐도 초등학생 용돈 평균이 82%까지 차이가 나니 한 조사를 그대로 받아들이기엔 무리가 있지.
이처럼 통계는 그 자체로 그대로 쓸 수 있는 것도 있는 반면 그렇지 않은 것도 있어서 자료에 따라서 특성을 정확히 알고 써야 한대. 그래서 엄마는 친척과 동네 친구 엄마들에게 내 또래의 용돈 수준을 알아보고, 이를 토대로 기준을 정해서 지금 용돈을 주고 있어. 이게 나한테는 가장 적절하다는 거야.
여학생은 만11~12세에, 남학생은 만12~13세에 가장 많이 커
이번 기회에 통계에 대해서 알아보니 통계가 참 재미있어. 엄마는 우리가 태어나서 죽을 때까지의 모든 기록이 통계로 활용된대. 그래서 통계의 정의부터 알아봤어. 백과사전에서 통계는 일반적으로 어떤 현상을 종합적으로 한눈에 알아보기 쉽게 일정한 체계에 따라 숫자로 나타낸 거래. 사회와 자연 현상을 정리하고 분석하는 도구로 널리 사용된다는 거지.
더 자세히 알고 싶어서 신문에서 통계가 어떻게 쓰이는지 찾아봤어. 그랬더니 대부분의 내용에 통계가 들어 있지 뭐야. 매년 태어나는 아기수, 가구당 가족수, 공교육비와 사교육비 비교, 우리나라 총 자동차 대수, 남녀의 결혼비율, 질병에 따른 사망률 등.
우리의 모든 기록이 통계라는 엄마의 말은 사실이었어. 내가 태어나서 하는 모든 행동이 모여 통계가 되고, 이 자료가 필요한 곳에서 활용되는 거야. 맞아, 우리 엄마는 이렇게 모인 통계를 아주 잘 쓰는 사람 중 한 명이시지.
그러고 보니 키가 작아서 고민하던 5학년 때가 생각나네. 그때 키가 140cm로 우리 반 여자애들보다 작았을 뿐 아니라 동생보다 작아지지 않을까 심각하게 걱정했었거든. 그때 엄마가 통계적으로 여학생은 초등학교 때 많이 크고 중학교 때 별로 안 크는 반면 남학생은 중학교 때도 많이 크기 때문에 나중에 내가 더 클 거라고 위로해 주셨지.
통계 자료를 보니 초등학교 5학년 남학생 평균 키는 143cm로 여학생 평균 키인 144cm 보다 작아. 그런데 중학교 1학년은 남학생 158cm, 여학생 156cm, 3학년은 남학생 168cm,여학생은 159cm로 크게 차이 나. 지금 내 키가 166cm이니까 평균보다 더 많이 큰 편이지.
우리 집은 대한민국에서 어디쯤?
아빠가 가끔 엄마와 진지하게 말다툼(?)을 하시는데, 매번 “쥐꼬리만큼 벌어오면서…”라는 엄마의 말로 끝나. 아빠가 아무런 대꾸도 못 하시거든. 그런데 아빠가 정말 쥐꼬리만큼 버시는 걸까? 우리는 집도 있고, 내가 돈 때문에 크게 불편을 느낀 적이 없는데…. 그래서 아빠의 만 나이 45세로 자료를 조사하다 평균에 대해서 자세히 알게 됐어.
올해 4월부터 6월까지의 가계동향조사에 따르면 4인 가구의 가계 소득은 평균 401만 7321원이야. 우리는 아빠가 380만 원정도를 버시니 평균 미달이지. 그나마 아빠 나이가 좀 돼서 이 정도래. 보통 나이가 많을수록 월급이 많아지거든. 엄마 말처럼 쥐꼬리는 아니더라도 아빠가 목에 힘을 주기엔….
그런데 내가 통계에 관심을 가지고 평균값을 비교하는 걸 수학 선생님께서 보시곤 “자료를 비교할 때는 평균 외에 최빈값과 중앙값도 생각해 볼 필요가 있다”고 하셨어.
평균은 잘 알다시피 산술평균을 말해. 최빈값은 모든 조사 대상자 중 가장 많은 대상자가 몰린 값으로 표본이 많고 정상분포를 할 때 유용하대. 중앙값은 모든 대상자 중에서 정중앙에 위치하는 값이야. 중앙값을 고를 때 표본수가 짝수면 가운데 양쪽에서 2개를 구한 뒤 산술평균을 내면 돼.
예를 들어 0, 10, 15, 20, 25, 30, 35, 35, 80, 90, 100 이렇게 11개의 값이 있다고 하면 여기서 평균은 40이지만 최빈값은 35, 중앙값은 30이 돼. 값 대부분이 평균보다 많이 낮은걸 알 수 있어. 선생님은 이처럼 극단적으로 높은 값 몇 개가 평균에 영향을 많이 주면 평균의 의미가 약해진대. 이때는 중앙값이 더 의미 있다고 해.
선생님은 소득도 경향이 비슷하대. 즉 소득이 없거나 매우 낮은 사람의 수가 많은 반면, 소득이 높은 사람의 수는 적어도 액수가 워낙 커서 소득의 평균값이 중앙값보다 높게 나온다는 거야. 그러면서 2007년도 소득계층별 분포를 토대로 올해 소득을 추정해 보면 아빠 월급도 중앙값보다 높을 거래. 아빠가 목에 힘을 줄 수도 있다는 얘기야. 평균값으로는 중간보다 뒤에 있지만 사람 간 비교에서는 중간보다 앞이니까.
근대 통계조사의 시작
1896년 9월 1일에 근대 통계조사의 출발점으로 평가되는 호구조사규칙이 발표됐다. 우리나라는 1995년부터 이 날을 통계의 날로 정해 기념하고 있다. 통계에 대한 인식과 이해, 활용을 높이고, 정확한 통계를 작성하려는 목적이다. 세계적으로는 올해 6월 유엔통계처에서 10월 20일을 세계 통계의 날로 정했다.
우리나라 통계는 국가통계포털에서
우리나라 각종 통계가 궁금할 때는 국가통계포털을 찾으면 된다. 여기서 통계로 보는 자화상 코너를 이용하면 나와 관련된 정보를 더 쉽고 빠르게 이용할 수 있다. 입력한 내 정보를 토대로 나와 관련해서 비교할 만한 여러 가지 통계자료가 제시된다.
통계 역사가 한눈에, 통계전시관
통계청이 설치한 통계전시관에서는 1960년대에 사용하던 수동식 계산기와 각종 조사 기록 등 우리나라 통계의 역사를 한눈에 볼 수 있다. 또 컴퓨터를 이용해 직접 통계를 체험하면서 쉽게 통계를 이해하도록 돕고 있다.