카메라와 스마트폰, 그리고 인공지능(AI)까지, 정보를 생산하는 매체와 도구가 우후죽순 늘고 있다.
전 세계에 1조 GB(기가바이트) 단위로 쌓여가는 정보 중 편향된 정보를 걸러내고 명확한 의사 결정을 하기 위한 해답은 ‘통계적 사고’다. 5월, 통계적 사고를 배양하고 상도 받을 수 있는 기회가 찾아온다. 국가데이터처가 매년 주최하는 전국학생통계활용대회이며, 금년이 제28회이다.
데이터의 패턴으로 해결책 찾는다
통계적 사고는 데이터를 기반으로 논리적이고 체계적으로 의사 결정을 내리는 능력이다. 데이터에서 경향과 추세를 찾고, 이를 문제의 해결에 활용하는 것이 핵심이다. 한 예를 들어보자. ‘2025년 기준 1년간 한국에서 청소년 37.5%, 성인 12.0%가 사이버폭력을 당했다.’ 3월 30일 방송미디어통신위원회와 한국지능정보사회진흥원이 발표한 ‘2025년 사이버폭력 실태조사’ 결과다. 조사 결과에 따르면, 청소년 피해자 41.4%가 문자나 메신저를 통해 사이버폭력을 당했다. 청소년 사이버폭력의 유형은 32.0%가 언어폭력이었다. 이 결과를 토대로 우리는 대부분의 사이버폭력이 청소년을 대상으로 일어나며, 사이버폭력이 주로 문자와 메신저를 통한 언어폭력으로 일어난다는 결론을 내릴 수 있다.
여기서 추세나 경향에 대한 정보가 추가되면, 새로운 접근도 가능하다. 지난해 대비 청소년 피해자 증가율이 0.4%p이고, 사이버폭력 가운데 언어폭력 유형이 1.8%p로 지난해 대비 가장 많이 증가했다는 점을 토대로, 청소년 피해자와 사이버 언어폭력 증가 문제에 더 주목할 수 있다. 또 피해 경로는 문자와 메신저의 비율이 가장 높았지만, 지난해 대비 메타버스에서의 피해가 8.5%p로 가장 많이 증가했다는 점을 통해 메타버스가 새로운 사이버폭력 경로로 부상하고 있다고 추측할 수 있다.
조사 결과를 통한 해결책도 제시 가능하다. 청소년 85.4%, 성인 91.5%가 사이버폭력 예방 및 대응 관련해 받은 교육이 도움이 됐다고 답했다. 그리고 청소년 29.2%, 성인 30.3%가 사이버폭력 감소를 위해 정보통신 서비스 제공 기업이 사이버폭력 콘텐츠 게시자의 온라인 접속을 제한해야 한다고 주장했다. 이 결과를 토대로 사이버폭력 문제에 대응하는 방안으로, 사이버폭력 예방 교육을 강화하고 사이버폭력 게시자의 접속 제한을 제시해 볼 수 있다.
이처럼 통계는 특정한 현상의 인과관계와 추세, 경향을 제시해 의사결정을 돕는다. 사이버폭력과 같은 사회 현상 외에도 의료 분야에서 특정한 질병의 원인, 치료 결과에 대한 효과를 파악할 때 통계를 사용한다. 통계를 통해 데이터의 패턴과 추세를 분석해 인구나 출생률 등 미래를 예측하기도 한다.
AI 시대, 데이터 홍수에서 중심 잡으려면
데이터를 이해하는 눈은 빅데이터를 기반으로 작동하는 인공지능(AI) 시대에 더욱 중요해지고 있다. AI 역시 데이터 속에 패턴을 찾아내는 통계 과정을 거쳐 추측한 답변을 내놓는다. 그래서 미국의 SF 작가인 테드 창은 AI가 “응용 통계에 가깝다”라고까지 표현했을 정도다.
정보 생산 매체가 다양해진 데 이어 AI도 데이터를 만들어내면서 데이터양이 기하급수적으로 늘어나고 있다. 데이트 플랫폼 스태티스타(Statista)에 따르면, 2024년 기준 전 세계 데이터 총량은 147ZB(제타바이트·1021바이트)다. 데이터양이 늘어나면서 편향된 정보도 많아졌다. 2025년 10월 8일 미국 스탠퍼드대 경영대학원 연구팀은 AI가 3495개 직업군 여성의 나이를 남성보다 평균 1.6세 젊게 추정하고, 남성 소득이나 명성을 여성보다 높게 평가했고 밝혔다. doi: 10.1038/s41586-025-09581-z 성별과 직업에 대한 편향된 정보를 AI가 재생산한 사례다.
편향된 정보에 휘두르지 않으려면 통계적 사고를 하는 능력을 길러야 한다. 러셀 폴드랙 미국 스탠퍼드대 교수는 책 ‘21세기 통계적 사고’를 통해 “인간의 직관은 뉴스 보도 증가 등에 심리적 영향을 받아 잘못된 추측을 종종 한다”며 “통계적 사고를 통해 우리가 가진 지식의 불확실성을 잡아내 직관의 한계를 극복할 수 있다”고 밝혔다.
통계포스터로 통계적 사고를 길러보자
통계적 사고를 기르려면 결국 통계 자료를 활용해 봐야 한다. 이를 기르기 위한 가장 좋은 방법은 통계포스터 만들기다. 통계포스터는 특정 주제와 관련된 통계 자료를 요약한 뒤, 이 자료를 토대로 다양한 관점에서 문제를 분석하고 해결하는 과정을 보여주는 포스터다.
국가데이터처(전 통계청)는 청소년의 통계적 사고를 기르기 위해 ‘전국학생통계활용대회’를 매년 열고 있다. 전국 초등학교와 중학교, 고등학교에 다니는 재학생이나 동일 연령 참가자들이 자신만의 데이터로 통계포스터를 만들어보는 게 대회 주제다. 통계포스터는 연구하고 싶은 주제를 선정한 뒤, 자료를 수집하고 분석해 만들 수 있다. 자료는 국가 기관 등이 제공하는 통계 자료를 이용하거나 직접 설문조사를 진행하고 실험해 모으고 분석할 수 있다. 국가데이터처는 전국학생통계활용대회를 통해 총 87팀에 시상할 예정이며, 대상을 받은 학생들은 장학금 100만 원과 함께 교육부장관상을 받는다.
2025년 10월 통계청은 국가데이터처로 승격됐다. AI 시대에 생존하려면, 데이터를 수집하고 관리하는 역할을 넘어 데이터 활용 범위를 확대하는 중심 기관으로 거듭나야 한다는 이유에서다. 앞으로 AI와 부대끼며 살아가야 할 학생들에게 데이터 활용 능력과 통계적 사고는 더욱 중요해질 터. 전국학생통계활용대회에 참여해 나만의 창의적인 통계적 사고를 뽐내고, 데이터 홍수에서 중심을 잡을 힘을 길러보자.
통계포스터, 어떻게 만들까
통계포스터는 탐구 주제에 대한 데이터 수집 및 분석 결과를 그래프와 표 등으로 시각화하고, 의미 있는 결과 해석과 결론에 이르는 과정을 한 장의 발표 자료로 완성한 것이다. 기존 탐구 보고서와 비슷하지만 문제 해결 과정에 반드시 통계를 활용해야 하며, 여러 장의 보고서가 아닌 한 장의 포스터 형식으로 제작해야 한다는 차이가 있다.
주제 정하기
박최성(노스런던컬리지에잇스쿨 제주) 학생이 이끈 Wifi 팀은 디지털 기술이 막대한 에너지를 소비해 상당량의 탄소 배출을 유발한다는 사실을 알고 난 뒤, 디지털 환경 속에 살아가는 우리들의 행동에 대해 문제의식을 느꼈다. 앞으로 사람들이 탄소 발자국을 줄이기 위해 디지털 환경에서 해야 할 행동의 방향을 통계포스터를 통해 제시하기로 결심했다.
자료 수집 및 분석
Wifi 팀은 노스런던컬리지에잇스쿨 제주에 재학 중인 학생 184명을 대상으로 디지털 탄소 발자국에 대한 인식 수준이 어느 정도인지 설문 조사를 했다. 디지털 탄소 발자국은 디지털 기기를 사용하는 과정에서 발생하는 탄소 배출량이다. 학생들에게 경각심을 주기 위한 해결책으로 캠페인과 알림창을 활용해 실험하고, 학생들의 행동 변화가 일어났는지 결과를 확인했다.
결론 정리
캠페인보다 경각심을 주는 알림창을 웹사이트에 띄웠을 때 학생들이 불필요한 메일을 많이 삭제했다. Wifi 팀은 디지털 탄소에 대한 대중 인식 수준은 낮으며, 디지털 이용자들에게 불필요한 이메일 전송과 수신을 줄이자는 권고를 할 필요가 있다고 결론 내렸다. 또 캠페인만 진행하기보다는 직접적인 권고문을 알림창을 통해 알리는 것이 더 효과적이라고 판단했다.
통계포스터 시각화
설문조사 결과는 사람들의 디지털 탄소 발자국에 대한 인식 수준을 쉽게 파악할 수 있도록 원 그래프로 나타냈다. 알림창을 통해 경각심을 높이는 데 기여했는지 효과를 한눈에 보여주기 위해서는 막대 그래프를 사용했다. 디지털 탄소 발자국 발생 과정을 이해하기 쉽게 보여주기 위해 이산화탄소 기체가 휴대폰에서 분출되는 그림을 활용하기도 했다.
