빅데이터의 시대가 도래하며 정보는 곧 자산으로 통합니다. 하지만 자산들이 그저 쌓여만 있다면 가치를 발휘할 수 없습니다. 진정한 가치는 자산을 삶에 유용하게 사용할 때 비로소 발현되죠. 데이터를 유용하게 사용한다는 것은 무엇일까요? 그리고 그 능력을 어떻게 기를 수 있을까요? 지금부터 함께 알아봅시다.
우리는 하루 동안 수많은 정보를 접하며 살아갑니다. 오늘의 주식 가격, 제22대 국회 뉴스, 각종 사건사고 소식 등 끊임없이 새로운 정보를 얻죠. 이렇게 얻은 수많은 정보는 미래를 예측하는 유용한 도구로 사용됩니다. 기업은 데이터를 분석하고 시장을 예측해 다른 기업과의 경쟁에서 우위를 확보할 수 있습니다. 정부 기관은 공공 서비스를 개선하고 정책 결정을 최적화할 수 있죠. 개인도 데이터를 이해하면 더 나은 결정을 내릴 수 있습니다. 휴대전화에 기록된 걸음 수나 동영상 앱 사용 시간 데이터를 보고 생활 습관을 개선할 수 있습니다. 이렇게 데이터가 가진 이점 덕분에 과거엔 정보를 많이 가진 사람이 미래를 예측하기 유리했고, 정보력은 곧 힘이었습니다.
상어가 인간을 공격하는 횟수와 아이스크림 판매량 추이
![](https://images.dongascience.com/uploads/article/Contents/202407/1722171289-3a334b7c-5a41-42d8-9e99-b60d74214d25.png)
데이터 홍수 시대, 데이터 문해력이 중요
지금은 예전과 상황이 다릅니다. 이제는 많은 정보를 누구나 쉽게 접할 수 있으니 말이죠. 현대 사회에서 중요한 것은 엄청난 양의 데이터 속에서 가치 있는 데이터를 찾고, 그 데이터를 정확하게 이해할 수 있는 능력입니다. 이 능력을 ‘데이터 문해력’이라고 합니다. 데이터 문해력은 정보를 읽고 쓰는 능력을 넘어서 데이터를 분석, 평가하며 그 의미를 추출해 의사결정 과정에 적용하는 것을 말합니다.
만약 데이터 문해력이 부족하다면, 어떤 일이 발생할까요? 자, 아래 표를 봅시다. 매년 미국 전역에서 발생하는 월간 아이스크림 판매 그래프와 상어가 인간을 공격하는 횟수에 대한 그래프입니다. 두 그래프는 꽤 비슷한 모양으로 그려져 ‘아이스크림의 판매량이 증가하면 상어에게 공격받는 사람이 증가한다’고 연관짓는 사람이 생길 수 있습니다. 더 나아가면 ‘상어가 고열량을 필요로 해 아이스크림을 많이 먹은 살찐 사람을 공격한다’는 추론까지 나올 수 있죠.
하지만 과학동아 독자라면 이 추론이 어딘가 이상하다고 생각했을 겁니다. 두 데이터를 분석해서 내린 결과가 이상한 이유는 ‘인과 관계’와 ‘상관 관계’의 개념을 오인했기 때문입니다. 인과 관계는 A로 인한 결과가 B인 관계를 말합니다. 상관 관계는 일정한 수치로 계산된 A와 B가 서로 관련성이 있다고 추측되는 관계죠. 아이스크림의 판매량과 상어의 공격 횟수는 수치 상으로 여름에 증가한다는 상관 관계가 있지만, 결정적으로 두 데이터 사이의 인과 관계는 없습니다. 인과 관계를 증명하기 위해선 추가적인 데이터가 필요합니다. 가령 상어가 아이스크림을 먹은 먹잇감과 아이스크림을 먹지 않은 먹잇감이 있을 때 어떤 먹잇감을 더 많이 선택하는지에 대한 데이터 말이죠.
이은지 충남대 정보통계학과 교수는 “데이터 문해력이 부족할 때 생길 수 있는 가장 큰 문제는 연관성 없는 데이터를 엮어 잘못된 결론에 이를 수 있다는 것”이라고 설명했습니다. 넘쳐나는 데이터 속에서 올바른 추론과 예측을 하기 위해 데이터 문해력이 필수라는 의미죠. 데이터 문해력은 정보화 시대로 갈수록 더욱 중요해집니다. 윤석용 명지대 AI정보과학전공 교수는 “인공지능(AI)이 모든 분야에 활용되는 세상에서는 모든 것이 데이터로 표현될 수 있다”며 “그 데이터들과 공존해야 하는 청소년, 학생들은 지금부터 데이터 문해력을 키우기 위해 노력할 필요가 있다”고 말했습니다.
통계 활용 연습, 데이터 문해력 높여
그렇다면 데이터 문해력은 어떻게 높일 수 있을까요. 이 교수는 “통계를 활용하는 연습을 많이 하는 것이 데이터 문해력을 기르는 답이 될 수 있다”고 말했습니다. 통계는 생활 속의 데이터를 알아보기 쉽게 정리하거나, 그 데이터를 통해 다른 무언가를 예측하는 데 사용됩니다. 통계 자료를 직접 모으고 정리 및 추론하는 활동은 데이터 문해력을 기르는 데 큰 도움이 될 수 있습니다. 윤 교수는 “일반적으로 학교에서 배우는 통계는 수학 공식에 그친다”며 “직접 통계 자료를 분석해보며 공식이 아닌 개념으로 이해하는 것이 중요하다”고 조언했습니다.
통계의 개념을 익힐 수 있는 방법으로 ‘통계 포스터 만들기’가 있습니다. 통계 포스터는 하나 이상의 연관된 그래프를 사용해 자료를 요약, 분석하고 자신만의 결론을 추론한 뒤 그 내용을 시각적으로 정리한 자료입니다. 이때 통계 자료는 통계청이나 기관이 만든 자료를 사용할 수도 있고 직접 설문이나 실험을 통해 통계자료를 제작해 사용할 수도 있습니다. 윤 교수는 “통계 포스터 만들기는 데이터 제작, 분석, 시각화, 추론까지 모두 경험할 수 있는 훌륭한 교육 방법이 될 수 있다”고 강조했습니다.
통계 포스터, 어떻게 만들까?
![](https://images.dongascience.com/uploads/article/Contents/202407/1722171450-fa556743-e4ac-4532-9579-5d1017904e60.png)