수학자가 직접 만든 미해결 문제부터 과학영재교육연구원 문제, 수학 퍼즐까지! ‘폴리매스 프로젝트’는 온라인에서 댓글로 아이디어와 풀이를 올려 수학 문제를 힘을 합쳐 푸는 수학 공동 연구프로젝트입니다. 코딩을 이용해 문제를 풀거나 수학 문제를 만드는 ‘코딩 수학’도 경험할 수 있으니 궁금하면 폴리매스 홈페이지(polymath.co.kr)에 접속해 보세요!
데이터를 다루는 ‘통계’
통계는 한국 사람의 몸무게와 키, 시간대별 미세먼지 농도, BTS의 일일 음원 판매량 같은 ‘데이터’를 수집하고 정리한 뒤 수학적 원리를 이용해 분석하고 해석하는 분야예요. 고대부터 통계는 국가를 운영하는데 중요하게 쓰였는데요, 로마 제국이 수백 년 동안 지중해 일대의 광활한 영토를 통치할 수 있었던 비결도 바로 인구와 토지, 재산 등의 데이터를 꾸준히 수집하고 체계적으로 분석했기 때문입니다. 통계를 뜻하는 영어 단어 ‘Statistics’에 국가를 뜻하는 ‘State’가 있는 것도 바로 이런 이유 때문이죠.
통계는 데이터를 다루는 목적에 따라 크게 두 종류로 구분합니다. 하나는 수집한 데이터를 정리한 뒤 표로 만들거나 데이터의 특징을 알 수 있도록 평균, 분산, 표준편차 같은 통계 수치를 구하는 ‘기술 통계’(Descriptive statistics)입니다.
다른 하나는 새로운 정보를 알기 위해 수집한 데이터를 분석해 추론하는 ‘통계적 추론’(Statistical inference)이지요. 통계적 추론은 반드시 확률에 기반한 수학적 원리를 바탕으로 이뤄집니다. 예를 들어 한국 사람의 키와 나이 데이터를 이용해 나이가 1살 많으면 키는 얼마나 큰지 알아내기 위해 데이터의 분포와 가장 비슷한 비례 관계, 즉 선형 모형을 찾는 ‘최소제곱법’을 이용하죠.
현대 사회를 흔히 ‘빅데이터’의 시대라고 하죠? 과거에 비해 다뤄야 할 데이터의 양이 비교할 수 없을 정도로 많아져 그렇습니다. 덩달아 통계학, 기계학습 등을 이용해 데이터를 분석하는 데이터 과학 분야가 주목받고 있지요. 따라서 빅데이터를 분석하거나 빅데이터를 다루는 인공지능을 개발하려면 수학과 통계를 익히고 코딩 능력을 갖춰야합니다.
자, 이제 코딩 명령어를 이용해 기술 통계와 통계적 추론을 맛보도록 할까요?
백진언 연구원에게 무엇이든 물어보세요~
2019년 3월 16일, 일곱 번째 폴리매스 멘토링이 수학동아 편집팀이 있는 사무실에서 열렸어요.
누군가(오상규), 인천 오일러(이관우), Simon(문승현) 친구가 백진언 연구원과 함께 각자 해결한 문제와 아직 풀리지 않은 문제에 관해 토론했어요. 멘토링에서 어떤 이야기가 오고갔는지 살짝 공개합니다.
폴리매스 멘토링은 문제 출제자와 문제를 푼 친구들이 만나는 자리입니다. 폴리매스 문제에 관해 토론하고, 수학 공부 방법과 진로에 관한 정보도 공유하지요.
이번 멘토링에는 국가수리과학연구소 21번 문제를 푼 누군가 친구와 11번 문제를 푼 인천 오일러, 24번 문제를 푼 Simon 친구가 참석했는데요, 수학을 전공하고 싶은 인천 오일러 친구와 Simon 친구는 둘 다 영재학교 입학을 준비 중이라 서로 많은 대화를 나눴습니다.
멘토링은 백진언 연구원이 문제를 출제한 의도와 친구들의 풀이를 설명한 뒤 친구들이 문제를 푼 과정을 덧붙이는 방식으로 진행했어요. 누군가 친구는 21번 문제의 소문제 1번을 풀 때 스크래치 코딩으로 해결했다고 말해 다른 친구들을 놀라게 했지요.
취미가 체스인 Simon 친구는 체스판과 관련 있는 14번 문제(기사의 새로운 여행)에 관심이 많았는데요, 백진언 연구원이 힌트를 주길 원했지만, 오묘한 단서만 줬을 뿐 끝끝내 말을 아꼈습니다.
문제 외에도 Simon 친구는 최근에 베르누이 수열을 알게 됐다며 공부하다 모르는 수학 개념이 나왔을 때 정보를 찾는 방법을 물어봤어요. 이에 백진언 연구원은 인터넷에서 직접 베르누이 수열을 검색하며 수학에 관한 정보를 찾는 노하우를 전수했습니다. 과연 백진언 연구원의 노하우는 무엇일까요?
폴리매스에는 아직 풀리지 않은 문제가 많습니다. 얼른 해결해서 다음 멘토링에 참가하세요!