수학능력평가가 눈앞에 다가왔다. 해마다 이맘 때가 되면 수험생의 마음은 싸늘해진 공기만큼이나 초조해진다. 12년 동안의 노력이 단 한번의 수능시험 결과로 평가되기 때문이다. 수많은 시험과 모의고사를 통해 자신의 실력을 검증했지만 불안하기는 마찬가지다.
‘만약 나의 실력을 담임 선생님만큼 평가해줄 프로그램이 있다면?’ 수험생은 물론 평가를 앞두고 있는 사람이라면 한번쯤은 생각해봤음직한 상상이다. 자신의 취약점은 어디인지, 앞으로 어떤 분야에 노력을 더하면 되는지. 전문가의 입장에서 자신의 실력을 평가해 정확한 진단을 내려준다면 자신의 실력을 단기간에 효율적으로 향상시킬 수 있을 것이다. 하지만 한낱 프로그램만으로 담임 선생님의 머리 속에서 일어나는 복잡하고 어려운 판단 과정을 흉내내 자신의 ‘상황’을 진단할 수 있을까. 단지 상상에 불과한 이같은 생각이 조만간 현실로 다가올 전망이다.
통계학으로 시험 문제 분석
KAIST 응용수학과 김성호 교수가 이끄는 지식추론통계 연구실에서는 확률과 통계의 특성을 이용해 복잡하고 다양한 실제상황을 판단할 수 있는 수학적 모델을 만들고 있다. 현재 연구실에서 한창 개발하고 있는 것은 ‘수능 도우미’. 수험생의 시험 결과를 기초 데이터로 입력하면 수학적 처리과정(알고리듬)을 통해 수험생의 현재 실력을 정확히 판단해주는 프로그램이다. 실제 담임 선생님의 머리 속에서 일어나는 복잡하고 다양한 상황 판단을 그대로 흉내내는 것이다.
수험생의 학업성취 수준에 영향을 미치는 요소는 수없이 많다. 이 중 가장 중요한 것은 시험 문제의 성격. 문제의 난이도나 평가 방식에 따라 각각 다른 결과가 나오기 때문이다. 이 때문에 각 문제 사이의 관계를 파악하는 일이 급선무다. 예를 들어 수학 시험에 함수의 최대·최소값을 묻는 문제와 미분에 대한 기본 문제가 출제됐다고 하자. 수험생의 입장에서는 미분에 대한 이해없이 함수의 최대·최소 문제를 풀기는 어려울 것이다. 또한 문제에 따라서는 서로에게 전혀 영향을 미치지 않는 독립적 관계의 문제도 있다. 수능 도우미가 수험생의 실력을 제대로 분석하기 위해서는 각 문제 사이의 이런 관계(종속 관계와 독립 관계)를 잘 파악해야 한다.
이때 활용되는 수학적 방법이 바로 통계학이다. 50개 문항으로 구성된 4지선다형 시험을 치렀다면 한 수험생당 계산해야 할 경우의 수는 ${4}^{50}$이다. 여기에 시험에 응시한 수험생 수를 더하면 계산해야할 양은 천문학적으로 늘어난다. 현존하는 최고 성능의 슈퍼컴퓨터를 동원해도 언제 끝날지 모르는 엄청난 양의 데이터다. 하지만 통계학을 이용하면 좀더 쉽게 계산할 수 있다. 지식추론통계 연구실에서는 바로 이같이 엄청난 양의 데이터를 효과적으로 계산할 수 있는 수학적 모델을 연구하고 있다.
분할과 통합 거쳐 전체 모습 그려내
우리가 접하는 각종 자료는 대부분 불확실한 정보를 내포하고 있다. 특별히 계획해서 수집한 자료가 아니라면 얻고자 하는 정보의 일부만을 제공하는 경우가 대부분이다. 따라서 부분 정보들을 묶어서 넓은 영역의 정보를 구축하는 것이 필요하다. 이를 위해서는 정보를 표현하는 방법이 중요한데, 최근 각광받는 방법은 ‘그래프 방법’이다. 각종 정보 내의 요소들을 점으로, 요소들 사이의 관계를 선 또는 화살표로 나타낸다. 요소들이 인과관계에 있다면 화살표를, 독립관계라면 선으로 나타내는 방식이다. 이 방법은 수많은 계산량을 줄일 수 있다는 장점이 있지만, 요소들이 많아지고 요소들 사이의 관계가 복잡해지면 그래프가 커져 다루기 힘들다는 단점이 있다.
연구실에서는 기존 그래프 방법의 이런 단점을 ‘부분모형 결합’이라는 방법을 통해 개선하고자 연구중이다. 부분모형 결합이란 복잡하고 커다란 모형을 각각 세부 모형으로 쪼개 세부 모형을 디자인 한 뒤 다시 합치는 방법이다. 이 전략을 쓰면 아무리 크고 복잡한 모형이라도 계산할 수 있음은 물론 이전에 비해 정확성을 높일 수 있다.
예를 들어 수능 도우미라는 커다란 모형은 언어영역과 사회과학, 과학, 외국어 영역의 네가지 세부 모형으로 쪼개진다. 각각의 영역은 다시 세부 모형으로 쪼갤 수 있으므로, 모형을 구성하는 요소들 사이의 관계를 정확히 그려넣을 수 있다.
국내 응용수학의 연구수준을 세계적 수준으로 끌어올리는 연구실에는 현재 김성호 교수를 중심으로 박사과정 2명과 석사과정 5명이 있다.
수많은 데이터와 골치 아픈 통계기법을 밤새며 연구하는 고달픈 과정이지만, 이들 마음속에는 19세기 영국 과학자 프랜시스 갈톤의 다음과 같은 말이 있기에 오늘도 컴퓨터 전원 스위치를 누르는 손가락에 굳센 각오가 들어있다.
‘통계자료는 그것이 함부로 다뤄지지 않고 고도의 방법으로 섬세하게 다뤄지고 조심스럽게 해석될 때,복잡한 현상들을 처리하는데 얼마나 큰 힘을 발휘하 는지 모른다.’