![](https://images.dongascience.com/uploads/old/articleEditor/2013/07/189644254051f627106dc44.jpg)
데이터마이닝이란? 말 그대로 광산에서 금을 캐내는 마이닝(mining)을 데이터에 적용한 것입니다. 많은 양의 데이터에서 의미 있는 정보를 추출해내는 과정을 데이터마이닝이라고 합니다. 활용 분야는 매우 다양합니다.
마케팅 분야에서는 고객의 구매 패턴을 분석해 주요 고객에게 집중적으로 판촉활동을 하는 타깃 캠페인, 금융 분야에서는 신용평가, 신용카드 사기 탐지, 증권가격 예측, 포트폴리오 평가 등에 쓰입니다. 통신 분야에서는 고객 이탈 방지, 문자/패턴 인식, 보안 관리 등에, 의료 분야에서는 질병 진단 및 유전자 분석 등에, 에너지 분야에서는 전력수요 예측 및 자원 탐사 등에, 제조업에서는 신제품/신서비스 개발, 공장 자동화, 재고 및 수요 관리 등에 활용합니다.
연구실에서는 어떤 프로젝트를 하나요? 마케팅, 서비스 제조, 제품/서비스 기획, 인사보안 등 다양한 프로젝트를 합니다. 예를 들어, 보안 관련 프로젝트로는 사용자의 타이핑 패턴을 이용해 비밀번호 외에 2차 인증을 하는 로직을 개발하는 것이 있습니다. 제조 프로젝트에서는 공장 설비에서 나오는 데이터를 이용해 생산품의 불량이나 설비의 고장을 예측합니다. 그리고 인사 관련 프로젝트로는 어떤 경력을 가진 사람이 입사 후 높은 평가를 받는지에 대해 분석한 프로젝트가 있습니다.
어떤 학생을 원하나요? 데이터마이닝은 다양한 분야의 지식을 필요로 합니다. 학습 기반으로는 최적화, 통계, 컴퓨터 지식을 견고히 다져야 합니다. 데이터마이닝 알고리즘의 이해를 위해 최적화와 통계에 대한 지식이 필요하고, 이를 구현해 데이터를 분석할 때 컴퓨터 프로그래밍 지식이 쓰입니다. 이러한 능력을 바탕으로, 현업에서 발생한 문제를 이해하고 데이터마이닝 문제로 전환해 해결할 수 있어야 합니다. 가장 중요한 것은 문제를 해결하고자 하는 의지입니다.
졸업 후 어떤 분야로 진출하나요? 연구실 졸업생들의 진로는 다양합니다. 학계에 남아 연구와 교육을 계속하기도 하고, 연구실에서 배운 내용을 활용해 회사를 만들어 운영하기도 합니다. 취업을 선택한 경우, 대부분 많은 데이터를 다루는 제조사, 통신사, 카드사, 신용평가사, 광고사 등에 진출합니다.
글 이윤희 서울대 산업공학과 4학년 | 도움 박주성 서울대 데이터마이닝 박사과정 연구원
이미지 출처│istockphoto