빅데이터에 눈을 뜬 수동은 평범하던 세상이 점차 다르게 보이기 시작한다. 자동차, 건물, 사람, 무엇 할 것 없이 매 순간 데이터를 생성하고 있었던 것이다! 폭풍처럼 몰아치는 데이터의 홍수에서 수동은 어떤 정보를 잡아내야 할까?
삐용삐용~, 빅데이터 환상주의보!
빅데이터의 시대가 처음 열리고 사람들은 흥분에 휩싸였어요. ‘이제 빅데이터만 있으면 모든 걸 예측할 수 있고 모든 걸 제어할 수 있어!’라고 생각했죠. 초반에 특히 주목받았던 것은 ‘SNS 분석’이었어요. 전세계의 사람들이 작성하는 SNS 글을 활용해 가치가 높은 결과를 얻으려 한 거예요.
예를 들어 선거 기간에 사람들이 쓰는 SNS 글을 분석해 후보자 A와 B 중 누가 당선될지 분석하려고 했죠. 하지만 아주 간단한 이런 예시조차 기존에 사용한 여론조사 결과보다 정확도가 낮았어요. 왜 그랬던 걸까요?
“무조건 데이터가 많다고 혁신적인 결과를 얻는다는 건 빅데이터 초기의 ‘환상’이에요. 그 환상은 대부분 깨졌어요. 빅데이터가 진짜 제대로 쓰이려면 잘 정제돼야 하고 서비스에 연결할 수 있어야 하죠.” _김동규 서울대 건설환경공학부 교수
데이터가 많을수록 그 속에서 제대로 정보를 찾는 것이 중요하고, 다음엔 정제한 데이터를 어느 문제에 연결할지 고민해야 빅데이터를 제대로 쓸 수 있다는 거예요. 무슨 말인지 도통 모르겠고요? 수학동아 독자들을 위한 특급 조언을 부탁하자 김 교수님은 이렇게 말했어요.
“빅데이터 활용에서 중요한 건 코딩이나 프로그래밍이 아니에요. 더 중요한 건 문제를 정확히 정의하는 거예요. 우리 주변에 어떤 문제가 있는지, 내가 불편한 게 무엇인지 구체적으로 진단해보세요. 그 문제를 수학적으로 정의하고 여기에서 해결법을 찾아 다시 현실에 대입하는 거예요!”
그럼 조언을 마음에 새기고 수동이 처한 상황으로 돌아가 볼까요? 도심 속의 여러 교통 문제를 수동이 어떻게 해결하는지 지켜보자고요!
●미래의 빅데이터 활용, AI
학습을 통해 스스로 의사결정을 내리는 인공지능(AI) 학습법인 ‘딥러닝’을 빅데이터 분석에 적용하면 그동안 측정하지 못했던 데이터도 새로 만들 수 있다. 예를 들어 AI가 교통 빅데이터를 학습하도록 하면 실제로 측정하지 않은 도로 구간의 데이터를 예측해 스스로 문제 를 해결하게 할 수 있다. 교통 경찰이 하던 일을 교통 시스템이 직접 하는 것이다.
또한 사람이 데이터를 보고 패턴을 찾는 것에는 한계가 있으므로 전문가들은 빅데이터 활용의 미래가 딥러닝과 연계하는 데 있을 거라고 예측한다.