![](https://images.dongascience.com/uploads/article/Contents/201402/C201402N007_img_99.jpg)
흠흠, 어쨌든 오늘도 정보 수집을 위해 인터넷을 뒤지고 있는데 어딜 잘못 들어간 모양이에요. 이건 뭐 아무리 뒤지고 찾아도 끝이 없어~! 이젠 내가 뭘 보고 있는 건지, 이 정보를 뇌가 제대로 처리하는 건 맞는지 의문이 들 정도네요. 역시 늙은 건가….
아냐. 내가 잘못한 건 없어. 문제는 이 무한한 데이터야. 많아도 너무 많잖아~!
많은 게 당연하죠. ‘빅데이터(big data)’는 말 그대로 기존의 도구로는 수집, 저장, 관리, 분석할 수 없는 어마하게 많은 양의 데이터를 의미하니까요. 여기에는 기업 일처리 시스템처럼 잘 정리된 데이터뿐만 아니라 각종 기기 제어 데이터나 사진, 영상 같은 멀티미디어 데이터도 모두 포함돼 있어요. 빅데이터를 태평양이라고 하면 지금껏 닥터 그랜마가 사용하던 웹 환경은 집 욕조쯤 되려나요?
그냥 많기만 하면 뭐해. 이해하기도, 이용하기도 어려우면 아무 쓸모가 없잖아.
‘많다’는 것만이 특징은 아니거든요. 미국의 시장조사기관 가트너는 빅데이터를 가르는 조건으로 세 가지를 꼽았어요. 먼저 아까 이야기한 거대한 ‘크기’, 그리고 형태의 ‘다양성’, 마지막으로 데이터 처리 ‘속도’지요. 굉장히 다양한 많은 양의 자료를 재빠르게 수집하고 자신에게 필요한 형태로 가공하는 능력이 뒷받침이 되어야 비로소 ‘빅데이터’라고 부를 수 있다는 이야기예요. 그래서 빅데이터는 데이터 그 자체뿐만 아니라 데이터에서 가치를 찾고 결과를 분석하는 기술도 함께 포함해요. 뽑아 쓰는 사람이나 방법에 따라 활용 가치가 무한하기 때문에 정보의 ‘원유’라고 불리기도 하지요.
추상적이라 이해하기 힘들어. 구체적으로 어떻게 사용하는 거야?
예를 들어 아마존 같은 대형 쇼핑몰에 로그인을 하면 자동으로 추천 상품이 떠요. 지금까지 구매한 모든 소비자의 구매 내역을 기록한 거대한 데이터베이스를 바탕으로 사람들의 공통적인 구입 패턴이나 취향을 분석한 결과지요. 선거나 금융에서도 빅데이터 활용은 필수예요. 심지어 미국 국세청은 빅데이터를 이용해 탈세와 사기를 방지하는 시스템도 만들었답니다. 2011년에 만든 이 시스템으로 연간 3450억 달러, 우리 돈으로 약 345조의 세금을 더 거둘 수 있었다고 해요.
앗! 그럼 빅데이터만 손에 넣으면 지구 정복도 꿈은 아니겠네?
틀린 말은 아니에요. 빅데이터를 제대로 분석하면 미래를 예측하고 행동을 지시하는 것도 가능하다고 하니까요. 2014년에 주목해야 할 정보통신기술로도 빅데이터 분석과 활용이 꼽혔고요. 그렇지만 빅데이터는 끊임없이 쌓이고 있기 때문에 닥터 그랜마의 힘만으로 다 분석하기는 힘들 것 같아요. 간단한 예로 2012년 한 해 동안 전세계에서 쏟아진 데이터의 양은 그 전까지 만들어진 데이터를 다 합친 것보다 많거든요. 우리가 대화를 나누는 지금도 새로운 데이터가 계속…, 다른 방법으로 지구를 정복하겠다고요? 네~, 힘내세요.