d라이브러리









[진로체험] 온라인에 남긴 흔적 찾는 데이터 분석 전문가

 

‘알 수 없는 알고리듬이 나를 여기로 이끌었다.’ 재밌는 볼거리가 없을까 하고 무심코 켠 동영상 애플리케이션(앱)이 어느샌가 내 취향을 파악해 동영상을 추천한다. 이런 추천 알고리듬은 모두 우리가 온라인에서 남긴 흔적, 즉 ‘데이터’를 기반으로 동작한다. 약 15년 동안 수많은 데이터에서 새로운 가치를 찾아 고객을 파악하는 데이터 전문가를 만나 데이터 세계에 대해 물었다. 

 

주로 어떤 데이터를 다루시나요?


온라인 사이트에 방문하는 고객들의 행동을 분석하는 ‘로그 분석’을 합니다. 성별, 나이 등의 기본 정보를 포함해 어떻게 사이트에 방문하게 됐는지, 얼마나 머무르는지, 유심히 본 페이지나 상품은 어떤 것인지, 어떤 물건을 장바구니에 담고 구매했는지 등을 분석해 고객을 파악하죠. 쇼핑, 여행, 미용, 패션, 금융 등 36개 이상의 업종을 분석하는데, 웹사이트 개수로는 12,000개에 달합니다. 이렇게 분석한 데이터로 맞춤 서비스나 마케팅 전략을 세우도록 돕습니다. 


현재 일하는 NHN ACE는 빅데이터를 분석해 광고 플랫폼과 데이터 테크 플랫폼을 만드는 회사입니다. ‘플랫폼’이라고 하면 생소할 수도 있는데요, 유튜브도 유튜버와 여러분을 동영상이라는 콘텐츠로 연결하는 플랫폼 중 하나입니다. 이처럼 광고 플랫폼은 광고하려는 회사와 광고를 싣는 회사를 연결하는 플랫폼입니다. 관심사에 맞게 광고가 노출되도록 데이터를 분석해 전략을 세우죠. 이런 기술이 없었을 때는 불특정 다수에게 광고하다 보니, 관심이 없는 사람들에게는 광고 효율을 내기 어려웠습니다.

 


데이터 분석을 약 15년 동안 하셨다고요?


제가 데이터 분야에 뛰어들 때는 데이터를 다루는 회사가 그리 많지 않았지만, 네이버, 삼성전자를 거쳐 NHN에 오기까지 다양한 데이터 특성과 목적에 따라 방법을 바꿔가며 분석해 볼 수 있었습니다. 네이버에서는 검색어와 다양한 로그 데이터*를 통해 사용자가 어떤 문서를 찾고 싶어 검색어를 입력했는지, 어떤 순위로 문서를 보여주면 좋을지 분석했습니다. 삼성전자에서는 스마트 TV, 스피커, 리모컨을 사용한 기록으로 국가별로 어떤 서비스 전략을 취해야 할지 알아봤죠.

 

데이터를 분석할 때 수학이 쓰이나요?


그럼요, 숫자를 많이 다루는 만큼 ‘확률’과 ‘통계’ 개념을 많이 써요. 새로운 데이터를 처음으로 처리할 때는 히스토그램을 그려보기도 하고, 평균값, 중앙값, 최솟값, 최댓값, 표준편차 등을 얻어 특성을 확인합니다. 때로는 데이터에서 성별, 나이별로 몇 명씩 표본을 뽑아 분석해 데이터의 성질을 빠르게 파악하죠. 선거 전 여론조사를 해 미리 결과를 예상해보는 것과 비슷합니다.


또 기계학습 기술로 데이터를 다루기도 합니다. 로그 데이터에는 빈곳이 많아요. 모든 사용자가 같은 방법으로 사이트를 이용하면 좋겠지만, 제각각이거든요. 이를 인공지능을 이용해 메꾸고 쓸모 없는 정보는 걸러냅니다. 사람은 할 수 없는 일이죠.

 

수학을 잘하면 데이터 분야 진출에 유리한가요?


수학을 잘하면 선택할 수 있는 폭이 넓지만, 꼭 잘해야만 이 분야로 올 수 있는 건 아니에요. ‘수학에 대한 흥미’만으로도 충분해요. 


저는 어릴 때부터 수학을 좋아했어요. 초등학교 입학 전에 배웠던 주산으로 아직도 머릿속에서 서너자릿수까지 암산할 정도로 수학에 대한 관심이 많죠. 이 점이 데이터를 볼 때도 아주 유용하답니다. 데이터를 가만히 살펴보면서 어떤 의미를 찾을 수 있을까 들여다보고 알지 못했던 데이터의 특성을 발견하는 과정은 수학적 호기심이 밑바탕을 이루거든요. 그런데 어떤 과목이든 좋아하고 관심이 있으면 어떤 방법으로든 데이터 분야에서 활용할 수 있어요.

 

 

데이터 분석에 어려운 점은 없나요?


프로그램 개발이라는 것이 언제나 완벽할 수는 없어요. 항상 어딘가 오류가 발생할 수 있어 미리 대비해야 하죠. 기록도 철저히 해놓고요. 예상치 못하게 오류가 나면 기록을 바탕으로 프로그램을 개선합니다.


그래도 동료들과 개발한 프로그램을 세상에 공개하고, 고객들이 좋은 반응을 보일 때 가장 큰 보람을 느낍니다. 로그 분석 프로그램 등을 직접 시연하러 갔을 때, 사람들이 ‘이런 기술이 있었네’, ‘이 기술이 왜 지금에서야 나왔을까’라며 신기해할 때 정말 즐겁습니다.

 

데이터 분야 전망은 어떤가요?


과거에는 큰 회사에서만 데이터를 분석했지만, 지금은 회사의 규모에 상관없이 데이터를 보고 크고 작은 결정을 내립니다. 각 기업에 맞는 데이터 기술들이 필요한 만큼, 데이터 분야는 계속 성장할 것으로 예상해요. 데이터 분석 프로그램 개발자가 아직은 많지 않아 취업할 곳도 많지요. 향후 10년 동안은 매년 크게 성장할 것이라고 내다보는 전문가도 있습니다.


데이터 분야에서 일하려면 어떻게 해야 하나요?


데이터 사이언티스트를 꿈꾼다면 수학과 통계를, 데이터 프로그램 개발자가 되고 싶다면 코딩을 잘해야 해요. 하지만 데이터 분야에는 이 외에도 다양한 직업이 있어요. 만약 데이터 분석을 바탕으로 마케팅 전략을 세우고 싶다면 코딩이나 수학보다는 마케팅 경험이 중요해요. 꼭 데이터나 수학 전공이 아니어도 데이터 분야에 들어올 수 있으니 언제든지 도전하세요!


해당 진로를 꿈꾸는 독자들에게 조언해주세요.


수학 문제를 풀 때 문장 형태의 문제를 간결한 수식으로 나타내는 게 첫 번째죠. 여기서 더 나아가 문제를 푸는 방법과 절차를 세울 수 있다면 데이터 분야에 도전할 수 있는 자질은 충분해요. 데이터 분야의 프로그램을 만드는 직업을 꿈꾸고 있다면 확률과 통계, 알고리듬, 코딩 등에 관심을 두고 새로운 것을 배우는 데 주저하지 마세요. 조금만 공부해도 데이터를 다룰 수 있답니다. 

 

 

 

용어정리

* 로그 데이터
사용자들이 매체를 언제, 어디서, 어떻게 사용하는지에 대한 정보

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2020년 06월 수학동아 정보

  • 홍아름 기자 기자
  • 디자인

    이하연

🎓️ 진로 추천

  • 컴퓨터공학
  • 통계학
  • 소프트웨어공학
이 기사를 읽은 분이 본
다른 인기기사는?