d라이브러리









[진로체험] 지윤성 데이터 사이언티스트, 데이터로 세상을 읽다

 

카드부터 SNS, 웹 사이트까지! 우리는 데이터로 정보를 주고받고 흔적을 남기는 ‘데이터 시대’에 살고 있다. 그만큼 데이터 분석이 중요한데, 핀테크 기업에서 대표이사를 하다가 돌연 데이터 분석 전문 회사를 창업한 지윤성 데이터 사이언티스트를 만나 데이터 분야의 이야기를 들어봤다.

 

데이터 관련 일을 어떻게 하게 됐나요?


컴퓨터 공학을 전공하고 한글과컴퓨터에 입사해클라우드 서비스와 관련된 일을 했어요. 웹에서 문서 작업을 할 수 있도록 웹피스(웹+오피스)를 만들었죠. 이때 사용자들이 주로 만드는 문서나 작업 종류 등의 정보를 접할 수 있었어요. 불현듯 이런 데이터들을 분석하면 더 나은 서비스를 만들 수 있을 거라는 생각이 들었죠. 


거기다 2017년 알파고로 빅데이터와 인공지능 이 뜨면서 데이터 분야에 도전하기로 마음 먹었어요. 곧바로 데이터를 분석해 컨설팅 하는 회사와  팩트체크를 하는 언론사를 만들었습니다.


현재 어떤 일을 하시나요?


인공지능과 기계학습으로 데이터를 분석하고, 분석 결과로 효율적인 마케팅 전략을 세우는 데이터 전문 회사 링크브릭스를 경영하고 있어요. 


데이터 관련 회사는 대부분 프로그램 개발자가 창업한다고 생각하는데요, 링크브릭스는 데이터를 직접 분석하던 사람들이 모여 만들었죠. 그래서 데이터를 분석하는 프로그램을 개발하기 보다 필요한 프로그램을 제공하는 회사와 기술 제휴를 맺어 그 프로그램으로 직접 데이터를 분석합니다. 그리고 결과를 바탕으로 방향을 제시하는 컨설팅을 하지요.

 


주로 어떤 분야의 데이터를 다루나요?


의류, 신발 등을 판매하는 소매업체의 고객 분석을 많이 합니다. 예를 들어 우리나라 진출을 목표로 하는 해외 화장품 회사에게는 K-뷰티의 최신 트렌드를 분석한 데이터를 전달합니다. 또 제품을 홍보하기 위해 인터넷 스타 등의 인플루언서들과 콜라보를 기획한다면, 어떤 인플루언서와 해야 하는지 각종 데이터를 분석해 팔로워나 구독자를 가짜로 올린 인플루언서를 찾아 걸러 알려줍니다. 이런 분석은 짧은 시간 안에 폭발적으로 팔로워 수나 좋아요 수가 늘어난 사례를 찾을 수 있는 시계열 분석*으로 합니다. 분석 결과 현재 인플루언서 중 60%는 가짜였지요.

 

다른 분석 사례가 있을까요?


식음료 회사에는 SNS에 올라오는 글을 분석해 유행하는 음식 메뉴를 찾아 제시하고, 새로 나온 제품에 대한 소비자 반응도 전달하지요. 또 테러와 관련된 키워드를 자주 언급하는 SNS 사용자를 찾아 위험 정도를 파악하고 추적하기도 합니다. 비슷한 방식으로 특정 지역의 범죄율이나 보안 정도를 추정하기도 합니다. 최근엔 해외 기업과 함께 코로나19 바이러스의 확산 과정을 예측했습니다. 

 

코로나19 확산은 어떻게 예측하나요?


생명과학 및 공학 분야의 주제를 정보통신 기술로 분석하는 분야를 생물정보학(바이오인포매틱스)이라고 합니다. 2009년부터 뜨기 시작했는데, 이 분야에 사용하는 모형을 이용해 예측했습니다. 특히 미국과 영국 연구진이 각각 만든 두 종류의 모형을 사용했는데요, 각 모형의 특성에 따라 더 정확하게 예측하는 값을 골라 데이터를 얻었습니다. 


2020년 1월에 공개한 예측 결과에서는 코로나19가 세계보건기구(WHO)가 선포하는 감염병 최고 경고 등급인 ‘팬데믹’까지 진행할 것이라 예상했죠. 실제로 3월 12일 WHO가 팬데믹을 선언했고요. 당시 우리나라는 3월 말부터 4월이 정점일 것으로 예상하고, 감염자 수는 1만 명에서 1만 2000명 정도로 봤는데 예측이 맞아 떨어지고 있어요.

 

학생들에게 데이터 분야 직종을 추천하신다고요?


여기저기서 데이터를 다룰 줄 아는 사람을 찾기 위해 난리예요. 아직 우리나라에서는 데이터 관련 인재가 부족해 사람을 구하기 힘들거든요. 데이터 사이언스 대학원도 연 지 얼마 되지 않아 외국 인재들을 데려오고 있죠. 지금 중고생인 독자들이 데이터 분야를 선택한다면 앞으로 정말 많은 기회가 있을 거라고 생각해요. 수학 문제를 풀듯 ‘이런 데이터를 분석하면 재밌는 결과를 얻을 수 있을 거야!’라든가, ‘많은 데이터에서 정보를 얻으려면 어떤 도구를 써야 할까?’와 같은 ‘상상’에 즐거움을 느끼는 독자라면 도전해보세요!

 

데이터 분야의 전망이 밝은가 봐요.


이제 데이터 분석은 어딜가나 기본이 됐어요. 자율주행이나 알파고 같은 새로운 서비스도 데이터를 분석하고 반영해 나온 결과이고, 우리나라의 대기업에서도 광고나 마케팅 등을 위해 빅데이터를 다루지요. 이미 광범위하게 쓰이고 있어요.


하지만 여전히 많은 가능성이 열려 있습니다. 데이터를 다루는 기업은 크게 세 종류가 있어요. 데이터를 분석하는 프로그램을 개발하는 회사, 데이터 분석을 통해 마케팅 전략을 세우는 회사, 마지막으로 분석 결과로 세운 전략을 실행하는 회사죠. 


그런데 이 세 분야를 모두 아우르는 미국의 ‘팔란티어’ 같은 데이터 전문 기업은 아직 많이 없어요. 앞으로 이런 기업이 많아질 것이라 예상합니다. 링크브릭스를 우리나라의 팔란티어로 만드는 게 목표이기도 하고요.


데이터 사이언티스트를 꿈꾸는 학생들에게 조언해주세요!


수학을 공부하는 것도 중요하지만, 데이터 사이언티스트로 활약하기 위해서는 다양한 분야에 관심이 많아야 해요. 만약 어떤 제품이 유행하면, 그 제품이 유행하는 이유를 사회 현상 등과 연결지어 읽어낼 수 있어야 하죠. 그래서 여러 종류의 자료를 많이 듣고 보는 사람이 유리하답니다. 자신만의 흥미를 찾아 다양한 경험을 쌓고 주변을 잘 관찰해보세요! 

 

 

 

진로 가이드 데이터 사이언티스트

“다양한 경험을 쌓는 게 필수!”

 

중·고등학교

수학 문제를 풀어 답을 찾는 것도 중요하지만 왜 풀어야 하는지, 필요한 수식을 왜 사용해야 하는지 고민해보세요. 그리고 수학 문제를 어떻게 사회 현상과 연결지어 쓸 수 있을지도 생각해보면 좋고요. 엑셀 등의 프로그램을 사용해 그래프를 그려 데이터 분석을 직접해볼 수도 있어요. 예를 들어 게임 시간과 성적의 상관관계를 분석해볼 수도 있지요. 주변에서 데이터를 분석해볼 만한 주제를 찾는 것도 좋답니다.

대학교

A전공은 그리 중요하지 않아요. 이공계나 인문계 상관 없이 온라인 무료 교육 과정을 듣거나 데이터를 다같이 분석해 결과를 공유하는 ‘케글’ 등의 사이트에서 활동하면서 스스로 공부할 수 있어요. 배우면 누구든지 데이터 분석을 할 수 있답니다.

회사

회사가 가진 데이터로 어떤 정보를 얻을 수 있을지 끊임없이 고민해야 합니다. 예를 들어 휴식 시간이 있는지 없는지, 있다면 얼마인지에 따라 생산성을 최대한으로 높일 수 있는 방법을 고민해볼 수 있어요. 자신의 업무 효율을 높이기 위해 뭘 바꿔야 할지도 생각해볼 수 있고요. 만약 좋은 아이디어가 떠오른다면 창업 아이템으로 쓸 수도 있지요.

 

 

*용어정리

 

시계열 분석
시간에 따라 달라지는 자료를 분석해 변수 사이의 관계를 밝히는 통계적 방법.

 

미분방정식
시간에 따른 변화를 나타내는 방정식.

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2020년 05월 수학동아 정보

  • 홍아름 기자 기자
  • 기타

    이하연

🎓️ 진로 추천

  • 통계학
  • 컴퓨터공학
  • 정보·통신공학
이 기사를 읽은 분이 본
다른 인기기사는?