d라이브러리









‘Ah 둘 중에 하나만 골라 YES or YES! Ah ah 하나만 선택해 어서 YES or YES’. 추천 알고리듬을 쓰면 힘들게 고를 필요 없다! 추천 알고리듬 사업으로 성공했을 뿐만 아니라 훤칠한 키, 잘생긴 외모로 SNS에서 유명세를 탄 젊은 CEO ‘알고 리’가 무지개 라이브에 떴다! ‘사기캐’ 알고 리의 싱글라이프를 공개한다! 
 

 

●알고 리의 하루 

 

패션 추천의 기본은 기계학습!

 

 

아침마다 탁월한 패션 센스를 뽐내는 건 정말 어려운 일이에요. 상의, 하의, 신발이 각각 15개만 있어도 경우의 수가 15³(=3375)가지나 되잖아요? 이럴 때 내 손안의 스타일리스트만 있으면 준비 시간도 단축하고 멋진 스타일도 완성할 수 있어요. 


패션은 사람마다 멋지다고 생각하는 기준이 달라요. 그래서 인터넷에 올라온 패션 사진을 전문가들이 4단계(A~D)로 평가했죠. 예를 들어 흰 셔츠와 청바지, 선글라스를 매치한 첫 번째 사진은 A등급, 벙거지 모자와 꽃무늬 외투, 노란 플레어 치마를 매치한 두 번째 사진은 D등급이에요. 이런 의상과 등급 데이터를 컴퓨터에 입력하고 ‘기계학습’을 시키면 알고리듬 스스로 어떤 의상 조합이 멋진지 학습해요. 이렇게 개발된 앱에 옷 정보를 입력하면 추천 알고리듬이 일정 등급 이상으로 의상을 조합해 준답니다.

 

 

내게 맞는 운동은 집단 지성 알고리듬으로!

 

제 페이버릿 운동 플레이스! 한강입니다. 아직 이른 시간인데 운동하는 사람을 많이 볼 수 있어요. 멋진 운동복 덕분인지 여기저기서 저를 보는 시선이 느껴지는군요. 후훗! 이제 제 개인 헬스 트레이너에게 운동을 추천 받아볼까요? 스마트 워치가 내 심장박동수와 체온, 체내 수분량, 근력량 등을 확인하고 운동을 추천해준답니다.


수많은 운동 중 어떻게 제 건강에 맞는 운동을 추천하냐고요? 바로 ‘개미 군집 최적화 알고리듬’이라는 집단 지성 기법 덕분입니다. 이 알고리듬은 앞서간 개미들이 남긴 페로몬 농도가 높을수록 가장 빠른 길이라는 것을 흉내 낸 알고리듬이에요. 나와 비슷한 신체 정보를 가진 사람들을 개미로, 그들이 한 운동을 여러 개의 길로 생각해보세요. 그 사람들이 선호하는 운동일수록 페로몬 농도가 높겠죠? 결국 나와 비슷한 신체 정보를 가진 개미를 여러 길 위에 풀었을 때, 가장 페로몬 농도가 높은 길을 제게 추천해주는 겁니다. 오늘은 저와 비슷한 개미들이 ‘1시간 30분 동안 자전거 타기’를 추천하네요! 전 어서 운동하겠습니다. 휙~.

 

 

 

유전 알고리듬이 추천하는 오늘의 요리

 

생물의 진화를 모방한 유전 알고리듬으로 맛있는 한 끼를 해결해볼까요? 유전 알고리듬은 ‘선택’, ‘교차’, ‘돌연변이’라는 주요 연산으로 다양한 식단을 만듭니다. 먼저 사용자에 맞게 여러 요리를 ‘선택’하는데, 그 기준은 칼로리, 영양소, 선호도예요. 예를 들어 다이어트 중인 사람은 음식의 영양소와 선호도 등의 정보를 변수로 칼로리를 구하는 함수를 이용해 칼로리가 가장 낮을 때의 요리를 선택해 여러 식단을 만드는 거죠. 더 다양한 식단을 만들기 위해선 식단 두 개의 일부를 바꾸는 ‘교차’와 무작위로 식단을 바꾸는 ‘돌연변이’ 연산을 진행한 뒤 사용자가 좋아할 만한 식단인지 평가해요. 사용자가 만족할 때까지 선택부터 돌연변이 연산을 반복해 식단을 추천한답니다. 

 

 

 

나의 흥을 책임지는 순열 알고리듬

 

갈 길이 멀 때 음악을 빠뜨릴 수 없죠. 하지만 듣고 싶은 음악을 매번 고르는 건 귀찮은 일이에요. 그럴 때 제가 사용하는 알고리듬은 재생 순서를 고려해 음악을 재생하는 특별한 알고리듬이에요! 신나는 댄스 음악을 듣던 중에 갑자기 발라드 음악이 흘러나오면 흥이 깨지잖아요. 그래서 저는 재생 순서를 고려해 만족도도 높이고, 상황에 더 잘 맞는 음악을 추천할 수 있도록 했습니다. 순서 추천 알고리듬에는 서로 다른 물건 중 몇 가지를 뽑아 나열하는 ‘순열’을 이용했어요.


예를 들어 나레 회원님이 방탄소년단의 ‘Fake Love’를 듣고 있다면, 재생목록에 있는 모든 음악의 가능한 재생 순서를 다 나열해요. 그중에서 Fake Love와 장르와 비트, 리듬이 가장 유사한 곡이 다음에 나오도록 하는 거예요. Fake Love 다음에는 태연의 사계가 가장 잘 어울리네요!

 

 

 

● 추천 알고리듬의 양대산맥!

 

지금까지 제가 개발한 추천 알고리듬을 살펴봤어요. 그런데 네 가지 모두 ‘협업 필터링’과 ‘콘텐츠 기반 필터링’이라는 방법을 활용해 내게 맞는 정보를 추천합니다. 사실 IT 기반 모든 추천 서비스가 이 방법을 써요. 그게 뭐냐고요? 지금 바로 설명할 테니 놓치지마세요!

 

 

 

집단 지성의 힘! 협업 필터링

협업 필터링은 비슷한 취향의 사용자들이 좋아하는 콘텐츠를 서로에게 추천하는 기술이에요. 나와 비슷한 취향의 사용자를 찾기 위해선 ‘유사도’를 구해야 합니다. 유사도를 구하는 방법은 유클리드 거리, 피어슨 상관관계, 타니모토 계수 등 다양하지만, 오늘은 ‘코사인 유사도’에 관해 설명할게요.

 

코사인 유사도는 두 벡터가 만드는 각도의 코사인 값으로 서로 얼마나 유사한 취향인지 따지는 겁니다. 먼저 헤지니, 나레, 기안19 회원님이 겨울왕국2와 터미네이터에 매긴 두 평점을 좌표평면 위에 점으로 나타내보죠. 원점과 각 점을 연결한 선분(벡터) 사이의 각도가 작을수록 코사인 값은 크고, 유사도가 높은데요, 여기선 나레와 기안19가 가장 취향이 비슷하네요!

 

 

세심한 분석이 포인트! 콘텐츠 기반 필터링

 

 

 

협업 필터링이 사용자가 매긴 평점을 이용해 분석했다면 콘텐츠 기반 필터링은 콘텐츠 자체를 분석해 추천하는 것을 말해요. 영화 추천을 예로 들면 사용자가 시청한 영화의 장르, 주연 배우, 감독과 같은 항목을 추출해 이 항목과 비슷한 영화를 추천합니다. 이 방법을 사용하기 위해선 콘텐츠의 내용 분석이 굉장히 중요합니다. 내용 분석은 사람이 해야 가장 정확하지만, 효율성이 떨어지기 때문에 주로 인공지능이 해요. 이 분야 많은 전문가가 인공지능이 사람만큼 정확하게 분석할 수 있도록 연구하고 있죠. 영상 추천 플랫폼으로 유명한 넷플릭스는 여전히 사람들이 남긴 태그를 이용해 영화의 특성을 분석한답니다. 

 

Q왓챠에서 어떤 일을 하시나요?
사람들의 영화 취향은 바뀔 수 있어서 시간 정보를 반영하는 알고리듬을 연구하고 있어요. 살짝 시험해봤는데 영화 취향이 그렇게 크게 변하지는 않더라고요. 또 사람과 작품을 꼭짓점으로 두고 사람이 작품에 평가한 별점을 선의 두께로 나타내면 추천 문제는 그래프 문제로 바뀌어요. 따라서 제 전공인 그래프 이론을 적용해 추천 알고리듬의 정확도를 높이는 연구를 하고 있어요. 

 

Q‘영상 추천을 잘한다’의 기준은 무엇인가요?
‘평균 제곱근 오차(RMSE)’라는 지표를 사용해요. RMSE는 데이터를 기반으로 알고리듬이 예측한 값과 실제 환경에서 관찰하는 값의 차이를 나타내는 지표인데, 낮을수록 추천을 잘한다고 판단하죠. 왓챠 플레이는 다른 영상 추천 플랫폼보다 RMSE 값이 낮은 편이에요. 그 비결은 질 높은 데이터를 수집하기 때문이에요. 왓챠 플레이에서는 영화를 좋아하는 사람들이 자발적으로 후기와 별점을 남기기 때문에 별점 테러나 낚시용 후기가 없거든요. 데이터가 많은 것도 중요하지만, 데이터의 질이 얼마나 좋은지도 중요해요.

 

추천 알고리듬으로 누리는 고민 없는 삶이 부럽지 않나요? 추천 알고리듬은 다양한 분야에 적용이 가능해서 앞으로 발전 가능성이 무궁무진하답니다. 실제로 추천 알고리듬으로 사업을 시작해 대박 난 경우가 굉장히 많은데요, 저를 포함해 영상 추천 플랫폼 ‘왓챠 플레이’, 패션 추천 플랫폼 ‘스티치픽스’는 신생 회사임에도 큰 성공을 이루며 안정적인 기업으로 거듭났습니다. 제 강연을 듣고 추천 알고리듬의 매력에 빠졌다면 여러분도 이 알고리듬을 어디에 적용하면 좋을지 상상해보세요~. 

 

참고

강대현 ‘데이터 마이닝과 집단 지성 기법을 활용한 소셜 콘텐츠 추천 방법에 대한 연구’, 라드 리브먼 ‘The Right Music at The Right Time : Adaptive Personalized Playlists Based on Sequence Modeling’, 옌 장 ‘Fashion Evaluation Method for Clothing Recommendation Based on Weak Appearance Feature’

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2019년 12월 수학동아 정보

  • 김미래 기자 기자
  • 도움

    정지수(왓챠 R&D 데이터 과학자)

🎓️ 진로 추천

  • 컴퓨터공학
  • 소프트웨어공학
  • 정보·통신공학
이 기사를 읽은 분이 본
다른 인기기사는?