![](https://images.dongascience.com/uploads/old/article/2015/06/8513712565590a4de02dd7.jpg)
![](https://images.dongascience.com/uploads/old/article/2015/06/4070376475590a51c067df.jpg)
내 입맛에 맞는 콘텐츠를 권해주는 소프트웨어가 빠르게 늘고 있다. 이런 소프트웨어는 1990년대에 처음 등장했는데, 당시만 해도 단순히 가장 인기가 많은 콘텐츠를 추천해주는 방식이었다. 그런데 불과 20년 사이에 추천 알고리즘은 급성장했다. 이젠 개개인의 취향을 ‘저격’하는 소프트웨어의 시대다.
하나를 보면 열을 안다
소프트웨어는 어떻게 내가 좋아할 만한 물건을 예측하는 걸까. 가장 많이 쓰이는 방법으로 두 가지가 있는데, 우선 첫 번째는 ‘나랑 가장 성향이 비슷한 사용자’를 찾는 것이다. A라는 사람이 어느 웹사이트에서 상품 1과 상품 2를 샀다고 하자. B는 상품 1, 2뿐 아니라 3과 4도 샀다. C는 3과 4만 샀다. A와 구매성향이 가장 비슷한 사람을 찾아서 그가 산 다른 물건을 A에게 추천해보자.
수학으로 간단히 유사도를 구할 수 있다. 교집합 상품개수를 합집합 상품개수로 나누면 된다(│A∩B│/│A∪B│ ). A와 B는 교집합 원소 수가 2, 합집합 원소 수가 4이므로 유사도는 0.5다. 같은 방법으로 계산하면 A와 C는 유사도가 0이다. C보다는 B가 산 물건을 A에게 추천할 때 만족할 가능성, 즉 구매할 확률이 높아진다. 유사도를 구하는 방법은 여러 가지가 있지만 방금 본 계산이 가장 기초적인 ‘자카드 유사도’ 방식이다.
이렇게 구매성향이 비슷한 사람을 찾는 방법은 한 가지 단점이 있다. 사람이 많아질수록 연산 속도가 기하급수적으로 는다는 것. 모든 사용자의 유사도를 계산할 수가 없다. 따라서 일단 어느 정도 비슷한 사용자들끼리 소규모 그룹을 만들어 그 안에서 계산한다. A가 이전에 샀던 상품 1과 2를 구매한 적이 있는 사용자들만 따로 모아서 계산을 하는 식이다.
아예 시장에 처음 나오는 물건은 누구에게 추천해야 할까. 새 책이나 새 영화처럼 이전에 누구도 구매한 적이 없는 상품은 위와 같은 방식으로 추천할 수가 없다. 이럴 때는 두 번째 방식, 아이템 기반 유사도를 이용한다.
예를 들어 기자가 그동안 별점을 높이 줬던 영화 사이의 공통점을 찾는 식이다. ‘그 여자 작사 그 남자 작곡’, ‘어거스트 러쉬’, ‘원스’…, 모두 음악을 소재로 한 젊은 남녀의 사랑이야기다. 기자에게 영화 ‘비긴 어게인’이 새로 나왔을 때 추천하면 ‘먹힐’ 확률이 높다. 아마존에선 이런 식으로 책 사이의 공통점을 찾아 추천한다. 추천으로 구매한 책이 전체의 35%를 차지할 정도로 성공확률이 높다.
![](https://images.dongascience.com/uploads/old/article/2015/06/9653499685590a525466d2.jpg)
친구를 보면 당신을 알 수 있다
이제는 한 발 더 나아가 현실에서의 친밀도를 기준으로 상품을 추천하는 소프트웨어가 등장하고 있다. 사람들은 가까운 사람의 의견을 더 신뢰하는 경향이 있다. 친밀도에 가중치를 부여해 구매성향 유사도를 계산하면 더 정확한 추천을 할 수 있다. 백두권 고려대 융합소프트웨어전문대학원 교수팀은 실험을 통해 이런 점을 확인해 작년 4월 논문으로 발표했다.
쉽게 설명해보자. 나와 구매성향이 비슷한 트위터 친구 여섯 명이 있다. 이 중 네 명은 갤럭시6를 샀고, 두 명은 아이폰 6를 샀다. 기존 알고리즘은 나에게 갤럭시6를 추천할 것이다. 하지만 실은 아이폰을 산 두 명이 나와 훨씬 친한 친구였다면? 연구팀이 밝혀낸 사실은 친밀도가 실제로 구매에 막강한 영향력을 행사한다는 것이다. 논문에서 친밀도에 큰 가중치를 부여한 새로운 추천 알고리즘, 프리아마시(PReAmacy)를 제안한 이유다.
![](https://images.dongascience.com/uploads/old/article/2015/06/6324778875590a53827a51.jpg)
페이스북은 진작부터 이 사실을 알고 있었다. ‘좋아요’, 댓글, 태그, 공유 행위를 분석해 사용자 간 친밀도를 파악한 다음, 여기에 높은 가중치를 붙여 추천 알고리즘을 운영하고 있다. 뉴스부터 기업광고까지, 내 뉴스피드에 올라오고 있는 소식들은 나의 인간관계를 분석한 산물이다. 내가 뭘 좋아할지, 어쩌면 소프트웨어가 나
보다 더 잘 알고 있을지 모른다.
공동기획 : 미래창조과학부