d라이브러리









[특집] 브레인롯의 출발점, 추천 알고리즘은 알고 있다

영국 옥스퍼드대 출판부가 2024년 ‘올해의 단어’로 브레인롯(brain rot)을 꼽았다. 직역하면 ‘뇌가 썩었다’는 뜻으로, 소셜미디어에서 저품질 온라인 콘텐츠를 과도하게 소비한 끝에 뇌가 멍해지고 인지·정신 상태가 퇴보하는 현상을 비유한다. 한국에서 유행한 ‘도파민 중독’ 용어처럼, ‘끊을래야 끊을 수 없는’ 사용 습관과 그에 대한 자조·반성의 정서가 표현에 겹쳐져 있다. 과학동아는 브레인롯이 무엇인지, 무엇이 이를 키우는지, 그리고 거기서 벗어나려는 노력이 실제로 효과가 있는지 살펴봤다.
 

 

*본 기획물은 정부광고 수수료로 조성된 언론진흥기금의 지원을 받았습니다.

 

내 입맛에 맞는 콘텐츠가 끊이지 않는 소셜미디어. 그 핵심은 추천 알고리즘으로 만든 추천 시스템이다. 사용자의 활동은 추천 시스템의 결과이자 다시 시스템을 고도화하는 데이터로 활용된다. 이에 소셜미디어를 오래 사용할수록 시스템은 사용자를 더 잘 파악할 수 있다. 반면 사용자는 그런 전략을 잘 알지 못한 채 사용하고 있다. ‘지피지기면 백전백승’이라 했던가. 브레인롯을 이해하기 위한 첫 번째 단계로 주요 소셜미디어의 추천 전략을 살펴봤다.
 

▲박영주

 

지금으로부터 20년 전인 2005년 2월, 세 명의 개발자가 영상 공유 플랫폼을 만들었다. 이후 구글이 인수해 현재는 전 세계 최대의 영상 전용 소셜미디어 플랫폼이 된 유튜브다. 20년 동안 유튜브에는 무려 140억 개가 넘는 영상이 올라간 것으로 추정된다(2024년 기준). 구글은 정확한 숫자를 공개한 적 없지만 2023년 에단 주커만 미국 매사추세츠 애머스트대 커뮤니케이션학과 교수팀이 계산식을 개발했다. doi: 10.51685/jqd.2023.022


현재 유튜브의 전 세계 월간 활성 이용자는 약 25억 명으로 추정된다. 전 세계 인구 3명 중 1명이 한 달에 한 번 이상 유튜브를 보는 것이다. 한국은 2024년 5월, 전체 인구의 약 88%가 유튜브를 사용하고 있다는 추정치가 발표됐다.


유튜브는 140억 개가 넘는 영상의 바다에서 25억 명의 사용자들이 알아서 자신이 좋아하는 콘텐츠를 찾아 헤엄치게 내버려두지 않는다. 25억 명 사용자들의 입맛에 맞춘 콘텐츠를 엄선해 그들의 앞에 대령한다. 쉴 새 없이 동작하는 추천 시스템이 있기 때문이다.

 

▲jawed 유튜브 캡처
2005년 4월 23일 유튜브에 게시된 최초의 영상. 유튜브 공동창립자 중 하나인 자웨드 카림이 동물원에서 촬영했다.

 

반응하는 순간,
추천이 달라지는 피드백 루프

 

추천 시스템은 사용자가 좋아할 만한 콘텐츠의 순위를 매기고, 그 순위에 따라 추천해 주는 시스템이다. 추천 알고리즘은 순위를 계산하는 방법이다. 즉 추천 알고리즘은 추천 시스템의 핵심으로, 끊임없이 고도화되며 보다 정교한 추천 시스템을 만들어 간다.


추천 알고리즘은 어떤 데이터를 학습하는지에 따라 크게 두 방식으로 나뉜다. 첫 번째, 콘텐츠 기반 필터링은 사용자가 소비한 콘텐츠를 분석해 이와 유사한 항목을 제안한다. 따라서 콘텐츠 기반 필터링의 핵심은 사용자가 소비한 콘텐츠의 특성을 얼마나 잘 분석하느냐에 있다. 두 번째, 협업 필터링은 ‘비슷한 사용자는 비슷한 것을 좋아한다’는 가정에 기반한다. 때문에 사용자와 유사한 이들의 행동을 분석하는 것이 협업 필터링의 핵심이다. 협업 필터링은 페이스북이나 링크드인에서 주로 사용하는 전략이다.


콘텐츠 기반 필터링은 1980년대, 협업 필터링은 1990년대 이후 각각 추천 알고리즘의 중심으로 부상했다. 현재는 콘텐츠 기반 필터링과 협업 필터링 등 여러 알고리즘을 조합한 ‘앙상블(복합 모델)’ 방식이 등장해 추천 정확도를 끌어올리고 있다. 2016년 구글 연구팀이 유튜브 추천 알고리즘에 관해 발표한 논문에 따르면 유튜브는 크게 2단계로 구성된 추천 시스템을 구축했는데, 모든 단계가 여러 추천 알고리즘이 결합한 앙상블 체계로 형성돼 있다. doi: 10.1145/2959100.2959190


해당 논문에서 구글은 인공지능(AI), 특히 여러 층을 쌓은 심층신경망(DNN·Deep Neural Network)을 적용한 대규모 추천 시스템을 공개했다. 이는 딥러닝 기반 추천 시스템을 실제 대규모 플랫폼에 도입한 대표적 사례로 평가된다. AI는 유튜브 바다가 더 크고 넓어지는 상황에서 필수적이었다. 2010년대 유튜브에 올라온 영상 콘텐츠 숫자는 매년 전년도 대비 약 1.3배 수준으로 급성장했다. 애머스트대 연구팀의 연구에 따르면 2014년 한 해 동안 유튜브에 등록된 영상의 개수는 약 2억 5000만 개였지만 2020년엔 15억 개가 넘었고, 2022년에는 25억 개가 넘는 것으로 추산된다. 이 중에서 사용자에게 추천하는 영상은 몇 개 남짓이다. 일반적인 추천 알고리즘이 동작하기에 너무 큰 숫자다. 유튜브에 영상이 실시간으로 등록된다는 점도 AI 도입의 필요를 더했다. 


유튜브
두 개의 깔때기로 여러 마리 토끼 사냥

 

현재 유튜브는 ‘깔때기 구조’의 추천 시스템을 구축했다. 140억 개가 넘는 모든 영상에 점수를 매기는 것이 불가능하므로, 먼저 ‘넓고 빠르게’ 수백 개의 후보 콘텐츠를 걸러내고 그다음 ‘깊고 정교하게’ 사용자의 취향에 맞춰 순위를 매기는 방식이다. 넓고 빠른 1차 깔때기엔 사용자의 시청 이력과, 거주 지역, 성별, 검색어 등이 거름망의 역할을 한다. 같은 검색어를 입력했더라도 한국에서 한국어로 쓴 결괏값과 영국에서 영어로 쓴 결괏값이 다를 수밖에 없다. 시청 이력엔 ‘좋아요’ 버튼을 클릭한 명시적 피드백뿐만 아니라 영상을 끝까지 봤는지와 같은 암묵적 피드백도 활용된다. 영상이 올라온 시기도 거름망에 활용된다. 오래된 영상만 보여주는 것을 막고 새로 올라온 콘텐츠에도 민감하게 반영하게 새로운 콘텐츠에 가중치를 둔다.


2차 깔때기는 1차에서 걸러진 추천 영상을 어떤 순서로 보여줄지 고르는 단계다. 각 영상이 노출되는 순서에 따라 기대 시청 시간이 어느 정도 될지를 계산해 점수화한다. 유튜브가 추천했지만 사용자가 클릭하지 않고 무시하는 경우 실제 시청 시간과 예상 시청 시간에 큰 차이가 발생하는데 이 정보는 이후 사용자의 ‘취향’을 분석하는 데 활용된다.


2019년 구글이 발표한 논문에 따르면 유튜브의 추천 시스템은 두 마리 토끼를 모두 잡는 것을 목표로 한다. doi: 10.1145/3298689.3346997 사용자가 추천 콘텐츠를 ‘클릭’해 시청하는 것뿐만 아니라, 영상을 끝까지 보는 것, ‘좋아요’를 누르는 것, 추천 콘텐츠에 대한 만족도 조사에 높은 평점을 매기는 것까지가 유튜브 추천 시스템의 목표다. 구글은 콘텐츠에 점수를 매기는 방식을 개선했다. 사용자의 다양한 반응(클릭, 시청 시간, 좋아요, 평가 등)을 각각 예측한 뒤, 이를 종합해 어떤 영상을 보여줄지를 결정하는 모델을 개발한 것이다. 여러 목표를 함께 고려해 추천함으로써, 단순히 클릭을 유도하는 것을 넘어 사용자의 만족도까지 높이는 것을 지향한다. 


여러 목표 중 무엇을 우선순위로 둘지는 사용자가 유튜브를 이용하는 상황에 따라 계속 변한다. 사용자가 콘텐츠를 오래 보지 않고 빠르게 다른 콘텐츠를 클릭할 때는 시청 시간 극대화를 목표로 점수를 매긴 콘텐츠를, 사용자가 시청은 길게 하지만 ‘싫어요’ 버튼을 누를 때에는 만족도 극대화를 목표로 점수를 매긴 콘텐츠를 빠르게 보여준다. 같은 사용자라도 때에 따라 피드가 계속 달라지는 이유다.

 

▲인스타그램 블로그
아담 모세리 인스타그램 최고경영자(CEO)는 자사 블로그에서 인스타그램이 사용하는 추천 알고리즘에 관해 설명했다. 피드, 스토리, 탐색, 릴스, 검색 등 총 5개의 탭이 각각 최적화된 자체 알고리즘을 사용하고 있다고 밝혔다.

 

소셜미디어 월간 활성 사용자 수(MAU)
▲자료: Statista, 단위: 100만 명
2024년 4월 기준 전 세계 이용자 수를 보면 페이스북이 30억 명, 유튜브가 25억 명, 인스타그램이 20억 명이 넘는다. 초대형 플랫폼들은 사용자가 더 오래 머물도록 추천 알고리즘을 고도화한다. 관심사와 행동 패턴을 분석해, 반응할 만한 콘텐츠를 실시간으로 제시하며 체류 시간을 극대화한다.

 

인스타그램
탭마다 다른 추천 알고리즘

 

인스타그램 추천 시스템도 사용자가 반응할 만한 콘텐츠에 점수를 매겨 순위별로 상단에 게시하는 전략이 기본이다. 그런데 전략은 하나가 아니다. 인스타그램은 콘텐츠의 종류와 콘텐츠가 노출되는 영역에 따라 서로 다른 알고리즘으로 추천한다. 인스타그램은 사용자가 팔로우한 계정의 게시글을 주로 보여주는 ‘피드’부터, 게재 후 24시간이 지나면 자동으로 삭제되는 ‘스토리’, 숏폼 서비스를 하는 ‘릴스’, 사용자가 콘텐츠나 다른 사용자를 찾을 수 있는 ‘검색’, 그리고 팔로우하진 않지만 사용자가 좋아할 콘텐츠를 모아 둔 ‘탐색’으로 구성돼 있다. 아담 모세리 인스타그램 최고경영자(CEO)는 인스타그램 공식 블로그에서 “(인스타그램에서 사용하는) 다양한 알고리즘과 분류 모델이 각각의 목적을 갖고 있으며 피드, 스토리, 탐색, 릴스, 검색 등 각 영역은 사람들이 사용하는 방식에 맞는 자체 알고리즘을 사용한다”고 설명했다.


인스타그램 앱을 켰을 때 가장 먼저 마주하는 피드에서는 사용자가 팔로우하는 사람들이 올린 최근 게시물과, 사용자가 팔로우하지는 않았지만 관심을 가질 것으로 추측되는 게시물을 볼 수 있다. 모세리 CEO는 “게시물의 내용과 게시물을 작성한 사람, 그리고 사용자의 선호도를 고려한다”고 설명했다. 이때 사용자의 선호도는 사진, 영상, 텍스트 등 사용자가 좋아할 만한 게시물의 형식까지 고려된다. 모세리 CEO는 “게시글의 형식과 같은 사용자의 선호 요소를 우리는 ‘신호’라고 부르며, 수천 개의 신호가 있다”고 말했다. 사용자의 좋아요, 공유, 댓글과 같은 활동부터 게시물이 올라온 시기, 사용자가 어떤 전자 기기로 접속했는지, 지난 몇 주 동안 게시물을 올린 사람과 얼마나 자주 상호작용을 했는지까지도 모두 신호가 된다.


알고리즘은 신호를 학습해 예측한다. 사용자가 해당 게시물과 상호작용할 가능성을 추측하는 것이다. 모세리 CEO는 “약 12개 정도의 예측이 이뤄지는데 피드에서 가장 주요하게 살펴보는 5개의 상호작용은 게시물을 읽고, 댓글을 달고, ‘좋아요’를 누르고, 다른 사용자에게 공유하고, 프로필 사진을 누를 가능성”이라 설명했다. 유튜브와 마찬가지로 사용자의 상호작용은 추천 알고리즘의 결과이자 다시 사용자의 선호를 분석하는 데 활용되는 데이터가 된다.


탐색 탭이나 릴스에 게시되는 콘텐츠도 사용자의 과거 활동을 바탕으로 점수가 매겨지며, 점수에 따라 정렬된다. 다만 릴스는 유튜브와 마찬가지로 사용자가 영상 콘텐츠를 끝까지 보는지 아닌지가 중요한 신호 중 하나로 사용되며, 탐색은 추천된 콘텐츠를 보고 해당 게시글을 올린 사용자를 차단하는 행위를 중요 신호로 고려한다. 이 외에도 모세리 CEO는 “같은 친구라도 얼마나 많이 소통하는지에 따라 스토리를 노출하는 순서가 결정된다”고 설명했다.

 

▲Shutterstock, 이한철
소셜미디어는 사용자들이 추천 콘텐츠에 좋아요를 누르거나 댓글을 다는 긍정적인 반응부터 게시글을 숨기거나 클릭하지 않고 넘어가는 부정적인 반응까지 학습한다. 데이터는 사용자가 어떤 콘텐츠를 좋아하는지 판단하는 데 다시 사용된다. 피드백 루프 과정으로 추천 알고리즘은 끊임없이 고도화되며 추천은 점점 정교해진다.

 


하루에 50억 번 실행되는 추천 파이프라인

 

X(구 트위터)에는 하루 약 5억 개의 게시물이 올라온다(2023년 기준). 사용자가 팔로우하고 있는 사용자의 트윗이 게시되는 ‘팔로잉(following)’ 탭 말고도 광범위한 맞춤형 피드인 ‘추천’ 탭이 있다. 월간 활성 이용자 수가 6억 1100만 명에 이르는 X에서 당연히 ‘팔로잉’에 보이는 트윗의 개수보다 ‘추천’에 보이는 트윗의 후보가 비교할 수 없을 정도로 많다. X는 2023년 자사의 공식 블로그를 통해 추천 탭에 게시하는 트윗을 어떻게 선택하는지 설명했다.


X의 추천 시스템은 크게 3단계로 구성된다. 첫 번째 단계는 추천할 트윗을 고르는 단계다. 수억 개의 트윗에서 사용자가 반응할 만한 약 1500개의 후보를 뽑는다. 내가 이미 팔로우하고 있는 사용자의 트윗도 단순히 시간순으로 배치되지 않는다. 내가 상호작용할 가능성이 있는 트윗에 순서를 매기고, 이 순위에 따라 노출 순서를 정한다. 이때 리얼 그래프(Real Graph)라는 점수가 중요하게 사용된다. X는 “리얼 그래프는 두 사용자 간의 상호작용 가능성을 예측하는 모델”이라 설명했다. 


팔로우하지 않는 사용자의 트윗에서도, 내가 관심 있을 후보 트윗을 찾는다. X는 이를 ‘아웃 오브 네트워크(Out-of-Network)’라 부른다. 아웃 오브 네트워크 후보를 고르는 데는 그래프 기반 탐색 엔진인 그래프제트(GraphJet)와 딥러닝 기반 유사도 모델이 사용된다. 


두 번째 단계에서는 약 1500개의 후보군에 점수를 매긴다. X는 “약 4800만 파라미터의 신경망을 사용해 사용자가 추천 트윗과 긍정적으로 상호작용할 확률을 예측하고 이를 종합해 순위를 매긴다”고 설명했다. 사용자의 상호작용은 ‘좋아요’를 누르거나 ‘리트윗’하는 것, 답글을 다는 것, 인용해 의견을 덧붙이는 것 등이다.


마지막은 추천 트윗을 점검하는 단계다. 사용자가 앞서 차단하거나 뮤트(음소거)한 계정, 이미 본 트윗 등을 제외하는 것은 물론 같은 작성자가 게시한 트윗이 연속해서 노출되는 것을 제한하기까지 한다. 사용자의 피로도를 낮추기 위함이다. 또한 앞서 사용자가 부정적인 피드백을 했던 트윗과 유사한 트윗은 감점 처리해 사용자가 더 만족할 만한 추천 트윗을 정제해 낸다.


X는 “추천 트윗을 만드는 과정이 하루에 약 50억 번 실행된다”며 “모든 단계는 평균 1.5초 내로 이뤄진다”고 설명했다.

 

X의 추천 탭은 어떻게 구성될까
추천 탭은 팔로잉 관계의 ‘인 네트워크’가 올린 트윗과, 관계가 없는 ‘아웃 오브 네트워크’ 트윗이 각각 50~60%, 40~50% 비율로 구성된다. 상호작용이 많거나(굵은 선) 비슷한(굵은 점선) 사용자의 트윗에는 가중치가 더해진다.

 

그래프를 기반으로 후보 트윗 탐색
▲동아사이언스
노드(사용자· 콘텐츠)와 엣지(상호작용)을 잇는 그래프에서 연결 관계를 따라가며 새로운 노드를 찾는다. 탐색 경로(붉은 화살표 방향)는 가중치에 따라 달라진다. 그래프 탐색과 수학적 유사도 계산이 완료되면 종합해 점수를 매기고 높은 점수의 콘텐츠를 먼저 보여준다.


소셜미디어, 
끝없이 동작하는 추천 시스템

 

 

“X, 인스타그램, 유튜브 모두 사용자의 반응이 실시간으로 수집되고 모델에 반영돼 시간이 지날수록 더욱 사용자의 취향에 맞는 콘텐츠가 추천되는 게 핵심입니다.” 강유 서울대 컴퓨터공학부 교수는 과학동아와의 인터뷰에서 설명했다. 강 교수는 실시간 피드백 루프가 “사용자의 취향과 흥미를 예측하는 기술을 넘어 몰입을 설계하고 끊임없이 콘텐츠를 소비하게 유도하는 구조로 진화했다”고 말했다.


추천 전략은 소셜미디어 사용자의 능동성을 크게 떨어뜨리기도 한다. 이종은 서울대 컴퓨터공학과 연구원은 “소셜미디어에서 사용자의 탐색 행동이 제한적인 경향이 있다”며 “추천 시스템은 콘텐츠 소비 경로의 핵심적 요소로 작동하고 있다”고 설명했다. 즉 우리가 소셜미디어에서 끊임없이 콘텐츠를 소비하는 과정은 끊임없이 고도화되고 있는 기술이 만들어낸 광경이라는 것이다. 


추천 시스템이 어떻게 동작하는지 만으로는 ‘입안의 혀’처럼 구는 소셜미디어와 거리 두는 것이 쉽지 않아 보였다. 다음 파트에서는 ‘브레인롯’이 실제로 우리 뇌에서 어떻게 관찰되는 현상인지 살펴봤다. 

2025년 11월 과학동아 정보

  • 김태희
  • 도움

    강유 서울대 컴퓨터공학과 데이터 마이닝 연구팀
  • 디자인

    이한철

🎓️ 진로 추천

  • 컴퓨터공학
  • 심리학
이 기사를 읽은 분이 본
다른 인기기사는?