d라이브러리









[생활] Google 검색의 비밀은?

미래를 여는 수학


 
‘수학을 잘하는 법’이 궁금할 땐 어떻게 해야 할까? 수학 선생님이나 수학을 잘하는 친구에게 노하우를 물을 수도 있지만, 많은 사람들은 단지 인터넷 검색창에 ‘수학 잘하는 법’이라고 입력한다. 그러면 검색엔진은 전세계에 흩어져 있는 데이터에서 해당 검색어와 일치하는 자료를 찾아 보여 준다. 하지만 이렇게 찾은 자료가 모두 내가 원하는 정보는 아니다. 그래서 사람들은 원하는 정보를 가장 잘 찾아 주는 검색엔진에서 검색을 한다. 그 선두에 구글이 있고, 그 비밀에 수학이 있다.

구글은 어떻게 탄생했을까?


지난 5월 21일 영국 파이낸셜타임스는 ‘2014년 글로벌 브랜드 100대 기업’ 순위에서 구글의 브랜드가 1588억 4300만 달러(한화로 약 163조원)로 전세계 1위라고 발표했다. 29위로 평가된 삼성전자의 브랜드 가치가 259억 달러(약 26조 6000억 원)인 것을 생각하면 구글의 영향력은 그야말로 대단하다.

그렇다면 구글의 역사는 어떻게 시작된 걸까? 바로 래리 페이지와 세르게이 브린이 1995년 스탠퍼드대 대학원에서 만나면서 이야기가 시작된다. 브린이 2년 선배이긴 하지만 동갑이었기 때문에 둘은 급속도로 친해졌다. 그리고 수학에 재능이 있는 브린과 컴퓨터에 관해 박학다식한 페이지는 수학을 이용한 컴퓨터 연구에 박차를 가하게 된다.

사실 브린은 수학 교수인 아버지의 재능을 그대로 물려받아 어린 시절부터 수학에 남다른 재능을 보였다. 불과 21살의 나이에 메릴랜드대 수학과와 컴퓨터학과를 우수한 성적으로 졸업했을 정도다. 페이지는 컴퓨터공학 교수인 아버지의 영향으로 어려서부터 컴퓨터를 가지고 놀면서 자랐는데, 덕분에 컴퓨터에 관해서는 또래보다 훨씬 많은 정보를 가지고 있었다.

당시 페이지의 관심사는 월드 와이드 웹(www)이었다. 이는 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 정보 공간을 일컫는데, 페이지는 이를 거대한 그래프로 생각했다. 그래서 그 연결 구조를 이해하기 위해서는 수학적 성질을 이용해야 한다고 판단했다. 이 때문에 수학을 잘하는 브린에게 함께 연구하자고 제안했다.

둘은 선형대수학★의 권위자인 진 골룹 교수에게 지도를 받아가며, 기존의 검색엔진들의 단점을 보완하기 위해 애썼다. 당시 검색엔진은 해당 검색어와 일치하는 자료를 무작위로 보여 줬기 때문에, 검색하는 사람이 원하는 정보를 제대로 제공하지 못했다. 이에 브린과 페이지는 일단 찾은 자료에 여러 가지 규칙을 적용해, 검색하는 사람이 원하는 정보를 제공할 수 있는 검색 기법을 생각하기 시작했다.

그 결과 연구를 시작한 지 1년도 되지 않아 성과가 나왔다. 행렬의 고윳값과 고유벡터를 이용해 웹페이지에 순위를 매겨 순위가 높은 순으로 검색 결과를 보여 주는 ‘페이지랭크 기술’을 개발한 것이다. 이 기술은 아직까지도 다른 검색엔진에서 따라올 수 없는 구글의 독보적인 기술로 평가받고 있다.

선형대수학★ 벡터, 행렬, 선형연립방정식 등을 연구하는 대수학의 한 분야다.

페이지랭크 알고리즘 속 수학

구글 엔진에서는 한 웹페이지에서 다른 웹페이지로 연결하는 링크가 있으면, 그 링크를 일종의 투표로 본다. 즉 많이 투표된 웹페이지를 좋은 정보가 있는 사이트라고 가정한다. 그리고 투표수가 많은 웹페이지를 검색 결과 상단에 배치시킨다. 이것이 바로 페이지랭크 알고리즘의 원리로, 웹페이지의 관계를 행렬로 나타낸 뒤 연산을 해서 구한다.
 

구글의 세상 담기 프로젝트!

구글의 목표는 전세계의 모든 정보를 관리하고 그것을 누구나 이용할 수 있도록 하는 것으로, 이를 실현하기 위해 현재 구글 도서관 프로젝트를 진행하고 있다. 즉 모든 도서를 디지털로 만들어 반영구적으로 보관하고, 전세계 사람들이 볼 수 있도록 하는 것이다.

실제로 19세기 이전에 발간된 책의 저작권은 대부분 이미 소멸되어 디지털로 구축해 놓는다면 누구나 무료로 볼 수 있다. 따라서 구글은 영국의 대영도서관, 일본 게이오대, 미국 하버드대 등 세계 80곳 이상의 도서관과 3만 곳 이상의 출판사와 연계해 지금까지 1,600만 권 이상을 디지털화했다. 덕분에 구글 북스(books.google.com) 사이트를 이용하면 수백 년 전에 쓰여진 원전들을 집에서 무료로 볼 수 있다.

한편 구글은 비영리 자회사인 구글닷오알지(google.org) 통해 검색 데이터를 분석한다. 이를 통해 주식시장을 예측하는 것은 물론, 질병의 확산 경로를 파악해 보여 주고 있다.

그러나 이러한 구글의 기술에 좋은 점만 있는 것은 아니다. 자신이 원하지 않는 정보까지 노출되는 경우가 많기 때문이다. 실제로 지난 5월 유럽사법재판소는 구글의 검색 결과에서 특정인의 개인정보와 관련된 링크를 삭제하라는 판결을 내렸다. 그러자 구글은 지난 6월 삭제 요청을 할 수 있는 도구를 만들어 신청을 받았고, 그 결과 한 달간 무려 4만 1000건이 접수됐다. 현재 구글은 차례로 고객들의 요청을 처리하고 있다.

구글이 처음으로 삭제한 링크는 마리오 코스테하 곤잘레스의 빚을 언급한 1998년도 신문 광고다. 그는 이미 오래 전에 돈을 갚았는데도 이 기사가 검색되자 삭제 요청을 했다. 하지만 이 정보가 구글의 전체 검색 결과에서 사라지는 것은 아니다. 개인의 이름을 검색하는 페이지에서만 없어진다.

우리나라의 학생들은 대개 수학 공부를 하는 이유를 ‘입학시험을 잘 보기 위해서’라고 생각하고, 수학은 우리의 삶에 불필요한 과목이라고 여긴다. 하지만 우리가 매일 마주하는 구글 검색 엔진, 크롬 브라우저, 구글 플레이 등 구글이 개발한 서비스 속에는 수학이 녹아들어 있다.

2014년 08월 수학동아 정보

  • 이상구 교수
  • 사진

    포토파크닷컴
  • 사진

    위키미디어
  • 사진

    구글
  • 진행

    조가현(gahyun@donga.com) 기자

🎓️ 진로 추천

  • 컴퓨터공학
  • 수학
  • 정보·통신공학
이 기사를 읽은 분이 본
다른 인기기사는?