d라이브러리









토종 검색엔진 달고 훨훨 나는 NHN

마음까지 읽는 지능형 서치엔진 개발에 도전

 

네이버 검색엔진을 개발하는 검색기술팀. 왼쪽에서 두번째가 배상용 팀장.


우리나라에서 인터넷의 대표적 성공 사례로 꼽히는 기업이 두 곳 있다. 인터넷의 라이벌인 ‘네이버’와 ‘다음’이다.

NHN의 포털 사이트인 네이버는 몇년 전까지만 해도 야후, 다음 같은 포털 사이트에 밀려 별로 빛을 보지 못했다. 네이버는 5년 전만해도 국내 8위의 포털사이트였으나 검색엔진 개발을 통해 파죽지세로 성장, 요즘은 다음과 뜨거운 1위 다툼을 벌이고 있다.

NHN의 매출액은 2000년 88억원에서, 지난해에는 1천6백63억원으로 3년 만에 20배나 늘어났고 지난 한해 6백53억원의 영업이익을 냈다. 40%에 달하는 엄청난 이익률이다. 현재 NHN의 기업가치는 조흥은행과 맞먹고 다음의 2배에 달한다.

네이버의 성공 비결은 최고의 검색엔진 개발을 향한 지칠 줄 모르는 집념에 있다. 검색엔진은 하드웨어, 소프트웨어, 언어 등 다양한 분야에서 고도의 기술력을 필요로 하는 분야로 미국이 세계를 지배하고 있다. 국내에서도 다음이나 한미르는 미국 검색엔진회사인 구글의 검색결과를 가져다 쓰고 있다.

반면 한국에서는 ‘토종 검색엔진’인 네이버가 전체 검색 수요의 50%를 차지한다. NHN 배상용 검색기술팀장은 “주요 국가들 가운데 검색엔진의 최강자인 구글이 성공하지 못한 곳은 한국이 거의 유일하다”고 말한다.

흔히 NHN의 가장 큰 장점으로 자체 기술 개발 능력이 꼽힌다. 네티즌들의 성향을 충분히 고려한 검색과 커뮤니티 서비스, 포토앨범 등의 서비스 뿐 아니라 한게임의 각종 게임은 모두 NHN이 자체 개발한 솔루션을 바탕으로 개발됐다.

NHN 홍보팀 조은현 대리는 “자체 개발 능력은 인터넷 사용자들의 요구에 빠르고 정확하게 대응할 수 있는 원동력으로, NHN이 여타 인터넷 기업과 크게 차별되는 점이다”이라고 강조한다. 이 회사에서는 현재 검색엔진 개발을 비롯해 시스템 개발, 게임개발, 서비스개발 등 각 분야의 전문 개발 인력이 전체 직원 7백명의 60%를 넘어서고 있다.

네이버의 설립자인 이해진 부사장이 인터넷 검색분야에 관심을 가진 것은 1980년대 후반 서울대 컴퓨터공학과를 졸업하고 삼성SDS에 입사해 기술개발을 담당하면서부터다. 인터넷 검색이 각광 받을 것으로 확신한 그는 본격적인 검색엔진 개발에 착수했고 1997년 사내벤처 1호인 네이버의 소사장이 됐다.

네이버가 1999년 독립법인 네이버컴으로 정식 출범하면서 선보인 최초의 지능형 검색엔진은 ‘넥서치’이다. 이 검색엔진은 한 화면에 뉴스, 웹사이트 등 여러 정보를 한꺼번에 보여주는 것이었다. 그러자 한번의 검색으로 다양한 정보를 한꺼번에 찾아주는 네이버로 네티즌들이 몰리기 시작했다.

창업 당시 네이버의 검색엔진이 보관하는 웹페이지는 1백만개 정도에 불과했으나 지금은 일본의 웹페이지를 포함해 10억 페이지에 달한다. 또한 초기에는 웹사이트의 문서를 모아놓은 정도였으나 지금은 디렉토리, 웹문서, 전문지식, 이미지, 사전, 지도 등의 다양한 검색기능이 추가되면서 14가지 종류의 정보를 한번에 검색할 수 있다.

그러나 검색엔진 그 자체만으로는 수익이 생기지 않아 회사에 큰 위기가 닥치기도 했다. 배너광고가 있기는 했지만 이것만으로는 회사의 운영비를 대기에 턱없이 부족했던 것이다. 그래서 2000년 이해진 부사장은 서울대 컴퓨터공학과 선배이자 삼성SDS 입사동기인 김범수 현 NHN 사장이 설립한 온라인 포털사이트인 한게임과 합병해 안정적인 수입원을 창출했다.

검색엔진이 돈이 된다는 것을 입증한 결정적인 계기는 NHN이 2002년에 선보인 키워드 광고이다. 키워드 광고란 이용자가 어떤 특정 단어를 검색하면 그 단어와 관련이 있는 광고를 보여주는 것이다. 예를 들어 네이버에서 ‘MP3’란 단어를 치면 MP3 재생기를 판매하는 쇼핑몰과 제품에 대한 광고가 뜬다. 키워드 광고는 검색엔진 회사의 큰 수입원으로 등장했고 현재 NHN 매출액의 25% 가량이 키워드 광고 수입이다.

이어 NHN이 지난해 내놓아 또 한번 히트를 친 새로운 검색기술은 지식검색이다. 지식검색이란 인터넷 사용자들끼리 서로 질문과 답변을 올리고 지식이 될만한 것을 찾아볼 수 있게 한 것이다. 질문을 올리고 답을 해주는 지식서비스는 한겨레신문이 선보인 ‘디비딕’이 있었다. 이 사이트에는 많은 지식이 쌓여있었으나 검색이 안되던 게 문제였다.

지식서비스에 검색기능을 추가한 것이 네이버의 ‘지식iN’ 서비스다. 지금 여기에는 무려 2천만개에 달하는 지식데이터베이스가 쌓여있어 백과사전을 훨씬 능가한다. 지난해 10월부터는 블로그, 12월부터는 카페까지 검색이 가능해졌다. 인상깊은 여행지나 음식맛이 좋은 곳을 다녀와서 자신의 블로그나 카페에 올려놓으면 다른 사람들이 이것까지도 검색해 볼 수 있는 것이다.

또 올해 4월부터는 검색예측서비스를 시작했다. 이 서비스는 어떤 특정 단어를 검색한 사람이 자주 검색하는 다른 검색어를 동시에 보여줌으로써 더 빠르게 더 폭넓게 정보를 검색할 수 있도록 도와준다.

네이버가 올해 하반기 중 선보일 새로운 검색 서비스는 개인화 검색엔진이다. 다른 사람과 차별되는 나만의 맞춤형 검색엔진인 셈이다. 이 서비스는 네이버에 나의 관심분야를 등록하면 검색한 결과를 배열할 때 자신의 관심 분야에 대한 정보를 우선적으로 보여준다.

예를 들어 농민이 ‘apple’이라고 치면 사과에 대한 정보가 우선적으로 나오지만 컴퓨터 전문가가 검색창에 apple을 치면 애플컴퓨터가 먼저 뜬다. 이처럼 개인의 관심도를 반영하는 맞춤형 검색엔진은 현재 전세계적인 검색 트렌드가 되고 있다.

검색엔진 개발을 이끌고 있는 배상용 검색기술팀장은 “미래에는 의미를 좀더 정확히 분석하는 지능형 검색엔진이 등장할 것”이라고 내다본다. 지금은 단순히 검색어와 문서가 일치되면 그 문서를 찾아오지만 앞으로는 검색어가 일치하지 않아도 검색을 하는 사용자의 의도를 파악해서 이 사람에게 필요한 정보를 찾아주게 된다는 것이다. 이렇게 되려면 컴퓨터가 문장을 이해해야 한다.

예를 들어 “15일 뉴욕에서 파리로 가는 가장 값싼 비행기표를 찾아달라”고 하면 가장 값싼 비행기표를 예약할 수 있는 웹사이트로 안내하는 것이다. 배 팀장은 “이런 검색엔진은 아직 요원하지만 불가능한 것은 아니다”고 말한다.

현재 네이버의 컴퓨터는 약 1천대의 분산형 서버로 구성돼 있으며 목동과 분당의 IDC에 들어가 있다. 이 서버에 있는 크롤러는 쉬지않고 돌아다니면서 전국의 웹페이지에서 추가되는 정보를 가져온다. 중요한 웹사이트일수록 자주 정보를 업데이트한다.

서치엔진은 수집대상 문서에 대해 검색을 할 수 있도록 가공하는 색인단계를 거친다. 그리고 단어가 들어있는 문서에 대해 랭킹을 매겨 어떤 문서가 1등, 2등으로 등장할 것인지 순서를 매겨놓는다.

NHN은 한국의 인터넷 강자로만 머물지 않고 아시아의 인터넷 강자로 발돋움하고 있다. ‘NHN 재팬’이 운영하는 한게임재팬은 회원수 6백50만명을 기록, 일본 내 웹게임 시장 1위를 차지하고 있다. 또한 네이버재팬은 검색을 중심으로 지난해 말 ‘지식플러스’서비스를 시작하여 좋은 반응을 얻고 있다.

또한 2003년 10월에는 중국 인터넷 게임 시장 진출을 위해 홍콩 PCCS사와 합작법인 설립에 관한 계약을 체결했다. 최근에는 중국 최대의 온라인 게임 포털인 아워게임을 운영하고 있는 해홍사와 합작법인 설립을 위한 계약을 체결했다.

하지만 검색엔진 분야에서는 세계 최고의 반열에 오르려면 아직도 갈길이 멀고 험하다. 네이버의 검색기술은 국내에서는 독보적인 위치를 차지하고 있지만 세계 최고의 검색엔진인 구글이 한국 상륙을 넘보고 있다.

이에 맞서 NHN 검색개발팀 50명은 세계 최고의 검색엔진 개발에 몰두하고 있다. 또한 지난해 정보검색 대가들이 많이 포진하고 있는 미국 매사추세츠주립대에 현지 연구소를 만들어 공동연구도 진행 중이다.
 

서울 테헤란로의 한복판인 스타타워에 위치한 NHN의 오피스.
 

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2004년 07월 과학동아 정보

  • 사진

    박창민
  • 신동호 기자

🎓️ 진로 추천

  • 컴퓨터공학
  • 소프트웨어공학
  • 정보·통신공학
이 기사를 읽은 분이 본
다른 인기기사는?