d라이브러리









스스로 생각하는 스마트 웹

KAIST 정보시스템연구실

▒ 겨울 방학을 맞아 대학생 가보자 씨는 배낭여행을 준비하고 있다. 여행계획을 세우려고 인터넷 검색창에 키워드로 ‘파리’를 입력한 가 씨. 그러나 검색결과는 파리바게뜨, 파리지옥 키우는 법, 사파리 등 원치 않는 정보투성이다. 가 씨에게 맞는 여행정보는 어디에 있는 걸까.

인터넷은 이미 우리 생활 깊숙이 자리잡고 있다. 그런데 가 씨의 경우처럼 검색결과의 질은 ‘2%’ 이상 부족하다. 이것이 현대 인터넷의 한계다. KAIST정보시스템연구실 정진완 교수는 “컴퓨터가 사용자의 검색의도를 알아채고 사용자가 원하는 정보만 검색해주는 ‘시맨틱 웹’(semantic web) 시스템이 구현되면 검색결과의 정확도를 100% 가까이 높일 수 있다”고 전망했다.
 

시맨틱 웹은 사용자가 원하는 검색 결과가 무엇인지 추적하는 탐정과 같다. 이렇듯 웹은 점점 똑똑하고 정확하게 진화한다.


컴퓨터와 말 통하는 검색 시스템

인터넷이 정보의 바다가 된 시점은 1989년 영국의 팀 버너스리가 월드 와이드 웹을 제안하면서부터다. 사람들은 인터넷에 각종 정보를 올리기 시작했다. 그러나 웹 정보량이 기하급수적으로 늘면서 원하는 정보만 골라내는 것이 문제였다.

현재 인터넷 검색결과는 사용자의 의도와 완전히 맞아떨어지지 않는다. 사람과 기계가 쓰는 언어가 다르기 때문이다. 사람은 곤충 ‘파리’와 프랑스의 수도 ‘파리’를 의미로 구분하지만, 컴퓨터는 정보를 문법단위로 인식해 이 둘을 같은 단어로 본다.

버너스리 박사는 1999년 시맨틱 웹이라는 개념을 대안으로 제시했다. 시맨틱(semantic)은 말 그대로 사용자의 ‘의미’와 ‘의도’를 이해하는 똑똑한 웹 시스템을 말한다. 이를 위해 현재 인간이 읽는 문서 위주인 웹을 기계도 이해할 수 있는 웹문서로 바꿔야 한다.

정 교수팀은 시맨틱 웹을 실제로 구현하기 위한 기술을 개발한다. 연구팀은 XML언어를 연구해 컴퓨터에 텍스트의 의미를 알려줄 수 있도록 프로그램을 구성한다. 예를 들어 HTML로 ‘파리’를 입력하면 컴퓨터는 프랑스의 파리와 곤충 파리를 같다고 인식하지만, XML로 ‘파리’를 입력하면 각각의 단어 앞에 ‘도시’ 또는 ‘곤충’ 같은 태그를 달 수 있어 컴퓨터가 단어의 의미를 제대로 인식한다.

그 결과 연구팀이 개발한 시맨틱 엔진은 최근까지 대용량 추론 검색시스템 가운데 가장 빠르다고 알려진 미국 리하이대의 ‘DLDB’보다 속도가 평균 90배 빨랐다. 정 교수는 이를 2007년 4월 데이터베이스분야의 저명한 국제 학술대회인 다스파(DASFAA)에서 발표해 주목을 받았다.
 

정보시스템연구실은 똑똑한 웹 검색엔진을 만들기 위해 고군분투하고 있다. 앞줄 오른쪽에서 세번째가 정진완 교수.


웹 3.0 시대의 화두는 ‘개인화’

정 교수는 “웹2.0시대의 화두가 ‘참여’였다면, 시맨틱을 필두로 하는 웹3.0시대의 화두는 ‘개인화’”라고 말했다. 미래에는 소비자의 기호가 다양해져 개인별 서비스를 제공하는 것이 업계의 화두가 될 전망이다. 최근 국내 통신업체인 SKT와 KT가 ‘사용자의 의도’에 따라 웹을 구성하는 시맨틱 웹에 관심을 보이는 것도 같은 맥락이다.

기호가 다양한 소비자의 욕구를 ‘단시간’에 파악하기 위한 첫 단계로 정 교수팀은 사용자의 정보를 수집해 그들의 기호 성향을 분석했다. 그리고 유사한 그룹을 찾아 비교집단의 선호도에 따라 의뢰집단에 알맞은 상품을 추천했다. 기호가 비슷하므로 그 규칙을 적용해 의뢰집단에 ‘맞춤’ 서비스를 제공할 수 있다.

시맨틱 웹 분야 산업전망은 밝은 편이다. 2006년 미국 시장조사기관인 카트너그룹은 시맨틱 웹 산업규모가 2018년이 되면 현재시장의 100배 이상 커질 것으로 전망했다. 정 교수도 “2년 안에 시맨틱 웹이 상용화될 것”이라고 본다.

정보의 양이 늘어난 인터넷은 오히려 사용자를 정보의 바다에서 익사시키고 있다. 이 문제를 해결할 수 있는 열쇠로 똑똑한 웹 검색, 시맨틱 웹의 행보가 힘차다.
 

검색엔진이 다양해지면서 네티즌의 욕구를 충족시키기 위해 검색의 정확도를 높이려는 경쟁이 치열하다.
 

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2008년 02월 과학동아 정보

  • 목정민 기자

🎓️ 진로 추천

  • 컴퓨터공학
  • 정보·통신공학
  • 소프트웨어공학
이 기사를 읽은 분이 본
다른 인기기사는?