데이터베이스의 왕국 미국이 자랑하는 다이얼로그는 보유한 정보량 면에서 미국의회 도서관에 비견된다. 하지만 이 정보는 사용법이 까다롭고 이용료가 비싸다는 것이 흠. 물론 이 단점은 다이얼로그가 제공하는 서비스의 질을 고려한다면 무시할 만하다.
디지털 혁명이라는 말이 있다. 지구상의 모든 정보(문자 수치 음성 그리고 화상)가 2진화된(digitized) 정보 형태로 축적된다는 이 말은 분명 '혁명'이란 말이 조금도 아깝지 않을 만큼 우리의 생활주변을 변화시키고 있다.
전통적인 자료의 창고로서 도서관의 기능과 형태를 예로 살펴보자. 일본의 전자도서관인 루키트(RUKIT)는 컴퓨터와 통신망을 이용해 데이터베이스에 있는 정보를 찾아볼 수 있는 미래형 전자도서관이다. 여기에는 책이 없다. 다만 컴퓨터와 CD-롬, 그리고 전자사서라 할 수 있는 정보검색원만 있다. 이용자는 그들이 원하는 자료를 네트워크와 연결된 컴퓨터에서 찾아낸다. 이렇게 전자화된 정보의 대표적인 구축형태가 데이터베이스다.
데이터베이스 선진국인 미국의 경우 현재(94년 기준) 기업정보와 문헌정보는 80% 정도, 그리고 생활정보는 30-40%의 수준에서 데이터베이스가 구축돼 있다. 영국 프랑 스 일본 등의 국가는 미국에 뒤떨어져 있지만 이들 역시 2000년경에는 기업정보 100% 생활정보의 50%가 데이터베이스화된다. 따라서 정보획득의 창구로서 데이터베이스에의 의존도는 현재보다 더 현격하게 높아질 전망이다.
또한 지금까지 대부분의 데이터베이스가 문자와 수치 데이터베이스에 치중해 있는 반면 추후 데이터베이스는 이들 데이터베이스에 음성과 화상이 결합되는 멀티화로 나아가는 경향이다. 따라서 이 시기에 온라인상에서 데이터베이스에 접속해 데이터베이스가 구축되어 있지 않아 정보를 획득하지 못하는 경우는 없을 것이다.
아마 멀티미디어 인터페이스 기술의 발달에 힘입어 정보를 공감각적으로 받아볼 것이다. 현재도 데이터베이스로 구축은 되어있지만 그 소재를 몰라서 접근하지 못하는 경우가 빈번하다.
전문가용 고가의 정보
국내에서 제공받을 수 있는 해외 온라인 데이터베이스 서비스의 대표적인 것으로는 나이트 라이더(KNIGHT RIDDER)가 운영하는 다이얼로그(DIALOG)가 있다. 이 데이터베이스의 출발은 록히드항공사에서 NASA의 프로젝트로 개발되었다. 그러다 88년 종합정보회사인 나이트라이더가 그 운영권을 인수했다. 본사는 캘리포니아 실리콘 밸리의 팔로알토시에 위치.
다이얼로그는 약 5백여개의 데이터베이스로 이루어진 데이터뱅크로, 총 4억여건의 데이터를 보유하고 있으며 전세계 1백2개국에 서비스를 하고 있다. 수량적 비교가 무리라지만 세계 최다장서를 자랑하는 미국 의회도서관이 1천5백만권의 장서를 보유한 것과 비교해도 다이얼로그는 자료의 축적량에서 지상 최고의 전자도서관(Electronic Library)이라 할 만하다.
다이얼로그에 정보를 제공하는 업자(Information Provider)들은 개인사업자, 공공기관이나 정부기관, 언론사와 잡지사 등으로 구성된다. 이들이 자료를 컴퓨터가 읽어들일 수 있도록 제공하면 다이얼로그는 데이터 베이스를 검색이 가능하도록 색인을 첨부하여 일반사용자들이 접근 가능하도록 제공한다. 따라서 정보의 내용에 대한 책임은 정보를 제공하는 IP들이 진다. 다이얼로그는 이들 IP들과 계약을 맺고 정보를 최종소비자에게 제공하는 정보의 배급업자일 뿐이다.
다이얼로그에서 제공하는 정보의 형태는 크게 네가지로 나뉜다. 즉 서지사항(bibliological), 명부(directory), 수치통계(statistical), 그리고 전문(complete text) 형태가 있다. 첫째 서지사항은 흔히 도서관의 색인 카드를 생각하면 된다. 다만 여기에 초록이 첨부돼 있다는 게 차이. 명부는 전화번호부나 인명부의 형태다. 전문(complete text) 데이터베이스는 신문과 잡지들에 해당된다. 통계형태는 흔히 테이블로 주어진다. 이러한 정보형태에 대한 사전 이해없이 검색에 들어가면 원치않는 쓰레기만 얻어내는 경우도 있다.
다이얼로그는 특히 전문과학기술분야에 필수적인 데이터베이스들을 포함하고 있어 국내의 전문연구기관이나 기업부설 연구소는 대부분 가입해 있다. 다만 검색방식이 조금 복잡해 실제 사용자들이 효과적으로 정보를 검색하기에는 상당한 수준의 숙련도를 요구한다는 게 가장 큰 단점이다. 특히 화학 및 약학 특허관련 정보 데이터베이스 등에서 이러한 사례가 두드러진다. 그러나 이들 분야와 관련이 없다면 사용하기에 그리 어렵지는 않을 것이다.
또 하나의 단점은 정보이용요금이 비싸다는 것. 특히 기업정보의 경우 한건당 출력이 1백달러가 넘어가는 고가의 데이터베이스도 있다. 그렇지만 가격문제는 모두가 공감하는 것은 아니다. 다이얼로그의 강력한 정보검색 기능이 이를 충분히 상쇄한다고도 한다. 다만 이러한 기능을 숙지하기에는 조금 노력을 필요로 한다는 것.
사실 데이터베이스 정보이용요금은 건별로 다르기 때문에 계산하기가 어렵다. 국내 대리인(agent)인 데이콤과 컴퓨서브를 통해 접속하는 경우 접속료와 회선이용요금으로만 한달에 4만원 정도가 지출된다. 그리고 다이얼로그에 지불하는 정보이용요금이 있다. 이게 비싸다. 어떻게 산출되었는지는 모르지만 정보이용요금은 시간당 평균 10만원 정도라고 한다. 따라서 일반 개인이 사용하기에는 부담이 너무 커서 현재는 주로 일반기업체와 연구기관에서만 사용한다.
그러나 최근에는 다이얼로그 서비스 중 일부를 떼내어 염가로 제공하는 서비스가 있다. 놀리지 인덱스(Knowledge Index. 이후로는 KI로 부른다)라고 불리는 것이 바로 그것이다. KI는 개별사용자들을 대상으로 업무시간 이외에만 제공되는 서비스다. 따라서 애프터 아워(After Hours) 서비스라고도 한다.
국내시간으로는 평일 오후 6시부터 익일 오전 5시까지다. 금요일에는 오후 6시부터 일요일 오후 5시까지 가능하다.
이용요금은 천리안을 통할 경우 정보사용료 및 국제통신료를 포함하여 분당 5백원 시간당 3만원 가량 든다. 국내의 데이터베이스 이용요금도 비싼 것은 분당 4백원에서 5백원에 이르는 것이 있음을 보면 그렇게 높은 가격 만은 아니다.
또한 KI는 검색방법이 간편하여 다이얼로그에 익숙하지 않은 사용자에게도 매우 편리하다. 다만 다이얼로그에서 제공하는 서비스의 일부분만을 (5백개의 데이터베이스 중 KI에는 1백20여개 정도만) 제공한다는 약점은 있으나 저렴한 가격이 이를 충분히 만회한다. 또한 KI는 별도의 해외서비스 가입절차 없이 천리안의 초기메뉴에서 '해외 DB' 선택을 통해 바로 들어갈 수 있다.
KI의 대상 데이터베이스는 26개의 주제(section)로 이루어졌다. 구체적으로는 워싱턴 포스트, 로스앤젤레스 타임스 등 미국내 유력 신문(35종)을 풀 텍스트로 받아 볼 수 있으며, 백과사전(Everyman's Encyclopaedia) 인물정보(Marquis Who's Who) 영화정보(Magill's Servey Of Cinema) 문헌정보(Book Review) 등과 5천여종의 잡지가 제공된다.
인덱스, 데이터베이스의 데이터베이스
다이얼로그와 검색방법에서 차이가 있으므로(KI는 메뉴방식과 커맨드 방식을 둘다 지원하며 커맨드 방식에 있어서도 명령어가 다이얼로그와 차이가 있다) 다이얼로그에 익숙한 사람이라 하더라도 접속시 검색방법에 대해 오프라인 상태에서 명령어를 한번 점검해야 한다.
이제 다시 다이얼로그로 돌아와서 서비스의 특징에 대해서 알아본다. 다이얼로그는 그 안에 시스템의 데이터베이스에 관한 정보를 알려주는 데이터베이스가 여럿 있다. '데이터 베이스의 데이터베이스'로 일컬어지는 이들 중에는 다이얼 인덱스(dial index), company name finder, product name finder, journal name finder 등이 있는데, 이중 대표적인 것이 다이얼 인덱스다.
다이얼 인덱스는 다이얼로그 내에 올라와 있는 모든 데이터베이스의 레코드에 관한 인덱스를 가지고 있다. 목적은 다이얼로그에서 찾고자 하는 정보에 대한 검색전략과 해당 데이터베이스를 결정하기 위한 것이다. 원하는 정보의 소재를 알수 있는 데이터베이스에 대한 어떤 단서도 없을 때 76개의 주제군(category)으로 데이터베이스를 분류하여 복합 검색을 실시한다.
예를 들어 인물에 관한 정보를 찾고자할 때 "people"이라는 범주에 포함돼 있는 19개의 데이터베이스들을 일괄 검색해 각 데이터베이스에 정보가 산재해 있는 것을 확인하고 해당 데이터베이스를 재차 검색한다. 이와 비슷한 기능으로 다이얼로그 원 서치(one search)가 있는데, 다이얼인덱스가 데이터베이스군 내에 정보의 소재여부만 알려준 반면 원서치는 정보의 검색까지 가능하다.
검색결과를 데이터베이스 내에서 가공할 수 있다는 게 또 하나의 강점. 예로 미국산업 항목에서는 정보통신을 주력으로 하는 회사 중 매출액이 1백만 달러 이상을 순서대로 정렬하고, 원한다면 이중 순위 5위까지만으로 제한 출력할 수도 있다. 또 이 데이터베이스는 자신이 원하는 문서형태에 맞춰 출력시키기도 한다. 즉 자산 부채 매출액 시장점유율 등등의 필드를 하나의 테이블로 만들어서 출력 하는 것도 가능하다.
또한 컴퓨서브의 ENS 서비스(1월호 본란 참조)와 비슷한 기능으로 다이얼로그에서는 'Alert'서비스가 있다. 이는 검색식을 미리 작성, 다이얼로그 시스템내에 저장하면 검색대상 데이터베이스에 신규 수록되는 자료들 중 검색식에 맞는 자료만을 추출하여 항공우편, 전자메일, 팩스로 우송해주는 서비스다.
ENS가 뉴스서비스에 한정된 반면 다이얼로 그의 Alert는 모든 데이터베이스에 적용된다는 점에서 더욱 큰 강점으로 꼽힌다.
싸게 이용하는 방법도 없진 않아
이제 다이얼로그를 싸게 이용하는 방법을 살펴보자. 다이얼로그는 자료의 출력형태를 사용자가 결정할 수 있다. 대부분의 데이터베이스가 시스템이 규정한 옵션(predefined format option)에 따라 출력이 제한된 반면 다이얼로그는 사용자가 스스로 출력옵션을 설정할 수 있다.
그러면 이게 가격과 어떤 관계가 있을까. 원래 데이터베이스는 제공되어지는 정보의 양과 질에 따라 가격이 결정된다. 어떤 회사의 전화번호만 알고 싶다고 가정해보자. 그런데 이전의 데이터베이스는 그 회사에 관한 모든 정보를 불필요하게 다 보여준다. 즉 내가 원하지 않는 것까지 보게 만든다. 이러면 비용과 시간의 낭비는 필연적. 다이얼로그는 이런 때에 당신을 만족시킨다.
출력형태를 전화번호만 디스플레이 되도록 결정하면 되는 것이다. 이게 가능한 것은 다이얼로그 내에 데이터베이스 필드가 상세하고 이 필드에 맞춰 출력형식을 조정하도록 설계되었기 때문이다. 필드수가 많은 것은 무려 1백개가 넘는 데이터베이스도 있다.
비용을 절약하는 또 하나의 방법으로는 'kwic format'의 활용이다. 이 방식은 화면에 디스플레이될 때 검색하고자 하는 키워드의 앞뒤 문장을 원하는 자수만큼 출력시켜 문맥을 확인하여주는 기능이다. 따라서 앞뒤 내용을 고려해 필요하지 않으면 당연히 출력에서 배제하면 된다. 만약 마이크로소프트의 '마블계획'에 대해 알고싶다면 검색시 'marvel project'의 앞뒤 50문자를 확인하면 된다.
이는 정보검색시 당연히 발생할 수밖에 없는 허접쓰레기(gabbage)를 대폭 줄일 수 있다는 점에서 유리하다. 또한 kwic format으로 검색시에는 거의 공짜다. 이러한 방법으로 출력할 자료를 엄선할 수 있다.
검색시간과 비용을 절약해 줄 수 있는 또 하나가 'Current서비스'다. 가장 최근에 추가된 레코드만으로 검색대상을 제한하여 주는 방법인 이 기능은 뉴스파일을 사용할 때 효과적이다.
그리고 국내에서 이 서비스를 이용할 때는 당연히 인터네트를 통해서 하도록 한다(telnet dialog.com). 물론 데이콤에 회선사용료로 추가비용을 물고 싶다면 안해도 상관 없다.
위에 소개한 방법은 초보자에게 어려울 수도 있을 것이다. 따라서 초보자가 비용도 절약하고 검색에 익숙해지는 방법중의 하나는 다이얼로그 링크(dialog link)를 통해 접속하면 된다. 이 프로그램은 도스버전과 윈도우버전이 있는데 당연히 윈도우버전을 사용하는 것이 더 좋다. 이 소프트웨어는 다이얼로그나 KI접속을 쉽게 해준다.
검색과 관련해서 다이얼로그링크는 두개의 창고(Buffer)를 가지고 있다. 하나는 검색 문자열을 저장하고 또 하나는 갈무리기능을 위해 존재한다. 다이얼로그링크는 사전에 검색전략에 따라 작성된 검색식을 하나의 파일로 저장했다가 접속시 마치 배치파일이 돌아가는 것처럼 검색식을 창고에서 꺼내어 한 문자열씩 실행해준다. 이때에 사용자는 검색식이 실행되는 한 문자열마다 실행여부를 결정하면 된다. 그리고 검색이 진행되는 과정에서 추가로 검색하여야 하는 검색식을 작성해줄 수도 있다. 따라서 동시에 작업을 진행해 검색 대기시간을 효율적으로 쓸 수 있다.
또 다이얼로그링크는 자동으로 화면을 갈무리해주는 기능이 있다. 접속하는 순간에 화면을 갈무리해 사용자는 언제든지 이를 꺼내볼 수 있는 것이다. 상표나 화학구조식 등 이미지 자료를 보여준다는 것도 빼놓을 수 없는 장점. 다이얼로그링크의 가격은 1백50달러이나, 간혹 할인기간에는 싸게 (최근 할인시 95달러) 팔기도 한다.
하지만 완전 초보자라면 다이얼로그에서 제공하는 온탭 데이터베이스(ontap database)를 활용하도록 한다. 온탭 데이터베이스는 실습용 데이터베이스로 비용이 거의 안 든다. 물론 사전에 검색식을 작성 활용하는 데이터베이스인 만큼 건져지는 것도 없다. 그러나 다이얼로그검색의 기본적인 틀의 연마에는 도움이 된다. 데이콤 해외DB과에 연락해 아이디와 비밀번호를 알고 사용한다.