논리언어 퍼지이론 신경망 전문가시스템 문자인식 등 인공지능에 이르는 다양한 방법론이 현실적인 문제를 풀기 위해 서로 경쟁하고 있다. 이러한 방법론들이 어느 단계에 이르러 통합될 때 비로소 인류가 오랫동안 그려온 인공지능의 1차적 실현이 이루어질 것이다.
인공지능의 목표는 인간 지능의 원리를 밝혀내기 보다는 인간 지능이 갖는 기능적인 특성을 재구성하려는 데 있다.
인공지능에 대한 인간의 관심은 컴퓨터가 나오기 오래전부터 있어왔다. 물론 철학적인 관점에서 보면 고대 사상까지 연결될 수 있겠지만, 20세기초 수학의 연구주제에서부터 본격적인 연구의 시작을 찾을 수 있다.
20세기에 접어들면서 러셀을 비롯하여 많은 수학자들은 수학의 기초(원리)가 되는 일련의 체계를 찾고자 했다. 수학은 세계에 대한 논리적인 모델이고, 계산은 그 모델을 구현하는 개념이라고 할 수 있다. 수학적인 기계의 개념이 만들어졌는데 이중 가장 잘 알려진 것이 튜링 머신이다.
이 기계는 수학이 제시하는 모든 모델을 계산할 수가 있다. 수학적 기계 자체가 논리적 계산만 하는 것은 아니지만, 그 당시 유행했던 공리체계로서의 수학을 계산학적으로 설명하는데 이용되었다. 이러한 기계는 후에 컴퓨터로 발전되고 그로부터 인공지능을 창출하는데 이른다.
인공지능시스템은 그 시스템의 주변 환경에 지능적인 영향을 미칠 수 있는 시스템을 말한다. 이러한 시스템은 크게 주변으로부터 정보를 습듭하는 기능, 그리고 이러한 정보를 지능적으로 처리하는 기능, 그리고 이로부터 적절히 주변에 변화를 가하는 기능들을 가진다.
인공지능의 분야를 보면 이러한 상황을 쉽게 알 수 있다. 화상인식 음성인식 등이 입력에 해당하고, 자연언어처리 전문가시스템 지식표현은 내부적인 처리에 해당한다고 할 수 있다. 출력은 그 형태가 매우 다양하며, 출력이 없으면 어떤 시스템이든 무의미하다.
"인공지능은 탐색의 문제"
1950년대에 공식적으로 인공지능이라는 개념하에 연구가 시작되었고 그로부터 40년이 되어가지만 인공지능의 완성에는 아직 갈 길이 멀다는데 대부분의 사람이 의견을 같이한다.
인공지능 초기에는 많은 사람들이 매우 낙관적이었지만 지금은 상대적으로 비관적이다. 처음에 생각했던 만큼 문제가 쉽지 않았던 것이다. 그러나 그간 많은 경험이 축적되었고 문제에 대한 이해가 깊어진 만큼 그렇게 멀지않은 장래에 부분적이나마 인공지능 개인용 컴퓨터가 실용화된다고 봐도 될 것 같다.
지능은 처음부터 지식의 문제다. 지능의 정의는 사전에서 명시하듯이 쉽지않다. 흔한 사전적인 정의에 의하면 '한 객체가 그의 주변환경에 적응하는 능력'을 지능이라고 한다. 좀더 기술적인 의미로서 지능은 어떠한 상황이 제시하는 수많은 가능성 중에서 불필요한 경우를 제거할 수 있는 능력을 말한다.
인공지능에 많은 공헌을 한 맥커시는 "인공지능은 탐색의 문제"라고 한 바있다. 탐색과정에서 가능성있는 탐색경로를 찾는 것이 지능의 핵심이라고 볼 수 있는데, 이와 같은 관점은 최근의 생물학적 혹은 의학적 연구결과에서도 발견할 수 있다.
그렇다면 무엇이 효율적인 탐색을 가능하게 하는가. 탐색공간을 형성 하는 것, 그리고 탐색을 돕는 것 모두가 시스템이 가지고 있는 지식에 의해서 결정된다.
지식은 풀고자 하는 문제의 특성에 따라 여러가지로 표현된다. 주로 수학적 언어로 표현되는 것이 보통인데, 수식 행렬 그래프 논리언어 등이 사용될 수 있다.
일찍부터 심리학자와 철학자들은 인간의 지식은 기호(symbol)로 표현될 수 있다고 믿어 왔다. 심지어 사람의 뇌에서 기호에 입각한 연산이 이루어진다고 생각해왔다.
컴퓨터가 나타나고 얼마 되지 않은 1960년대에 리스프(LISP)언어가 MIT에서 만들어졌는데 결코 우연이 아니다. 리스프는 오늘날까지 인공지능언어로 많이 쓰일 만큼, 그 효용성이 뛰어난 기호처리언어다.
이어 1970년대 초에 논리컴퓨터 언어인 프롤로그(PROLOG)가 만들어졌다. 프롤로그 역시 기호처리를 위한 것이라고 할 수 있으나 처리과정이 리스프와 다르다.
프롤로그는 1차논리의 부분적 기능에 입각해서 처리하고, 리스프는 함수적인 관계에 의해서 심볼을 처리한다. 두 언어 모두 강한 수학적 이론을 바탕으로 하기 때문에 앞으로 계속해서 이용될 확률이 높다.
그러나 불행하게도 이러한 틀안에서 방대하고, 불안전하고 동적인 지식을 표현하고 이용하는 것은 쉽지 않다.
다시 주목받는 신경망이론
현실에 대한 어떠한 객체가 소유할 수 있는 지식은 매우 제한적이다. 따라서 지식은 불완전하고, 모순될 수 있으며, 모호하고, 변화한다.
물리 문제를 풀듯이 지식의 문제를 다룰 수는 없다. 최근까지 인공지능은 마치 수학이나 물리문제를 풀듯이 인간의 지식을 표현하고 처리하려고 했다. 수학이나 물리 문제의 특성은 비교적 잘 정돈된 세계에 대한 모델이며 주로 모순이 없는 관계를 다루고 정확하고 상대적으로 안정된 규칙들을 대상으로 한다. 이는 인간이 일상적으로 주변 환경으로 부터 관찰하는 세계와는 다른 것이다.
이러한 일반적인 지식 표현의 어려움이 오늘날 인공지능 연구가 직면한 가장 큰 문제라고 할 수 있다. 화상인식이나 음성인식도 일반적인 경험을 바탕으로 하기 때문에 그 성능은 지식표현의 효율에 의해 제한 된다.
일본이 1980년대에 의욕적으로 추진했던 제5세대 컴퓨터계획은 프롤로그를 주언어로 하는 인공지능컴퓨터를 목표했으나 위에서 지적한 점을 해결하지 못했다. 60,70년대 미국이 그랬듯이 문제를 너무 쉽게 생각했는지도 모른다.
80년대에는 신경망을 통한 계산 모델이 제시되기 시작했다. 신경망은 이미 오래전부터 연구되었던 것으로 새로운 것은 아니었다.
50여년전에 헤브에 의해서 학습알고리즘이 처음 발표되었다. 그러나 70년대초 민스키의 신경망에 대한 비관적 보고서에 의해 그 연구는 쇠퇴했다가 최근 심볼에 입각한 시도가 진전이 없자 다시 신경망에 관심을 가지게 된 것이다.
신경망은 사람의 뇌구조를 닮은 그래프의 연결선에 정보를 기록하는데, 여러가지 바람직한 특성을 가지고 있다. 무엇보다 학습이 가능하고, 연상적인 기억을 하며, 병렬계산 모델이라는 점이 장점이다.
그러나 아직까지는 매우 단순한 문제만을 풀 수 있을 뿐이고, 많은 양의 정보를 처리하는 것이 어려워 신경망으로 일반적인 지식을 처리하는 것은 현실성이 없다.
모호함을 이용하는 「퍼지이론」
퍼지논리도 60년대말 자데에 의해 집합이론의 연장선에서 만들어졌으나, 집합의 소속도를 나타내는 가중치 의미가 불확실하다는 점이 약점으로 미국학계에서는 거부반응을 보여왔다.
이 이론은 80년대말 일본에서 주로 제어분야에 응용되면서 각광받기 시작했다. 자연언어 개념의 모호성이나, 지식의 불확실성 등을 모델링 하기 위해 퍼지이론을 이용하는 경우가 점점 많아지고 있다.
인간 지식의 많은 부분은 단어로 색인되어 있다. 좀더 일반적으로 지식은 개념의 집합체로 정의된다. 단어와 개념은 매우 유기적으로 연관되어 있으며 따라서 언어와 지식은 매우 밀접한 관계임을 알 수 있다.
자연언어처리는 인공지능의 한 분야로 어느 분야 보다도 지식에 의존 한다. 과거에는 연역적인 언어 규칙과 단순한 구문이나 의미정보에 의한 언어처리밖에 할 수 없어 일반적인 시스템의 개발이 이루어지지 못했다. 정확한 자연언어처리는 대량의 지식베이스를 필요로 하지만, 이러한 지식베이스에 대한 연구가 미숙한 단계여서 실질적인 구현이 불가능했다.
자연언어처리 분야와 언어학은 80년대말부터 새로운 시도들이 제시되었다. 딱딱한 언어규칙이 아닌 부드러운 언어정보를 통하여 지능적인 분석을 도모하고자 하는 것이 특징이다.
이와 같이 지능의 핵심인 지식을 표현하고 처리하는데 기존의 수학문제를 푸는 것과 같은 연역적 방법에서 주변상황으로부터 경험을 직접 반영하는 귀납적 방법을 택하는 시도가 새로운 경향으로 나타나고 있다. 인공지능의 구체적인 분야를 좀 더 자세히 살펴보자.
■ 전문가 시스템
지식표현이 쟁점
인공지능 연구를 처음 시작했을 때부터 오늘날에 이르기까지, 가장 중요한 응용분야가 바로 전문가시스템이다.
전문가시스템은 사람의 전문적 지식을 가지고 있으며 전문성을 요구하는 작업에 이용될 수 있는 시스템을 말한다. 응용 분야는 매우 다양하고, 실제로 오늘날 많은 분야에서 비교적 성공적으로 사용되고 있다.
기술적으로 대부분의 전문가시스템은 규칙으로 지식을 표현해왔다. 그러나 이러한 방식은 상식과 같은 일반적인 지식 혹은 불확실하고 모호한 지식의 표현에 적합하지 않기 때문에 전문가시스템은 그 성능에 명확한 한계를 가지고 있다. 그럼에도 전문적인 분야에 어느 정도 성공을 거둔 것은 응용범위가 한정되어 문제가 비교적 정확히 기술될 수 있기 때문이었다.
그러나 모호한 지식을 포함하는 대용량의 지식을 기초로 하는 전문가시스템은 규칙만을 이용해서 구축하기가 쉽지 않다. 이러한 규칙의 단점을 보완하기 위해서 여러가지 변형이 연구되어 왔다. 헤크만은 규칙이 아닌 확률적인 전문지식 표현 모델인 유사망(similarity net)으로 전산분야의 최고상인 1990년 ACM 박사논문대상을 받았다. 이는 그만큼 전문가시스템에서 지식표현이 중요한 문제임을 알려준다.
앞으로 전문가시스템은 그 표현 방법이 무엇이든지 확률정보를 포함해야 할 것이다. 이유는 다음과 같다. 풀고자 하는 문제가 커지고 다루는 지식의 양이 방대해지면 모든 상황을 정확히 기술하기란 거의 불가능해진다. 또한 입력정보도 완전한 설명이라기 보다는 불완전한 것일 수 있다. 이러한 점에 비추어 경험적 지식에 의한 수학적 판단을 하는 것이 최선이라고 보기 때문이다.
■ 자연언어처리
기계번역 철자교정에 응용
자연언어처리는 사람이 사용하는 언어를 기계가 이해하게 함으로써 고급 응용분야에 이용하고자 하는데 그 목적이 있다. 구체적으로 자연언어 인터페이스, 기계번역, 정보검색, 철자교정 등이 대표적인 응용 분야다.
연구 초기에는 언어학 이론의 구현을 위해 많은 노력을 했으나 대부분의 이론이 현실성 결여로 커다란 진전은 없었다. 언어학의 많은 이론들은 국부적인 현상에 치우쳐 있고 몇개의 원칙으로 언어현상을 전부 설명하려고 하는데 문제가 있다.
직관적인 언어 이론에 위배되는 언어현상이 발생하면 예외로 규정하는데, 문제는 예외가 너무 흔하다는 점이다. 언어는 이론에 의해서가 아니라 현상으로서 이해해야 한다는 생각이 이제는 새로운 방향으로 정착되고 있다.
따라서 책상에 앉아 언어를 연구하기 보다는 실제 언어 사용용례를 구하고 컴퓨터로 분석해서 귀납적 언어정보를 얻어낸다. 이러한 정보는 언어모델(문법 사전)을 만들거나 언어분석기에서 직접 사용된다.
언어학적인 진전과 더불어 지식표현기술과 추론기술의 발전이 이루어져야 성공적인 자연언어처리를 기대 할 수 있다.
■ 인식 시스템
펜컴퓨터의 전제조건
화상이나 음성정보처리는 매우 실질적이고 다양한 응용분야를 가지고 있다. 자동응답시스템 전자펜 문서인식 신원확인 멀티미디어 등이 그 예다. 지금까지 아날로그 정보처리에 어느 정도의 발전이 있어왔는데 앞으로는 고차원 정보를 이용하여 효율성과 정확성을 높이는 문제가 남아 있다.
고차원 정보란 상식이나 전문적 지식 혹은 언어적 정보, 인지모델 등을 말하는데, 아직 방법론이 정립되지 않은 데다 많은 계산을 요구하기 때문에 정보의 질을 높이는데 어려움이 있다. 지식표현의 발전에 따라 인식시스템은 새로운 차원으로 향상될 것이다.
■ 지식표현
5가지 표현방법
지식표현은 그 자체가 응용은 아니지만 많은 응용의 핵심이 되는 개념이다. 일반적인 지식표현을 위한 방법에는 △ 의미망(semantic net) △ 규칙 △ 1차논리 △ 그래프 △ 신경망 등 크게 5가지로 대별한다.
각각 커다란 연구방향으로서 다양한 연구집단에 의해 연구되고 있다. 그러나 앞으로는 이러한 분야들이 경쟁하기 보다는 서로 보완하는 형태가 될 것이다.
논리적 언어로 표현해서 풀어야 할 문제가 있고 확률적 그래프로 풀어야 할 문제, 그리고 신경망으로 풀어야 최적의 결과를 기대할 수 있는 문제들이 있기 때문이다. 또한 지식 표현은 언어적 의미도 포함하는 것이 되어야 실질적인 형태로 발전할 것이다.
논리학자들 사이에서 이미 이와 비슷한 공감대가 형성되고 있다. 일본이 제5세대 컴퓨터에 이어 90년대 대규모 연구과제(RWC)를 추진하고 있는데 여기서 핵심 주제가 '지식표현의 이중성'이다.
딱딱하고 깨지기 쉬운 추론이 아닌 유연성이 있는 추론 모델의 개발과 문제의 특성에 맞는 지식의 표현과 처리를 하는 것을 추구하고 있다. 즉 연역적 추론을 위해서 논리 언어를 이용하고 직관적 감각적 지식을 처리하기 위해서 퍼지나 신경망을 이용한다는 것이다.
병목현상, 해소될 것인가?
현단계에서 만족할 만한 인공지능의 개발을 기대하기는 힘들다.
장애물이 되는 문제중 하나가 지식표현과 지식에 행해지는 추론의 비현실성이다. 이 문제는 여러 인공 지능 분야에서 병목현상으로 나타나고 있으며, 90년대 들어 예전에 고려하지 않았던 방법들을 다시 찾아 연구하는 등 새로운 연구 분위기가 형성되었는데, 이들은 공통적으로 실험적 귀납적 확률적 요소를 표방하고 있다. 앞으로 얼마간 서로 다른 방법론간에 경쟁이 있을 것이며 어느 단계에 이르면 통합하여 인류가 오랜 세월동안 그려온 기계적 지능의 1차적 실현을 가져올 것이라고 기대된다.
구체적으로 10~20년후에 개인용 컴퓨터는 입력기로서 키보드외에도 전자펜 화상인식 음성인식 그리고 각종 센서를 갖추고 있을 것이다.
방대한 양의 지식과 언어이해 능력이 가능해서 자연언어로 대화할 수 있고 사용자의 감정상태까지 파악할 수 있을 것이다. 손짓 몸짓도 입력 정보가 될 것이다. 또 TV와 오디오, 비디오 등이 컴퓨터내에서 자연스럽게 작동되고 정보의 교환도 이루어질 것이다. 편집기는 철자교정, 문법 및 스타일교정 외에도 SGML과 같은 표준문서작성을 도와줄 것이다. 정보검색시스템 번역시스템 하이퍼텍스트 등이 편집기에서 조작이 가능해 문서작성에 최상의 조건을 제공할 것이다.
이 모든 것이 조금은 과장되어 보일지 모르지만 그렇지 않다. 컴퓨터의 발전은 인간 상상력의 한계에 의해서만 제한될 것이다.