인간이 사물을 인식하는 제일 중요한 감각기관은 눈이다. 컴퓨터에 인간의 '눈'을 이식하는 비젼연구는 어디까지 진전되었을까.
요즈음 웬만큼 이름있는 박람회에는 빠짐없이 등장하는 인기인(?)이 있다. 그는 로보트다. 피아노를 연주하는 로보트, 커피를 얌전하게 따르는 로보트가 있는가 하면, 사람이 말로 간단한 명령에 따라 움직이는 로보트, 장애물을 피해 짐을 나르는 로보트도 있다. 로보트에 눈과 귀가 붙은 것이다.
현대 문명의 총아인 컴퓨터는 초기에는 주로 빠르고 정확한 수치계산을 하는데 목적이 있었으나 점차 그 기능이 확대되어 인간이 영위하는 복잡한 지적활동이나 뛰어난 지각능력을 컴퓨터에 부여하려는 노력으로 발전하였다. 꿈의 컴퓨터라 불리는 제5세대 컴퓨터가 지향하는 기능이 이와 같은 지각능력과 사고 판단 추리능력의 추가다.
비젼은 종합예술
컴퓨터 비젼은 한마디로 컴퓨터가 외부의 씬(Scene: 적절한 용어가 정해질 때까지 이렇게 부르기로 한다.)을 직접 보아 그것을 이해할 수 있게 하는 종합된 기술을 이른다. 즉 사람이 눈을 통해 외부정보를 얻는 시각기능을 컴퓨터에 대행시키는 연구라 볼 수 있다. 사람이 어떤 물체를 보고 인식하는 과정을 관찰하면 망막에 비치는 상 전체를 골고루 보는 것이 아니라, 특정 부분을 집중적으로 보아 자신이 필요로 하는 정보를 얻어낸다. 이 과정에서 사람은 과거의 경험과 다양한 사전지식을 이용하게 되는데 이런 사전지식과 판단능력을 컴퓨터에 주어야 만족한 결과를 얻을 수 있으므로 비젼을 인공지능의 한 분야로 다루게 된다.
비젼에 관한 연구는 크게 두 분야로 나눌 수 있다. 하나는 인간이 시각정보처리 메카니즘을 밝히기 위한 신경생리학적 측면에서의 연구이고 다른 하나는 컴퓨터를 이용하는 독자적인 영상정보처리 기술의 연구이다. 그 성능에서 인간의 시각정보처리 능력에 까마득히 못 미치는 컴퓨터 비젼의 경우, 전자의 연구에 의해 밝혀지는 눈과 두뇌에서의 정보처리 기능을 컴퓨터 알고리즘화시켜 실제로 적용하는 것이 가장 이상적이다.
그러나 인간의 시각정보처리의 메카니즘은 아직 만족할 만큼 밝혀지지 않는 것이 현실이며 이를 언제까지나 기다릴 수 만도 없는 노릇이다. 그래서 일부 학자들은 컴퓨터 비젼이 성공하면, 역으로 그와 유사한 처리가 인간의 시각에서도 이루어지고 있다는 가설을 세울 수 있으며 신경생리학이나 심리학의 발전에도 공헌할 수 있다고 믿고 있다.
여기서는 주로 후자의 입장인 컴퓨터비젼에 관해서만 거론하기로 하고, 그의 응용과 미래에 대해서도 언급한다.
컴퓨터 비젼에 필요한 사항이 무엇인지 우선 살펴 보기로 한다.
첫째 외계의 시각정보를 컴퓨터에 입력하는 과정이 필요하다. 압력되는 정보는 필요에 따라 흑백으로만 구성된 이치화상(글자패턴의 경우), 명암을 가지는 흑백화상, 색채화상 또는 거리정보가 될 수 있다.
둘째 입력된 정보로부터 특징적인 요소를 찾아내는 능력을 필요로 한다. 특징요소는 경우에 따라서 밝기가 급히 변하는 점, 밝기가 일정한 영역 또는 검은 점 등 여러가지가 될 수 있다.
셋째 특징요소를 사용하여 씬을 기술하는 능력이 필요하다. 예를 들면 밝기가 급변하는 점을 연결하여 윤곽선을 구하거나 밝기가 같은 영역의 모양이나 영역상호간의 관계 등을 기술할 수 있어야 한다.
끝으로 목적에 따라 씬을 해석할 수 있어야 한다. 즉 어떤 물체가 어디에 있으며 딴 물체와 어떠한 관계에 있는가를 알고, 필요하다면 감추어진 부분을 추정하거나 씬 전체의 의미를 유추할 수 있어야 한다.
미국의 MIT를 중심으로 1960년대 초에 시작된 컴퓨터에 의한 영상처리연구는 1960년대 후기에 이르러 인공지능의 개념 확립과 더불어 본격적인 컴퓨터 비젼연구로 확산되었다.
우리들의 눈을 통해 지각되는 대상은 글자나 풍경, 사람의 얼굴, X선 사진, 현미경 사진, 인공위성으로 부터 수신한 화상 등 실로 다양하다. 글자나 음성 또는 영상의 인식을 주로 다루는 패턴인식기술, 외부 풍경이나 관측된 화상의 강조, 복원하거나 계측 또는 생성하는 영상처리기술, 화상 중에서도 주로 인공위성 사진이나 항공사진을 주 연구 대상으로 하는 리모트센싱(remote sensing : 원격탐사) 기술 등은 컴퓨터 비젼과 밀접한 관련을 가지고 있다.
컴퓨터 비젼의 초기 연구는 벽돌쌓기 놀이에서 보는 것과 같은 간단한 다면체를 대상으로 물체의 윤곽선이나면, 영역 등을 찾아내는 일부터 시작되었다. 두 눈으로 관측한 화면을 이용한 입체영상의 표현이나, 물체의 원근을 판단하는 거리측정기(range finder), 혼합된 무늬패턴에서의 서로 다른 무늬를 찾아내는 무늬(texture) 해석(그림1 참조), 색채나 그림자의 처리, 물체를 기술하고 인식하기 위한 영역해석의 연구 등이 컴퓨터 비젼의 핵심적인 기술들이다.
위와 같은 기술을 바탕으로 한 대표적인 컴퓨터비젼의 이용에 관해 살펴보기로 한다.
제품검사에서 의료분야까지
랜새트(LANDSAT)와 같이 지구탐사 인공위성으로 부터 수신한 멀티스펙트럼 데이타를 처리하는 리모트센싱기술은 자원탐사, 해양오염감시, 농작물이나 임업자원 등의 조사 및 군사목적으로 널리 이용되고 있다. 이 기술로 인해 국토가 넓은 나라의 곡물생산량이나 각종 대형사고 등의 실상을 외국에서 더 정확하게 파악하는 일이 가능히게 되었다.
현재의 리모트센싱 기술은 파란 잔디위에 놓여진 골프공의 유무를 판별할 정도의 정밀도를 가지는 것으로 알려지고 있으나, 그 실상을 확인하기는 어렵다. 멀티스펙트럼데이타를 사용해 합성한 사진의 예가(사진1)이다.
컴퓨터 비젼 응용의 꽃(?)은 역시 로보트라 볼 수 있다. 초창기의 컴퓨터 비젼 연구자체가 로보트에 눈을 붙일 목적으로 시작된 지능로보트 연구 프로젝트에 그 뿌리를 가지고 있는 점을 보아도 그렇다. 자신에 주어진 일만 묵묵히 행하는 눈 감은 로보트도 아름답지만(성실한(?) 근로자상), 변화하는 주위 환경에 맞추어 자신의 행동을 바꿀 수 있는 눈 뜬 로보트(창의적인(?) 근로자상)도 대견스럽다. 그 우직한 손으로 달걀을 집어 깨지 않고 다른 장소에 옮겨놓는 작업이나 복잡하게 배치된 공장의 기계사이를 딴 기계와 충돌없이 누비며 지정된 물품을 지정된 장소로 운반하는 로보트 등은 '눈'에 들어오는 시각정보를 처리함으로써 다음 동작을 결정하고 있는 예라 할 수 있다.
각종 제품의 검사단계에서의 컴퓨터 비젼의 도입은 대표적인 실용화 예 중의 하나다. 복잡한 패턴을 가지는 프린트기판에서의 연결결함 등의 검사를 컴퓨터가 대행하는 시스템이 실용화되어 있다. (사진2)는 검은 사각형내에 결함이 있음을 컴퓨터가 보여 주는 예이다. (사진3)은 기계부품이 합격품인지를 세밀히 검사하는 시스템에서의 표시화면을 보여 주고 있는데 컴퓨터를 이용하는 생산(CAM)의 좋은 실례이다.
컴퓨터 비젼 기술이 가장 적극적이고 대대적으로 도입되어 이용되는 분야가 의료기기(의용전자)쪽이다. 그 중에서도 가장 대표적인 예가 컴퓨터단층촬영장치(CT ; computed tomography)이다. X선이나 초음파를 이용해서 얻은 관측데이타로 부터 단층영상을 합성해서 표시해 주는 이 장치가 의료계에 미친 영향은 실로 막대하다. 노벨의학 생리학상이 CT의 발명자에게 주어진 것만으로도 이를 짐작할 수 있다. CT촬영예가 (사진4)이다. 그림의 우하부의 흰 원 부분이 뇌종양을 표시하고 있다.
이외에도 의료분야에서는 현미경 사진을 이용한 염색체의 자동분류나 백혈구의 자동분류, 암세포의 자동진단, X선사진 등의 자동 분석장치 등 컴퓨터 비젼이 널리 실용화되어 있다.
인간능력과는 무엇이 다른가
현재 여러 분야에서 제한된 용어로의 컴퓨터 비젼의 실용화가 이루어지고 있다고는 하나 그 기술 수준은 인간이 지니는 영상처리능력에는 비교될 수 없을 정도로 낮은 수준에 머물러 있다.
컴퓨터에의 효과적인 영상입력수단, 효율적인 씬의 표현방법, 방대한 계산량 등 해결해야 할 과제들이 많이 남아 있다. 그러나 제5세대 컴퓨터로 대표되는 고도의 추리능력, 연상능력과 병렬처리 등을 포함하는 강력한 계산능력을 가진 하드웨어를 갖춘 컴퓨터가 실현되고 여러 방면의 꾸준한 기초 연구가 지속된다면 어느 정도로 제한된 응용 분야에서의 실용화는 의외로 빨리 우리들 앞에 다가올 지도 모른다.
다만 효과적인 컴퓨터 비젼 시스템이 등장했을 때, 사람이 보아도 애매한 그림(그림2,3)을 과연 컴퓨터가 어떻게 판정할것인가 매우 흥미있는 일이다. 그 시스템의 과거 경험이 서로 달라 (그림2)의 경우 오리와 토끼로 서로 다르게 판정할지도 모르며, (그림3)의 경우도 소녀와 노파로 의견이 엇갈릴지도 모른다.
또한 (그림4)에서의 예처럼 실제로 있을 수 없는 물체를 정확하게 인식할 수 있는 능력이 없을지도 모른다.
끝으로 세계적인 걸작품인 이조백자를 예로 들어보자. 백자의 무늬 중 윗 부분의 달이 바로 아래의 하늘보다 밝게 빛나고 있으나 실은 하늘보다 어두운 색이다. 사람 시각의 특성을 잘 이용한 예술의 진수인 것이다. 만일 이와 같은 화상을 컴퓨터 처리하여 달은 하늘보다 어둡다는 결론을 냈을 때 이미 거기에는 예술은 없고 기계적인 싸늘함만이 남을 것이다. 이는 곧 컴퓨터 비젼이 지향해야 할 방향과 그 응용범위를 스스로 암시하고 있다 할 것이다.