기계번역시스템의 최종 목표는 자동통역이다. 외국어를 배우지 않아도 외국인과 의사소통을 기계가 중간에서 맡아준다면 얼마나 좋을까? 현재 어휘구사가 다양하지 않은 전문서적을 번역하는 영한(英韓) 일한(日韓) 기계번역시스템이 상품화단계에 있다.
기계번역이란 컴퓨터에 의해 하나의 자연어가 또 다른 자연어로 번역되는 것을 뜻한다. 여러분도 3~4만원의 돈만 있으면 적어도 5천개의 단어를 다른 언어로 바꿀 수 있는 수첩크기의 컴퓨터를 구입할 수 있을 것이다. 또한 1백만원 가량 돈을 들이면 주어-동사-목적어 순서의 간단한 문장을 번역할 수 있는 PC급 기계번역시스템을 구입할 수 있을 것이다.
예를 들어
The dog eats an apple.
과 같은 영어문장을 다음의 불어 문장으로 번역할 수 있다.
Le chien mange une pomme.
이것은 영어의 각 단어에 해당하는 불어 단어를 찾아 하나씩 늘어놓은 것으로 충분하다. 그러나 위의 영어 문장을 한국어로 번역하면
그 개가 사과를 먹는다.
로 되어 각각의 단어만을 바꾸어서는 번역이 제대로 되지 않는다는 것을 알 수 있다. 그래서 일반적으로 기계번역은 (그림1)에서 보듯이 네가지 수준에서 분석과 변환이 이루어진다.
여기서 독자의 이해를 돕기 위해 번역대상언어를 영어라 하고 번역된 언어를 한국어라 가정하자.
형태소 분석 : 번역대상 단어의 가장 기본적인 구성요소를 밝혀내는 과정이다. 즉 영어의 eats란 동사는 삼인칭 단수에 사용되는 것으로 어근(eat), 어미(-s)등을 밝히는 것이 한 예가 된다.
구문 분석 : 하나의 문장을 품사로 나누고 그 품사들 사이의 관계를 밝히는 과정이다. 즉 위의 영어 문장에서 주어는 The라는 정관사와 dog라는 명사에 의해 이루어진 명사이고 동사 eats 그리고 목적어는 an이라는 부정관사와 apple이라는 명사에 의해 구성되어진다는 것을 분석하는 것이며, 이 문장의 경우는 하나의 문장을 이루기 위해 주어-동사-목적어의 형태를 가진다는 점을 밝힌다.
의미 분석 : 문장 전체의 뜻으로 보아 여러가지 가능한 의미해석 중에 가장 알맞는 것을 고르는 과정일 뿐 아니라 의미적으로 적당한 문장인지를 가려내는 과정이다. 이 과정을 제대로 하면 직역이 아닌 자연스러운 번역이 될 수 있다.
중간 언어 : 번역대상문의 언어에 의존하지 않는 보편적인 의미 표현언어를 뜻한다. 중간언어와 함께 언어 간의 해석과 생성 프로그램을 준비해 두면 다국어 간의 번역이 가능하다.
따라서 개별적인 언어간 번역프로그램을 작성할 필요가 없다.
기계번역 전후 인간이 편집해야
대부분의 기계번역시스템은 형태소 구문 의미분석을 하고 있으며 그에 해당하는 번역문을 생성해내고 있다. 이를 위해 일반적으로 사전 문법 등의 방대한 데이터베이스가 필요하게 된다.
기계번역시스템의 성공여부는 번역대상문의 성격에 좌우된다. 그 예로서 교육자료, 기술적인 안내문, 행정보고서, 생산 매뉴얼 등과 같이 직설적이고 사실적이며 제한된 영역의 문장들은 잘 번역해낼 수 있다.
기계번역시스템은 50년대 중반 미국 정부의 지원을 받은 여러 곳에서 시작됐다. 그중 워싱턴의 조지아타운대학은 시스트란(Systran)이라는 시스템을 개발했으며, 그것은 영어와 스페인어간 기계번역의 기초가 되기도 했다. 또한 유타에 있는 브리햄 영대학에서는 몰몬경을 세계 각국의 언어로 번역하려고 하였으나 기계번역이 이러한 목적에 사용되기는 힘들다는 것을 깨달았다. 그러나 이러한 시도들은 후에 나온 많은 기계번역시스템에 커다란 영향을 미쳤다. 현재까지 나온 시스템들이 실제 시장에서 빛을 보지 못했지만 가까운 장래에 시장이 급성장될 것이라는 기대를 불러일으켰다.
기계번역의 이점은 첫째 하루에 해낼 수 있는 번역량이 많아진다는 것이다. 선편집 및 후편집을 고려하더라도 번역 그 자체에 소비되는 많은 시간을 절약할 수 있다. 그러나 번역에 필요한 컴퓨터 하드웨어와 소프트웨어의 가격이 인간이 번역하는데 드는 비용보다 비싼지 어떤지는 별개의 문제다.
둘째 번역의 질을 높일 수 있다. 사람이 번역할 할 경우 하나의 전문 단어도 같은 뜻을 가진 여러가지의 단어로 뒤섞어 씀으로서 일관성을 잃거나, 문체도 여러가지로 쓸 수 있다.
「애매함」처리가 관건
기계번역 시스템이 여러가지 편리한 점을 갖고 있음에도 불구하고 이것이 실용화되기 위해서는 이에 못지않게 기술적 또는 사회적 장애물들이 버티고 있다. 첫째 전문번역사들의 반발이다. 번역문을 손으로 쓰거나 혹은 타이핑하는 방법을 아직도 사용하고 있는 많은 전문번역사들은 기계번역기가 자신들의 직업을 빼앗는다고 생각한다. 그러나 전문번역사들은 기계번역에 의해 나온 문장을 후편집하는 작업을 맡음으로써 자신들의 생산성 향상을 꾀할 수 있을 것이다. 그러나 기계번역에서 나온 문장들의 질이 나쁘다면 당연히 전문번역사의 외면을 받을 것이다.
둘째 기계번역을 하려면 번역대상문이 컴퓨터에 수록되어야 한다. 그러나 대부분의 번역하고자 하는 글들은 종이 위에 쓰여져 있다. 물론 문자인식 시스템의 도움을 받을 수 있으나 사용자가 쉽게 사용할 수 있는 시스템은 아직 등장하지 않고 있다.
셋째 기계번역의 질이 아직도 사용자의 요구에 적합할 정도가 아니라는 것이다. 현재까지 나온 대부분의 기계번역기가 문장단위로 번역되기 때문에 애매한 문제를 해결하는 데는 많은 문제점을 내포하고 있다. 그래서 앞으로 기계번역 분야에서의 기술적인 노력은 번역의 질을 높이는데 기울어질 것이다.