d라이브러리









컴퓨터시대의 한글 한글의 과학성 재조명되다

컴퓨터를 위하여 한글이 어떻게 연구되고 활용돼야 하는가도 중요하지만, 컴퓨터를 도구로 한글을 연구하는 풍토가 조성돼야 한다.

컴퓨터라는 지극히 과학적이고 합리적인 기계는 이제 우리 주변에 널리 활용되어지고 있다. 간단하게는 전화요금과 수도요금의 명세서에서 부터 알지도 못하는 회사에서 정중하게 카탈로그를 자기 이름으로 배달하게 한다.

앞의 것은 수많은 자료들을 더하기 빼기를 하여서 계산하고 그 계산된 결과를 인쇄하여 알게하는 것이고, 뒤에 언급된 것은 어딘가에 있는 그 사람의 주소를 컴퓨터에서 선택하여 그 사람이 필요로 하는 혹은 필요로 할지도 모를 자료를 미리 송부하여 도움을 주는 우편연락 방식의 일환이다.

이러한 모든 우리 주변의 컴퓨터 활용은 우리가 쓰는 '한글'이라는 글자를 자유자재로 구사하고 있기에 가능한 것이다. 아무리 빠르고 뛰어난 성능을 갖고 있는 컴퓨터이더라도 우리의 '말'과 '글'을 쓰지 못한다면 가능하지 않은 분야임에 틀림없다.

아득한 옛날 우리 한반도에 조상들이 살기 시작하면서 부터 '우리말'은 있어 왔겠지만, 이러한 우리말을 기록할 수 있게 하는 '우리글'이 만들어진 것은 그렇게 오래된 일이 아니다. 물론 중국의 영향을 받은 우리의 조상들은 초기에는 한자를 가지고 우리말을 기록하였다. 비록 '이두문자'라는 것을 쓰기는 하였지만 진정한 우리말을 기록할 수 있는 우리글이 만들어진 것은 이씨조선 4대왕인 세종대왕 28년의 일이다. 이때가 단군께서 이 나라를 이룩하신지 3천7백79년째 되던 해이며 지금부터 5백41년 전이 되겠고 서기 1446년이 된다.

처음 반포된 한글은 음성기관의 모양과 그 움직임이 형태를 본뜬 자음 17자와 하늘 땅 사람을 중심으로 모양을 배치했다는 모음 11자가 기본이었으며 도합 28개의 문자를 창제하였다.
자음과모음

현재는 자음 중에서 ㅇ ㅎ △과 모음중에서 ㆍ를 쓰지않게 되어 24자의 한글만 갖게 되었고 이러한 자음과 모음의 조합으로 우리말을 기록한다.

컴퓨터가 이땅에 들어와서 표음문자 즉 소리글자인 알파벳을 바탕으로 구성된 것을 한글표현으로 가능하게 하기위하여 여러 과학자와 한글학자들의 노력이 있었다. 이러한 것들이 밑바탕이 되어 요즈음과 같은 컴퓨터 문명을 우리 주변에 보게된다.

여기서는 이땅에 컴퓨터 이전부터 있어왔던 한글 타자기 등에 의한 한글 기계화의 '한글 자음과 모음 이야기'와 한글처리가 자유자재로 가능한 컴퓨터로서, 한글을 연구하는 분야중 한가지인 '한글의 역순 이야기'를 중심으로 알아보자.

한글은 매우 과학적이기는 하나…

한글은 14개의 자음과 10개의 모음에 의한 '소리글', 즉 표음문자로 구성된다고 말해진다. 어릴 때부터 귀가 아프게 들어온 한글 24자모의 조합은 영어가 갖는 26글자 보다도 자모의 수자가 적다. 그래서 세계의 으뜸가는 글자로 널리 자랑된다. 뿐만아니라 다른 글자들보다 많은 모음을 가진 풍부한 소리의 표현력을 드높이 평가 받는다.

그러나 한편 생각하면 우리 선조들은 한굴의 창제에서 너무나 과학적인 만족에 도취된 것 같은 느낌이 없지않다. 특히 우리의 한글을 기계어로 옮길때는24개의 자음과 모음은 결코 단순하게 생각되어 질 수만은 없다. 한글24자를 기계화, 특히 컴퓨터와 연결하여 사용되어지는 단말기(CRT Terminal, Key Bo-ard, Printer)에서 생각해보면 다음의 것들을 고려해야 한다.

첫째는 실제 기계 혹은 컴퓨터가 갖고 있어야 될 자음과 모음이 차지할 위치와그에 따른 글자의 모양이다. 이 두가지 점을 중심으로하여 여러가지 분석을 해볼수 있다.

(표1)에서 볼 수 있는 바와같이 엄밀한 의미에서 한글은 자음 30자와 모음21자의 51자로 구성되어 있는 것으로 보고 한글 기계화를접근해야 된다.
(표1) 한글의 자음과 모음의 분류

물론 이중에는 아주 드물게 쓰이는 글자가 없는 것은 아니지만, 어쨌든 여러가지 고려해야될 사항이 많이 생기는 것은 어찌 할 수 없다.
한글은 어디까지나 소리글자 (표음문자)의 모든 특성을 갖고 있으면서 그림글자(표의문자)의 형태로 구성되어 있다는 점이다. 이러한 연유는 우리 나름대로의 가장 과학적이고 체계적인 한글을 창제하기는 했지만 한자에 젖어온 타성에서 출발한 때문인 것 같기도 하다. 이러한 소리글자이면서 그림글자 형태를 갖는 점이 한글의 기계화 내지는 컴퓨터 활용화에 매우 큰 부담을 주고있는 어려운 점이다.

영어 26자와 한글 1만2천여자의 차이
 

한글 글자에서 자음과 자음의 조합, 모음과 모음의 조합에서 얻어지는 글자수가 다양화된 것과 마찬가지로 자음과 모음의 조합에서 오는, 즉 하나의 글자를 구성할때도 여러가지 고려해야될 사항이 있다. 자음과 모음의 '위치선정'에 관한 문제점이 한글의 기계화에는 크게 중요성을 갖는다.
 

자음의 초성에 들어가는 것과 종성(받침)에 들어 가는 것을 구별해야 하고 모음은 가로모음과 세로모음을 따로 구별하여 생각해야된다. 여기서 초성 중성 그리고 종성에 올 수 있는 자음과 모음의 종류를 보면 다음과 같다.
 

초성:ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎㄲㄸㅃㅆㅉ(19자)

중성:ㅏㅑㅓㅕㅗㅛㅜㅠㅡㅣㅐㅒㅔㅖㅘㅙㅚㅝㅞㅟㅢ(21자)

 

종성:ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎㄲㄸㅃㅆㅉㄳㄵㄶㄺㄻㄽㄾㄿㅀㅄ(30자)
 

또한 한글의 조합은 초성+중성(자음+모음), 초성+중성+종성(자음+모음+자음)의조합에 의하여 글자가 구성되어지기 때문에 이론적으로 말하면 1만1천9백70자(19×21×30) 의 가능한 글자가 존재하는 셈이지만, 현재 우리의 쓰는 한글 글자는 대략 1천3백~1천4백 글자에 지나지 않는다. 이것은 여러가지의 한글 빈도수 조사표에서 나타나고 한글을 컴퓨터화할 때도 이러한 것들이 중요한 참고사항이 돼왔다.

또한 한글 글자 구성은 다음과 같은 자음과 모음이 조합되어 이루어진다.

 

한글 글자 구성


위에서 보는바와 같이 한글로 자음과 모음의 형태는 그것이 놓이는 위치에 따라 제각기 크기가 다를뿐아니라, 서로의 조합에 의해서도 역시 상대적인 크기와 모양까지도 변화를 가져와야 한다.
 

여기서 말하는 한글 글자의 아름다움(?)이란 표현보다 오히려 눈에 익혀있고,어릴 때부터 배워온 버릇을 위한 것에 불과하다. 이것이야말로 한글의 기계화를 위한 가장 고통스러운 부분이다. 똑같은 초성자음이지만 뒤에 세로모음인가 가로모음인가에 따라 크기와모양이 달라지고, 모음뒤에 종성자음이 있는가 없는가에 따라서 또한 달라진다.즉 한글자음과 모음이 크기 및 모양의 선정은 하나의 글자를 위해서 필요한 모든것을 알았을때 비로소 정해줄 수 있다.

 

입력과 출력의 변증법
 

한글 기계화 및 컴퓨터화의 기초가 되었던 입력장치(Input Device)의 글자판(Key Board)은 그동안 한글 타자기의 보급과 더불어 계속 문제점을 던져주고 있다. 일부에서는 텔레타이프 등의 전신전송용으로 두벌식을 사용하고 있을뿐 아니라 세벌식 속도타자기, 네벌식 표준타자기, 그리고 다섯벌식 체제타자기 등이 있다. 그리고 입력은 두벌식인데 출력은 일곱벌식 되는 전자타자기도 보급되기 시작했다.

한글의 컴퓨터화의 기초가 되는 기계화 에서는 입력방식의 기초를 위하여 다음과 같이 분류해야 한다. (그림1,2,3 참조)

 

세벌식

초성과 종성(받침)에서 자음을 각각 한가지 종류씩 쓰고 중성모음은 종류에 관계없이 한가지를 사용하게 하여 한글의 자모를 세가지 종류로 나타내게 한다.

초성자음:ㄱㄴㄷㄹㅁ……예) 가

중성모음:ㅏㅑㅓㅕ…… 예) 가

종성자음:ㄱㄴㄷㄹㅁ……예) 각

 

(그림1) 세벌식 타자기의 보기


네벌식

초성과 종성에서 자음을 각각 다른 종류를 쓰고 중성모음을 긴모음과 짧은 모음으로 각각 다른 종류를 갖게하여 도합 네가지의 한글 자모를 나타내게 한다.

초성자음:ㄱㄴㄷㄹㅁ…… 예) 가

중성긴모음:ㅏㅑㅓㅕ…… 예) 가

중성짧은모음:ㅏㅑㅓㅕ……예) 각

종성자음:ㄱㄴㄷㄹㅁ…… 예) 각

 

(그림2) 네벌식 타자기의 보기


다섯벌식

초성에서 옆자음과 윗자음을 각각 구별하고 중성에서 긴모음과 짧은 모음을 구별해 주고 종성자음을 별도로 갖추게 되면 다섯가지 종류의 한글 자모를 준비하게 된다.

초성옆자음:ㄱㄴㄷㄹㅁ…… 예) 가

초성윗자음:ㄱㄴㄷㄹㅁ…… 예) 고

중성긴모음:ㅏㅑㅓㅕ…… 예) 가

중성짧은모음:ㅏㅑㅓㅕ…… 예) 각

종성자음:ㄱㄴㄷㄹ…… 예) 각
 

(그림3) 다섯벌식타자기의 보기


한글의 자음과 모음은 놓여지는 위치에 따라 자모의 형태나 크기가 상대적으로 달라질때 아름답게 보이게된다.또한 우리들 눈에 익어온 글씨와 비숫하게 하기 위해서는 여러가지의 자음과 모음을 갖추는 것이 필요하다. 그래서 당연히 세벌식 보다는 네벌식 글씨가 아름답게 보이고, 그것보다 다섯벌식이 더 눈에 익은 글씨와 비슷하게 보인다.
 

한글의 자모와 수자가 많아지면 그만큼 입력하는 문자판의 가지수가 많아지니까 입력속도가 늦어지게 된다.
 

한사람이 빠르게 한글을 입력하는 것보다는 많은 사람이 읽을 때 느끼는 부자연스러움이 문제라고 생각하는 사람들이있다. 또한 모든 사람이 빠르게 한글입력을 시킬수 있게하여 급속한 세계의 문명을 흡수해야 된다고 주장하는 사람들도 있다. 할수만 있다면 모든 사람이 빠르게 한글을 입력시키고 읽는데서 조금도 부자연스러움을 느끼지 않는다면 그야말로 훌륭한 한글 기계화의 해결방법이다.
 

이렇게 하는데 컴퓨터-여기서는 엄밀한 의미에서 마이크로프로세서(Microprocessor)-의 힘을 빌려서 컴퓨터 스스로 한글의 자음과 모음의 형태, 크기, 위치를 과학적이고 합리적으로 분석 판단하게 하여 아름다운 한글을 기계화시킨 것이 전자타자기이다. 결국 전자타자기에서는 ㄱ을 치면 바로 ㄱ이 출력되는 것이 아니라 다음 모음이 ㅏ 인가 ㅗ 인가에 따라 글자가 찍혀나온다.
 

요즘의 한글화된 컴퓨터에서는 ㄱ을 치면 일단 가의 ㄱ이 나타났다가 다음모음이 ㅗ 이면 가의 ㄱ이 고의 ㄱ으로 바뀐다.
 

이밖에 이제까지 많이 논의돼왔던 컴퓨터의 한글 체계에서 조합형이냐 완성형이냐는 문제는 이와는 별도로 컴퓨터내에서 '가'라는 하나의 완성된 유니트로 보관할 것이냐 아니면 ㄱ과 ㅏ로 분리해 보관할 것이냐는 문제이다. 이문제도 한글의 특수성에서 연유하는 것이지만 여기서는 지면성 논의하지 않겠다.

 

(그림4) 전자타자기의 보기


역순사전의 의미

한국어 즉 '우리말'은 순수 우리나라말과 외국어에서온 말로 구성되어진다. 특히 외국어 중에서도 중국과 가까이에 있었던 관계로 한자어에서 온 것이 매우 큰 영향을 주고있다. 우리말은 한글과 한자의 혼용체계라 할 수 있으며 이러한 우리말을 컴퓨터로 처리하고자 할때는 한글의 구조에 대한 분석을 해야된다.
 

물론 한자어는 우리말과의 오랜 접촉 때문에 우리에게 매우-좀 지나칠 정도로-친근감을 주고있어 실제 우리말과 구별이 되지않을 정도이다. 실제 일상생활은 물론 아직도 학교교육 신문 잡지등에서 한글/한자의 혼용표기 방법이 사용되고 있다.
 

한글학회에서 발표한 '우리말 큰사전'에 의하면 순수 우리말 낱말의 수가7만4천6백12개이며, 여기서 사투리 고유명사 옛말 등을 제외한 표준 순수 우리말은 5만6천1백15개라고 조사되어 있다.
 

그동안의 시대 변천에 따라 수많은 말이 생겨날 수도 있고, 또한 있어왔던 우리말도 주위에서 많이 사라졌을 것이다. 그리고 순수 우리말이라고 정의를 내리는 범위에 따라 약간씩 수자가 달라질수도 있을 것이다.
 

컴퓨터의 도움을 받아 이룩한 우리말 역순사전(1985, 유재원 엮음, 정음사)에 의하면 3만7천4백91개의 순수 우리말을 추출할 수 있었고 이것으로 여러가지 우리말에 대한 과학적인 분석을 하였다.
 

순 우리말 낱말에서 색을 나타내는 낱말은 까망 노랑 빨강 파랑 하양의 다섯가지이다. 그러나 이들 낱말들은 보통 국어사전에는 각기 ㄲ ㄴ ㅃ ㅍ ㅎ 부분에 분산되어 실리게 된다. 반면 역순사전에서는 이들이 모드 'ㅇ'항에 모이게 된다. 또 우리말 사전에서 '김치'의 종류가 어떠한 것들인지를 알아보려 할 때 보통 국어 사전에서는 각종류의 '김치'앞에 있는 수식어에 따라 분산되어 시리게 되나, 역순사전에서는 김치 꿩김치 통김치… 파김치 동아김치 등의 39종류가 모여 나오게된다. 마찬가지로 '떡' 종류는 83가지가 질서정연하게 나열된다.
 

이러한 것은 우리 한글의 합성이나 파생에 대한 연구에 꼭 필요한 자료이다. 또한 같은 뜻을 이루는 낱말들을 한자리에 모아줌으로써 우리말과 글의 어휘력 향상과 표현력 향상에 도움을 주게된다. 이러한 연구는 국어학자는 물론 작가 시인 언론인 학생 등 글을 쓰는 사람들, 또한 민속학이나 인류학을 연구하는데 도움이 될뿐아니라, 요즈음 주목을 받고 있는 인공지능에서의 기계번역(Machine Translation)에서도 크게 중요성을 갖고 있다.
 

기계번역 분야는 지구상의 여러언어와 문자를 자유자재로 구사하게 하는데 컴퓨터의 힘을 활용하고자 한다. 영어를 한국어로 또한 한국어를 영어로 번역하고있을때, 지금까지는 한국어와 영어를 동시에 아주 잘 알고 이해하는'전문적인 사람'이 반드시 가운데서 번역을 해주어야 되었지만, 이러한 전문가를 '전문가 시스팀'(Expert Computer System)으로 바꾸고자 연구가 진행되고 있다.
 

이러한 한글의 기계번역을 위해서는 우선 한글의 특성과 문법상의 여러가지점을 분석하고 연구해야 된다. 이것을위하여 컴퓨터를 도구로 활용하는 방안이 크게 강구되어야겠다.
 

(그림5) 김치와 떡이 나열된 역순사전의 보기


컴퓨터도 한글연구에 기여해야
 

컴퓨터라는 도구를 효과적으로 활용할 수 있으려면 컴퓨터를 위하여 한글이 어떻게 연구되고 활용되어져야 하는가를 생각해 볼 수 있다. 과학적이고 합리적이라는 우리의 한글도 역시 한자 문화권의 범위를 벗어나지 못하고 자음과 모음을 네모난 곽속에 꿰맞추어서 한자형태를 고집스럽게 따라간 것은 어쩌면 강대국의 영향권을 벗어나지 못한 우리 선조들의 무의식적인 소산인지 모르겠다.
 

한글을 서구문명의 소산인 알팞 모양으로 풀어쓰기를 주장하고 있는 사람도 있지만, 역시 우리 눈에 꾸준히 익혀온 우리글자의 기본 모양은 바뀔 수가 없다. 물론 현재의 '한글자형'에서 그치지 않고 꾸준히 조금씩 연구하고 개량하여 글자형태를 좀더 세련되고 아름답게 하고 있지만 무언지 모르게 이질적인 거부감을 갖게 하는 것도 사실이다.
 

이에 못지않게 컴퓨터를 도구로 한글을 연구하는 것도 매우 중요하다. 우리의 문자문화를 위하여 우리글의 연구에 컴퓨터라는 도구를 활용할 수 있게 해야겠다. 현재 컴퓨터에 의한 출판방식이 활발히 연구되고 일부는 실용화되고 있지만, 아직은 외국의 개발과 기술을 많이 도입하고 있는 창피(?)한 실정이다. 특히 우리나라의 말과 순서가 비슷하고 수많은 한자를 구사하고 있는 일본의 기술과 연구 결과에 의존하고 있는 사실은 매우 가슴아프다.
 

'우리말'과 '우리글'만은 '우리손'으로 해결할 수 있어야겠고 이것을 위하여 아낌없는 연구와 노력이 필요하다. 컴퓨터라는 훌륭한 도구를 활용하여 원자력 발전소에 필요한 방대한 계산이나 설계를 해낸 것을 세계에서 가장 과학적이고 훌륭하다고 자타가 인정해주는 것도 중요하지만, 우리 모두가 자랑스럽게 생각하고 있는 우리말과 우리글의 연구에도 관심을 기울이고 노력하여 문화적인 자립을 이룩하는 것이 경제적인 자립 못지않게 중요하다고 생각하는 풍토가 바람직하다고 여겨진다.

1987년 08월 과학동아 정보

  • 구지회 대표

🎓️ 진로 추천

  • 국어국문·한국학
  • 언어학
  • 컴퓨터공학
이 기사를 읽은 분이 본
다른 인기기사는?