d라이브러리









음성인식 시스템 국내 첫 선

3백 단어 연속음성 기억, 호텔 예약 척척

컴퓨터가 사람의 음성을 인식해 이를 다른 나라 언어로 자동 통역하는 음성인식 자동번역 시스템이 국내에 처음 선보였다. 한국통신은 지난 5월 16일 한국통신연구개발원과 일본 도쿄의 국제 전신전화주식회사(KDD) 오테마치 빌딩간에 호텔 예약을 위한 한-일간 자동통역 시스템 시연식을 가졌다.

이번에 시연된 시스템은 2000년대 상용화될 자동통역 전화의 기초 기술 확보를 위해 개발된 것으로, 호텔 예약에 필요한 3백개 단어의 연속음성을 인식해 한 문장을 3초 이내에 통역한다. 3백개 단어가 그리 많은 것은 아니지만, 이들 단어로 조합할 수 있는 문장이 1백만개쯤 되는 것을 고려해보면 결코 낮은 수준의 인식 능력은 아니다. 또한 그동안 음성인식 기술 상용화의 한계점으로 지적돼온 시스템의 화자 종속 문제를 해결한 것도 큰 의미를 지니고 있다.

우리말로 "여보세요" 하면 컴퓨터가 이를 인식, 일본어로 번역해 송신하고 일본측에서는 이를 "모시모시"로 합성해 들려주며 일본말은 그 반대로 우리말로 합성해 나오기 때문에 상대방 국가의 말을 몰라 겪는 어려움을 덜어준다.

이번에 시연된 자동통역 시스템은 3백단어 수준의 연속음성을 알아듣는 음성인식기술, 인식된 언어를 상대방의 언어로 바꿔주는 기계 번역기술, 그리고 번역된 언어를 음성으로 들려주는 음성합성 기술 등 인공지능의 음성인식 분야 기술이 총동원된 것이다.

한-일간 자동통역 시스템은 93년 9월부터 한국통신 소프트웨어연구소와 한국전자통신연구소, 일본의 KDD가 공동으로 각 연구영역을 구분 개발한 결과물. 지금까지 이 분야 시스템은 비영어권인 일본과 유럽에서 진행돼왔는데, 지난 93년 일본이 독일 미국 두나라와 국제회의 문답에 관한 자동통역시스템 국제 시연이 세계 최초로 이루어진 바 있다. 그러나 당시의 시스템은 한 문장의 통역시간이 10초 이상 걸리는 등 낮은 성능을 보였다.

현재의 음성인식 시스템은 제한된 인식시스템의 대상을 특정 업무에 국한시켜 제한된 문법을 사용함으로써 입력 가능한 문장의 틀을 고정, 인식률을 높이고 있다. 그러나 음성 인식기술이나 음성 합성기술 등은 말하는 전자사전이나 장난감등에서 초보적인 수준의 기술이 선보이고 있긴 해도, 이를 이용한 상용 시스템의 개발은 전문가들 사이에서 조차 대단히 어려운 일로 평가 된다. 단적으로 미국의 벨연구소가 항공권 예약 시스템을 연구실 범위에서 상당한 수준까지 개발됐다고 발표한 것이 지난 76년인데, 20년이 지난 지금까지 전세계적으로 이를 성공적으로 상용화하고 있는 예는 없다. 이번에 국내에서 선보인 것도 역시 연구실 수준의 시스템으로, 상용화에는 좀더 연구가 진척돼야만 한다.

한편 한국통신은 또한 이번 연구 결과를 토대로 세계적으로는 캐나다의 노던 텔레콤이 현재 시험 서비스중인 음성인식 증권정보 안내 시스템을 함께 선보였다.

향후 전화번호 안내를 비롯한 각종 안내나 예약 서비스 등에 활용될 이 시스템은 7백20개의 단어를 인식, 현재의 음성정보시스템(일명 700번 서비스)과 달리 서비스에 접속해 일일이 상장사의 증권코드를 외워 버튼을 누르지 않고도 원하는 주식시장의 상황을 이용자가 알 수 있게 한다. 현재 시험중인 이 서비스는 전화 사용자들이 한국통신 소프트웨어연구소 자체 내에 설치된 전화(02-526-5900)에 직접 접속해 사용해볼 수 있다.
 

비록 이번 시연이 성공을 거두긴 했지만 음성인식 기술의 상용화는 앞으로 좀더 시간이 걸릴 것으로 보인다.
 

1995년 06월 과학동아 정보

  • 동아일보사 편집부

🎓️ 진로 추천

  • 컴퓨터공학
  • 정보·통신공학
  • 언어학
이 기사를 읽은 분이 본
다른 인기기사는?