d라이브러리









웹 번역기가 유명 번역가로 등장할 날이 올지도 모른다.

11월 7일 네이처 온라인 뉴스판은 최근 구글이 개발한 번역기가 거둔 성과를 소개하며 웹번역기의 앞날을 진단했다.

지금까지의 번역기는 대부분 미리 입력돼 있던 문법과 단어 데이터를 이용한‘사전적인’번역을 해왔다. 데이터에 포함돼 있지 않은 새로운 단어나 고유명사 앞에서는 속수무책이었다. 개발 뒤 일어난 언어의 변화를 빠르게 반영할 수도 없다.

구글이 현재 베타서비스 중인 번역기는 이와는 조금 다르다. 이 번역기에는 문법이나 단어데이터가 담겨 있지 않다. 개발자는 내용은 같지만 서로 다른 언어로 쓰인 문서들을 입력할 뿐이다.

예를 들어 ‘I love Jane’이라는 문장을 보자.‘ 나는 제인을 사랑한다’는 문장을 더 넣어주면 구글 번역기는‘love’와‘사랑한다’가 같은 의미라고‘공부’한다. 공부한 데이터가 쌓일수록 번역할 수 있는 문장이 늘어난다. 자료만 많으면 어떤 문서든 번역이 가능하고 언어의 발전도 빠른 속도로 반영할 수 있다.

결과물의 수준도 높다. 실제로 미국 표준기술연구소(NIST)가 발표한 2006년판 번역기 심사 결과 구글은 40여개의 경쟁 제품 가운데 종합 1위를 차지했다. 웹과 방송 뉴스를 포함한 36가지 부문에서 아라비아어와 중국어 문서를 영어로 번역한 결과, 구글이 한 번역물과 전문 번역가가 미리 만들어놓은‘정답지’와의 유사도는 최고 50%였다.

전문가에 따르면 구글처럼 통계적인 방식을 사용하는 번역기는 자료가 많으면 많을수록 제대로 된 번역이 가능하다.
 

웹 번역기가 유명 번역가로 등장할 날이 올지도 모른다.
 

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2006년 12월 과학동아 정보

  • 동아사이언스 편집부

🎓️ 진로 추천

  • 컴퓨터공학
  • 언어학
  • 소프트웨어공학
이 기사를 읽은 분이 본
다른 인기기사는?