d라이브러리










얼마 전까지만 해도 구글 번역은 믿지 못할 물건이었다. “게임을 하다, 재밌게”처럼 순서를 고려하지 않고 단어별로 번역하거나 먹는 배를 “boat”로 옮기는 경우도 허다했다.

그러던 번역기가 완전히 달라졌다. 인공신경망을 탑재하더니 실력이 부쩍 늘었다. 인공신경망 번역이 뭐기에 순식간에 쓸만한 결과를 내게된 걸까?

문장을 쪼개서 번역했던 구글
영어를 제대로 해석하려면 문장 전체를 읽고 의미를 파악해야 한다. 반면 예전의 구글 번역은 문장을 구 단위로 쪼개 해석했다. 이를 ‘구문기반 통계번역’이라 부른다.
한국어 문장을 영어로 바꾼다고 하자. 먼저 명사구, 부사구, 동사구로 쪼갠 뒤 번역 후보를 줄 세우고 확률을 계산한다. 쌓인 번역 데이터로 통계를 낸 결과 10번 중 8번은 첫번째 구를 ‘Su-rang who likes a boat’로, 2번은 ‘Surang who likes pears’라고 번역했다면 확률은 각각 80%, 20%다. 다음으로 구마다 후보를 하나씩 뽑아 조합할 확률도 구한다. 각 구의 번역 확률과 조합 확률을 모두 계산해 최종적으로 확률이 높은 문장을 선택한다.

여기에서 ‘배’를 ‘pears’대신 ‘boat’로 번역할 위험이 생긴다. ‘boat’로 번역한 확률이 너무 크면 ‘fork’와의 관계를 충분히 고려하지 못하기 때문이다. 구의 위치를 조정할 때도 문제가 생긴다. 한국어와 일본어처럼 문장 구조가 같으면 번역이 잘 되지만, 한국어와 영어처럼 문장 구조가 다르면 오류가 생기기 쉽다. 구글이 바보같은 결과를 내놓았던 이유다.

 

 

 


▼관련기사를 계속 보시려면?

Intro. 인공신경망 번역 수학이 다 알아서 한다
Part 1. 구글이 ‘영잘알’된 비결
Part 2. 수학이 새로운 언어마저 만들었다?
Part 3. 인공신경망 번역기술이 그리는 미래
 

 

 

 

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2017년 02호 수학동아 정보

  • 이다솔 기자
  • 도움

    서정연 교수
  • 도움

    이창기 교수
  • 도움

    조성배 교수
  • 도움

    황영숙 매니저
  • 도움

    후망 로드리게스 최고분석책임자
  • 기타

    [참고자료] 용후이 우 외 3명 ‘Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation’, 멜빈 존슨 외 4명 ‘Google’s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation’
  • 일러스트

    달상

🎓️ 진로 추천

  • 컴퓨터공학
  • 언어학
  • 수학
이 기사를 읽은 분이 본
다른 인기기사는?