d라이브러리









사진에 찍힌 문자를 인식하는 스마트폰 앱이 화제다. 카메라로 명함을 찍으면 이름과 전화번호를 자동으로 인식해 저장하고, 백화점에 진열된 상품의 이름표를 찍으면 곧바로 최저가를 검색할 수 있다. 이런 앱은 모두 ‘광학 문자 인식(OCR)’ 기술을 활용했다.

광학 문자 인식은 ‘패턴 인식’의 하나로, 패턴 인식은 사람의 보고 듣는 능력을 인공지능이 흉내 낼 수 있도록 연구하는 분야다. 문자뿐 아니라 음성, 얼굴, 동작 인식 등이 모두 패턴 인식에 속한다. 자료에서 문자나 음성 같은 패턴을 찾아낸 뒤 미리 입력된 정보와 비교한다.

문자를 인식하려면 먼저 사진에서 문자 영역과 문자가 아닌 영역을 구분해야 한다. 먼저 ‘정사영’을 이
용해 문자가 있는 영역을 통째로 분리하고, 분리된 문자들을 다시 낱자로 하나하나 쪼갠다. 이제 낱자에
포함된 자음과 모음에서 특징점을 찾아낸 뒤, 선분 단위로 쪼개 미리 입력해 놓은 문자 정보와 비교하면 문자를 인식할 수 있다. 모든 낱자는 ‘가’와 ‘구’ 같은 자음+모음 결합, ‘각’과 ‘국’ 같은 자음+모음+자음결합, 그리고 ‘닭’과 ‘굶’ 같은 자음+모음+자음+자음결합 등 총 여섯 가지 중 하나이므로 쉽게 자음과 모음을 구분할 수 있다.

특징점 선분의 기울기가 급격하게 바뀌거나 선분이 둘로 나뉘는 지점.
 
권영빈 중앙대학교 컴퓨터공학부 교수는 “문자가 26개인 알파벳에 비해 한글은 1만 1172자나 되고, 모음과 자음을 한데 모아 글자를 만들기 때문에 영어처럼 옆으로 늘어 쓰는 문자보다 훨씬 인식하기 어렵다"고 말했다. 최근에는 인공 신경망, 유전자 알고리즘 같은 인공지능 기술 덕분에 정확도가 높아져 스마트폰 앱뿐 아니라 자동차 번호판 인식, 자동출국심사 등 다양한 분야에 쓰이고 있다.

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2017년 08호 수학동아 정보

  • 김우현 기자 mnchoo@donga.com
  • 도움

    권영빈 중앙대학교 컴퓨터공학부 교수
  • 기타

    [참고] 이성환 ‘문자인식’

🎓️ 진로 추천

  • 컴퓨터공학
  • 정보·통신공학
  • 소프트웨어공학
이 기사를 읽은 분이 본
다른 인기기사는?