“이름 모름. 여성. 32.1세. 행복과 약간의 공포(fear).”
10월 말, 대전 한국전자통신연구원(ETRI)인지로보틱스연구부의 한 실험실. 얼굴 인식 인공지능(AI) ‘딥미러(deep mirror)’가 처음 만난 기자의 얼굴을 분석한 결과다. 얼굴 정보만으로 용케 여성임을 알아봤다. 활짝 웃으면서도 내심 긴장했던 기자의 심리 상태도 ‘공포’라며 정확히 맞췄다. 하지만 가장 소름 돋는 부분은 바로 나이다. 나름 동안이라고 자부해왔는데, 딥미러의 눈은 속일 수 없었다.
딥미러를 개발한 윤호섭 책임연구원은 “기존의 얼굴 인식 알고리즘으로는 얼굴 인식률이 70% 수준에 머물렀다”며 “AI인 딥미러를 이용하면 얼굴 인식 정확도가 90%를 넘는다”고 말했다.
명암 변화 감지 ‘알파 아마크린’ 세포 모방
뇌의 얼굴 인식 능력에 과학기술이 도전장을 내밀고 있다. 최근에는 애플이 선보인 스마트폰 ‘아이폰X(텐)’에 얼굴 인식 시스템인 ‘페이스ID’가 탑재됐다.
얼굴 인식 기술 개발은 1970년대 초부터 시작됐다. 당시 과학자들은 두 눈 사이의 거리, 콧등의 길이 등 얼굴 부위를 측정해 이를 인식 대상의 얼굴과 비교하는 기술을 개발했다. 하지만 역설적으로 얼굴의 데이터가 쌓일수록 인식률은 오히려 떨어졌다. 생김새가 완전히 다르더라도 비율이 비슷한 사람은 많기 때문이다. 표정이 바뀔 때마다 데이터가 달라지는 점도 문제였다.
이후 과학자들은 사람의 눈처럼 명암 변화를 감지해 훨씬 정교하고 세밀하게 얼굴을 구별할 수 있는 컴퓨터 프로그램을 고안했다. 망막에 있는 신경세포 중 ‘알파 아마크린(alpha amacrine) 세포’는 명암의 변화 부위를 감지한다.
여기서 힌트를 얻어 얼굴 사진에서 밝기가 변하는 지점을 찾아 가로세로 3개씩 특정한 값을 갖는 9개 픽셀(이미지의 단위)마다 ‘마스크’를 씌운 뒤 이 부분의 수치를 잰다. 픽셀 하나는 한 변이 3μm(마이크로미터·1μm는 100만 분의 1m)인 정사각형이다.
명암 변화가 없는 곳을 0으로 놓으면 어두워지는 부위는 양수(+)로, 밝아지는 부위는 음수(-)로 나타낼 수 있다. 명암의 변화가 클수록 숫자는 커진다. 윤 책임연구원은 “명암이 달라지는 부분을 모두 추출하면 눈꺼풀이나 입술선 등 윤곽선뿐만 아니라 점이나 주름 등 작은 형태도 찾아낼 수 있다”며 “지금까지 이런 원리로 얼굴인식 알고리즘을 개발했다”고 말했다.
한 사람의 얼굴에서 추출할 수 있는 특징값은 수십~수백 개다. 이들을 좌표에 나타내면 커다란 군집(클러스터)을 이룬다. 사람마다 고유한 특징값을 갖는 만큼 누구나 고유한 클러스터를 갖는다. 윤 책임연구원은 “이미 저장된 클러스터와 인식하고자 하는 클러스터를 비교하면 동일한 인물인지 아닌지 구분할 수 있다”며 “이를 활용한 예가 공항에 있는 출입국 관리 얼굴인식 시스템”이라고 말했다.
이 방식의 가장 큰 문제는 실제 환경에서 인식률이 떨어진다는 점이다. 닮은 사람끼리 클러스터가 겹치거나, 얼굴 표정, 각도, 조명, 화장 유무 등에 따라 다양한 클러스터가 필요하다. 윤 책임연구원은 “실험실에서는 얼굴 인식률이 98% 이상인데, 공항 등에 설치했을 때에는 60% 이하로 떨어진다”고 말했다.
인공신경망 가진 ‘딥미러’ 인식률 99%
최근에는 AI를 활용해 얼굴 인식률을 끌어올리는 연구가 한창이다. 얼굴을 인식하는 인공신경망을 만들고 이를 이용해 마치 ‘인공 뇌’처럼 얼굴을 인식하겠다는 것이다.
인공 신경망은 크게 4개 층으로 나뉜다. 첫 번째 층에서는 얼굴을 픽셀 단위로 쪼갠다. 두 번째 층에서는 각 픽셀마다 명암의 변화 부위를 찾아낸다. 세 번째 층에서는 눈코입 등 부위마다 특징값을 뽑아낸다. 그리고 마지막 층에서는 얼굴의 전체적인 이미지를 파악한다.
실제로 개발된 얼굴 인식 AI는 이보다 단계가 훨씬 복잡하다. 층이 많을수록 데이터를 많이 저장할 수 있어 얼굴 인식률이 높아지기 때문이다. 최근에는 마이크로소프트 리서치랩 아시아(MSRA)에서 100개 층이 넘는 사물 인식 AI(Residual Network)를 개발했다. 기존 알고리즘으로 특징값을 1000개쯤 외웠다면, AI는 수백 만 개 이상, 거의 무한하게 외울 수 있다. 인간의 뇌가 알아채지 못하는 미세한 특징까지 구분하기 때문이다.
딥미러의 성능이 궁금해졌다. 딥미러에게 기자의 이름을 알려준 뒤 카메라에 얼굴을 가까이 댔다. “이정아, 94%”라고 뜬다. 윤 책임연구원은 “70% 이상이면 본인으로 인식한다”며 “딥미러의 얼굴 인식률은 1000명 기준 99% 이상으로 꽤 높다”고 설명했다. 이번에는 미간에 주름이 생길 정도로 얼굴을 찌푸리자 “화남(angry)”이라는 메시지가 뜬다. 입을 시옷(ㅅ)자 모양으로 만들었더니 금세 “슬픔(sad)”으로 바뀌었다.
윤 책임연구원은 “딥미러는 스스로 학습하는 AI인 만큼 어떤 단계를 거쳐 답변을 내놓는지 개발자인 연구팀조차 자세하게 알기 어렵다”고 말했다. 연구팀은 딥미러의 추론 과정을 확인하기 위해 얼굴 인식의 특정 단계에 저장된 이미지를 확인한 적이 있다. 윤 책임 연구원은 “사진에서 얼굴의 특징값을 일일이 뽑아내 얼굴을 인식하는 과정과 유사한 형태로 얼굴을 인식하고 있었다”고 설명했다.
딥미러처럼 인공신경망을 보유한 AI는 수 없이 많은 값을 스스로 학습하고 찾아낸다. 대표적인 사례가 페이스북이다. 2014년에만 하더라도 인식률이 약 97.35%로 사람(약 97.5%)과 비슷했다(doi:10.1109/CVPR.2014.220). 이때 페이스북 알고리즘이 얼굴을 인식하기 위해 거쳐가는 링크(인공신경망 노드)는 약 1억2800만 개였다. 2017년 페이스북의 얼굴인식률은 약 99.8%로 인간보다 월등해졌다. 몇 년 간 수많은 얼굴들을 태그하면서 학습한 결과다.
윤 책임연구원은 “컴퓨터는 저장 공간이 무한하다는 특징이 있어 현재 딥미러가 외우는 얼굴 수는 제한이 없다”면서도 “저장된 얼굴 수가 기하급수적으로 늘어나면 닮은꼴이 증가하는 등의 문제로 오히려 인식률이 떨어질 수 있다”고 말했다.
국내에서 가장 인기 있는 얼굴 인식 기술 기반 동영상 커뮤니케이션 애플리케이션(앱)인 ‘스노우’에도 AI가 적용됐다. 김현욱 스노우 개발팀 엔지니어는 “영상을 2차원이나 3차원 좌표로 가정하고 얼굴의 위치를 인식한 뒤, 움직임에 따라 장식도 움직이도록 설계됐다”며 “최근에는 AI를 활용해 눈코입의 정확한 위치를 파악해 분장의 위치가 훨씬 자연스러워졌다”고 설명했다.
페이스ID는 적외선으로 점 찍어 얼굴 인식
최근 출시된 애플의 ‘아이폰X’에는 얼굴을 인식해 잠금화면을 해제하는 페이스ID 기능이 탑재됐다. 스마트폰에 딥러닝 기반 3D 얼굴 인식 기능이 탑재된 건 아이폰X이 처음이다.
아이폰X 상단에는 세 가지 센서로 이뤄진 ‘트루 뎁스 카메라’가 장착됐다. 먼저 ‘도트 프로젝터’가 사용자의 얼굴에 보이지 않는 점을 3만 개 이상 찍어 가상의 지도를 만들고, ‘투광 일루미네이터’가 적외선을 비춘다. 그러면 ‘적외선 카메라’가 적외선을 따라 점이 찍힌 패턴을 읽어 얼굴을 인식한다. 사용자가 주인이 맞는지 판별하는 것이다.
기존 스마트폰에 있는 보안 기능인 비밀자가 일일이 버튼을 누르거나 스크린 위로 그림을 그리거나 센서에 손가락을 갖다 대야 하는 번거로움이 있었다. 하지만 아이폰 X은 카메라에 얼굴을 비추는 것만으로도 스마트폰이 알아서 사용자를 인식한다. 훨씬 빠르고 간편해졌다.
얼굴 인식률도 높다. 얼굴에 적외선을 쏘아 3차원 굴곡을 읽어 들이는 방식이어서 본인의 사진으로는 잠금장치가 풀리지 않는다. 애플은 “페이스ID가 얼굴을 헷갈릴 확률은 100만분의 1 수준으로 매우 낮다”고 밝혔다.
하지만 국내보다 한 달 먼저 아이폰X이 출시된 미국에서는 페이스ID가 ‘뚫렸다’는 제보가 유튜브에 속속 올라왔다. 한 영상에서는 페이스ID가 일란성 쌍둥이를 분간하지 못했다. 또 카메라를 기준으로 얼굴을 상하좌우로 15도 이상씩 돌리면 인식하지 못했다.
이는 3차원 얼굴 인식 기술로 해결할 수 있다. 국내 3차원 얼굴 분석 업체인 트라이큐빅스는 적외선 센서 없이 일반 카메라로 3~5초간 동영상을 찍어 얼굴을 3차원으로 인식하는 기술을 개발했다. 트라이큐빅스가 자체 개발한 알고리즘이 동영상에서 다각도의 얼굴 이미지를 뽑아 3차원 그물 구조로 만든 다음, 여기에 실제 피부와 동일한 색깔과 질감을 입히는 원리다. 트라이큐빅스 관계자는 “얼굴 표면에서 반사되는 빛의 스펙트럼을 분석해 실제 피부색을 제외한 조명 등 다른 빛을 제거하는 기술이 핵심”이라고 말했다.
中, 3초 만에 13억 얼굴 인식 시도
페이스ID처럼 얼굴 인식 기술의 발달이 가져올 부작용은 없을까. 닮은 사람이 정보를 도용하는 신종 범죄가 생기지는 않을까. 윤 책임연구원은 “범죄율은 오히려 낮아질 것”이라고 전망했다. 아파트 출입문이나 은행 현금자동입출금기(ATM) 등 일상생활 곳곳에서 우리가 인지하지 못하는 사이에 얼굴 인식 AI가 작동할 수 있다. 윤 책임연구원은 “AI의 얼굴 인식 기능이 사람보다 정확한 만큼 정체가 노출되기 싶고, 이런 상태에서는 더 이상 범죄를 저지르기 힘들 것”이라고 설명했다.
하지만 여전히 현실적인 문제가 남아 있다. 다른 생체 정보에 비해 시시때때로 등록해야 해 번거롭다. 홍채, 혈관 등은 특별한 사고를 당하지 않는 한 한 번 정보를 등록하면 영구적으로 사용할 수 있다. 한번 저장해 놓으면 수십 년이 지나도 주인을 분간한다. 하지만 얼굴은 나이가 들면서 주름이 생기는 등 물리적인 변화가 나타난다. 이런 변화를 데이터베이스에 등록해놓지 않으면 AI의 얼굴 인식 정확도가 떨어질 수밖에 없다.
AI 자체의 기술적인 한계도 있다. 오류가 발생하면 고칠 방법이 없다. 자기 학습 능력에 의해 스스로 발목이 잡히는 꼴이다. 가령 A의 얼굴을 반복적으로 B라고 인식할 경우 A의 사진을 계속해서 보여주면서 이것이 A라고 학습을 시키는 수밖에 없다. 결국 오류를 고치는 데 시간이 오래 걸리고, 또 이 오류가 완벽하게 해결됐는지 확인할 방법도 없다.
얼굴 인식 AI가 사생활을 침해할 것이라는 우려도 있다. 중국 정부는 13억 명이나 되는 전체 인구를 3초 만에 인식하는 기술을 개발하고 있다. 익명에 가려진 사생활이 더 이상 보장받지 못할 수 있다는 뜻이다. 미국 스탠퍼드대 연구팀도 얼굴로 성정체성을 판별해내는 AI를 개발해 논란이 됐다. 이외에도 얼굴만으로 성격이나 정치적 성향 등 다양한 특징을 알아낼 수 있다는 AI가 개발돼 논란의 불씨는 여전히 살아 있다.
▼관련기사를 계속 보시려면?