(((거대 글로벌 기업들이 인공지능 산업을 견인하는 현재, 국내에서는 어떤 연구가 이뤄지고 있을까.))) 6월 15 일, 대전 유성구에 위치한 한국전자통신연구원(ETRI)에서 글로벌 기업을 바짝 추격하고 있는 두 명의 과학자를 만났다.

이번 특집 기사를 준비하면서 말 그대로 ‘지겹게’ 들었던 인공지능이 있다. 바로 IBM사가 개발한 ‘왓슨’이다. 왓슨은 사용자의 질문을 분석해 스스로 알맞은 내용을 찾아 답해주는 인공지능이다. 영화 ‘아이언맨’에 나오는 인공지능 비서 ‘자비스’와 비슷하다. 왓슨은 2011년 TV 퀴즈쇼 ‘제퍼디!’에서 인간 챔피언을 이겨 전세계에 화제를 뿌렸다.
한국도 왓슨과 비슷한 인공지능을 개발하고 있다. 김현기 한국전자통신연구원(ETRI) 지식마이닝연구실장은 “일반적인 의사소통을 넘어 전문 지식까지 나눌 수 있는 인공지능인 ‘엑소브레인’을 개발하고 있다”고 말했다. “웹 검색하고는 좀 다릅니다. 현재 검색은 단어 키워드를 뽑아내는 방식이죠. 결과가 나와도 페이지를 넘겨가며 내가 원하는 답을 찾아야 합니다. 엑소브레 인은 문장을 통째로 분석해서 질문에 꼭 맞는 답을 찾아냅니다.”
엑소브레인 프로젝트는 미래창조과학부에서 2013년부터 추진한 소프트 웨어 프로젝트 중 하나로, ‘몸 밖의 뇌’라는 뜻이다. 예컨대, IBM 왓슨처럼 의학 전문지식을 갖춘 대화형 인공지능이 목표다. 여기에 필요한 기술은 자연어 이해, 지식 학습, 자연어 질의응답 등 세 가지. 사용자가 말한 온전한 문장을 형태소 별로 분석해 문제에 들어 있는 제약 조건과 찾아야 하는 답의 유형을 파악한다. 단어와 단어, 단어와 구문, 구문과 문장의 관계를 파악하는 게 핵심이다. 그 뒤, 미리 구축해 둔 데이터베이스에서 알맞은 답을 찾아낸다. 여기에는 연역적, 귀납적 두 가지 방법이 이용된다.
“‘남산의 높이는 얼마인가요?’라는 질문에는 곧바로 ‘남산 높이=262m’라고 100% 정답을 낼 수 있습니다. 반면, 추론이 필요한 질문에는 귀납적으로 접근해야 해요. 여러 가지 ‘정답 가설’을 놓고 질문에 다시 대입해서 신뢰도를 계산하는 방식이죠.”
연구팀의 기술력은 세계적인 수준이다. 이미 91.2% 정확도로 한국어 문장을 이해할 수 있다(왓슨은 88.7% 정확도로 영어 문장을 인식한다). 한국어 위키백과 7배 분량의 지식을 이미 구축했고 현재 확장 중이다. 복합적으로 추론해 답을 내는 질의응답 기술도 검증을 완료했다. 관련 소프트웨어를 14개 기관에 배포했다. 의학 지식을 갖춘 ‘닥터 엑소브레인’은 서울 강남에 위치한 나누리병원에서 내년부터 시범 운영할 예정이다. 닥터 엑소브레인은 한 달에 5시간밖에 공부할 시간이 없는 의사들을 위해 최신 의학 정보와 처방 결과 등을 알려주는 의사 보조 시스템이다.
“전문가 수준의 지식서비스를 통해 다양한 산업환경에서 신 산업을 창출할 수 있습니다. 2020년을 전후로 분명 큰 시장이 열릴 거예요. 그 때까지 국내 최고를 넘어 세계 어디에 내놔도 부끄럽지 않은 인공지능을 개발할 겁니다.”

“10년 안에는 영화 ‘그녀’에 나오는 사만다처럼 자유롭게 대화하게 될 겁니다.”
박전규 음성처리연구실장의 말에는 자신감이 묻어 있었다. 입가에는 웃음이 떠나지 않았다. 박 실장팀은 사람의 말을 알아 듣는 인공지능을 연구하고 있는데, 최근 정부와 수많은 민간 기업의 ‘러브콜’을 받았기 때문이다. “음성처리는 10여 년 전부터 꾸준히 연구했어요. 거기에 딥러닝 기법을 적용한 건 3~4년 정도 됐습니다. 그 짧은 기간 동안 음성인식 정확도가 10~20% 확 높아졌죠.”

사람의 말을 알아듣게 하는 데는 이미지 인식과 비슷한 학습 과정이 필요하다(3파트 참조). 입력단에 소리 파형을 넣어주면 심층인공신경망이 단계별로 파형 각 부분의 구조를 파악한 뒤, 어떤 텍스트인지 결과를 낸다. 사람이 미리 넣어 준 결과와 다르면 오류 값을 1단계로 보낸다. 올바른 텍스트를 낼 때까지 이 과정을 반복한다. 특히 대화형 서비스는 서비스 한다는 것 자체가 고객으로부터 피드백을 받아 신경망을 학습시키는 과정이다. 박실장은 “지난해 2월 대화형 내비게이션 서비스를 시작했는데, 불과 1년 만에 인식률이 65%에서 80%로 좋아졌다”고 말했다.
올해에는 연구팀이 개발한 콜센터 녹취음성기가 소위 ‘대박’이 났다. 이미 1억 원 규모의 기술이전을 8건 완료했다. 은행, 증권, 카드사 등 국내 대규모 콜센터 직원이 17만 명에 달하면서 고객 상담 자료의 중요성이 부각되고 있기 때문. 연구팀의 녹취음 성기는 현재 정확도가 80%에 달한다. ‘텔레마케터가 사라지는 건 정말 시간 문제겠구나’라는 생각을 하는 순간, 기자의 표정을 읽은 듯 그가 덧붙였다. “아직은 갈 길이 멀어요. 시골에 사는 80대 노인이 전화해서 ‘내가 한 달 전에 냉장고 사부렀는디~, 얼음이 안 얼어부러~’라고 말하면 인식률이 확 떨어집니다. 미취학 아동도 마찬가지고요. 이런 음성을 꾸준히 모아서 학습시켜야 합니다. 현재 사투리 데이터베이스도 구축하고 있어요.”
이제 음성인식분야의 과제는 상업화 모델을 찾는 것이다. 이를 위해 연구팀은 지난해 ‘지니튜터’라는 영어 교육 인공지능을 내놨다. 사용자가 말한 영어 발음이 원어민 음성과 얼마나 유사하고 문법적으로 얼마나 정확한지 평가해 준다. 전국 초등 영어 프랜차이즈에 이미 기술이전을 마쳤다. “한국 드라마를 보면서 한국어를 배우려는 외국인이 많이 늘었다고 합니다. 지니튜터는 앞으로 다국어 교육용으로 발전 시켜나갈 계획입니다.”
그는 “아직도 인력이 많이 부족하다”며 아쉬움을 토로했다. “2001년 이후 돈이 안 된다는 이유로 음성인식 분야가 많이 죽었습니다. 꾸준히 연구해야 한다고 수차례 정부에 주장했지만, 먹히지 않았죠.” 그러다가 2010년 이후 구글 음성검색 서비스와 애플 ‘시리’가 나오면서 갑자기 기술을 따라잡으라는 주문이 떨어졌다. “억울했겠다”고 묻자, 이내 웃으며 답했다. “지금은 행복합니다. 구글과 애플 같은 글로벌 기업들이 산업을 견인해 주니까요. 마음껏 연구할 수 있게 됐습니다.”
그는 “우리가 개발한 기술이 민간에 많이 퍼졌으면 좋겠다”고 소망을 밝혔다. “본격적인 사물인터넷 시대가 열리면 음성인식 기능이 모든 사물에 들어갈 겁니다. 조만간 음성인식 시장이 확 커질 거예요. 저희는 매일 행복한 비명을 지르고 있습니다.”
▼관련기사를 계속 보시려면?
[터미네이터는 없다] INTRO 인공지능 유토피아 vs. 디스토피아
PART 1 인공지능 디스토피아는 없다
PART 2 두 번의 암흑기와 세번째 봄
PART 3 딥러닝, 인공지능을 혁신하다
INTERVIEW 글로벌 기업 바짝 추격한다
PART 4 의도는 없다, 그러나 인간을 위협한다