과학으로 똑똑하게 보이스피싱범을 잡으려는 연구소에 다녀왔어. 바로 국립과학수사연구원! 보이스피싱범의 목소리를 분석해 범죄 조직단을 그룹화하고, 검거된 범죄자가 이전에 다른 죄를 진 것은 없는지 여죄까지 확인할 수 있는 인공지능 기술을 직접 만나고 왔어!
목소리가 몽타주를 그린다? AI 수사관 떴다
“통화 가능하세요? 명의 무단 도용 사건이 발생해서 연락드렸습니다. OOO씨 아시나요?”
지난 3월 17일, 강원도 원주시에 위치한 국립과학수사연구원(이하 국과수) 디지털과에 경찰을 사칭한 한 남성의 목소리가 스피커를 통해 흘러나왔어요. 모니터엔 ‘유사도 9.257’, 일치 확률 79.126%, 불일치 확률 0.000%’ 이라는 숫자와 그래프가 떠 있었지요. 국과수 박남인 연구원은 “2016년부터 국과수는 금융감독원에서 국민들이 신고한 보이스피싱 데이터를 제공받아 분석 중”이라며 “범행 당시 피해자가 녹음한 음성 1만 1000여 개 중 피의자의 목소리만 남긴 편집 파일을 AI가 성문 분석해 지난 2월 말부터 수사에 활용한다”고 설명했어요.
성문은 사람의 음성을 뜻해요. 지문처럼 사람마다 다른 특징을 지녀 국과수에선 이를 분석해 용의자를 찾고, 경찰이 범인을 검거하는 데 활용할 수 있도록 돕지요. 소리는 혀 모양과 위치, 입술 형태, 치열, 성대 길이, 구강 구조에 따라 다르게 만들어지는데, 이때 발생하는 공명 주파수를 분석하는 거예요. 연령대, 지역, 학력, 동일인 여부 등을 유추할 수 있어요.
“범인들은 잡히면 형량을 낮추기 위해 초범이라고 주장을 많이 해요.”
국과수 전옥엽 연구관은 AI를 통해 보이스피싱 여죄를 파악하는 것이 중요하다고 강조했어요. AI는 데이터베이스와 음성 파일을 대조해 수사 기관에서 범인의 자백을 받는데 활용할 뿐 아니라 유력한 용의자와 범행 당시의 목소리가 확률적으로 얼마나 유사한지를 파악하고, 범죄에 가담한 조직단을 찾는 데도 활용되죠. 박남인 연구원은 “만약 한 음성파일 안에서 A가 수사관 역할, B가 검사 역할을 맡았는데 다른 파일에선 B가 수사관 역할, C가 검사 역할을 맡았다면, 이들이 모두 같은 범죄조직에 소속됐다는 것을 확인한 것”이라 했어요. 이렇게 범죄 음성을 연쇄적으로 비교해 가는 거예요.
“보이스피싱 잡는 AI로 검거율도 높아지길!”
Q. 목소리를 통해 한 사람을 특정할 수 있는 건가요?
성문이 DNA처럼 99.9% 정확하지는 않아요. 사람의 목소리는 DNA처럼 고정된 게 아니라 성장하는 과정에서 성대 길이도 달라지고, 2차 성징 이후 목소리가 달라지거든요. 감정 상태에 따라서도 달라지기 때문에 성문 분석은 보통 평상시 목소리를 기준으로 합니다. 그런데 보이스피싱은 누군가를 속이기 위해서 경찰관, 금감원 등을 사칭하면서 일정한 톤으로 흉내를 냅니다. 나름 일관성이 있는 거죠. 그래서 AI로 분석하면 결과가 아주 잘 나와 수사에 적극 활용됩니다.
Q.AI로 분석하면 좋은 점이 있나요?
과거엔 용의자에게 같은 문장을 말하게 한 뒤 성문 분석을 해야 했어요. 하지만 이제는 꼭 문장이 같지 않아도 목소리만으로 AI가 목소리 특징을 추출해 분석합니다. 분석 속도도 사람과 비교할 수 없을 정도로 빠르고요. 오차율까지 수치화해서 보여주기 때문에, 더욱 객관적인 비교 분석이 가능하죠.
Q.딥 보이스는 어떻게 해결할 수 있을까요?
아직 딥보이스 보이스피싱 사례를 보며 실시간으로 피해자와 대화하진 못해요. 녹음한 것을 틀어 놓는 수준이라 할 수 있죠. 그래서 저희는 보이스피싱에 악용되는 음성이 라이브인지, 녹음된 음성인지에 대한 검출 기법을 개발하려고 노력하고 있답니다.