주변 소음을 제거하는 휴대전화가 인기다.
휴대전화 소음제거 기술은 3G 서비스의 상징인 영상통화에 꼭 필요한 기술.
어떻게 시끄러운 장소에서 내 목소리만 또렷하게 전달할 수 있을까.
최근 출시한 ‘알리바이 폰’과 ‘허쉬 폰’의 비밀을 파헤쳐보자.
화려한 조명 속, 스피커에서 흘러나온 강한 비트의 음악이 귓가를 울린다. 여자친구 몰래 클럽을 찾은 K씨. 리듬에 몸을 맡긴 채 춤을 추며 맘에 드는 여성에게 다가간다. 이때 갑자기 K씨의 휴대전화가 울린다.
“자기, 어디야?”
“나~? 아직 회사지~”
LG 싸이언 ‘알리바이 폰’ 광고의 한 장면에서 주변 소음을 완벽히 없애는 휴대전화 덕분에 K씨는 여자친구를 감쪽같이 속인다.
휴대전화 소음제거 기술은 지난해 실리콘밸리에서 유망 기술 13개 가운데 투자자에게 주목받는 기술 3위에 뽑혔다. 국내에도 소음제거 기술을 도입한 휴대전화가 늘고 있다. 지난해 LG전자와 팬택은 각각 ‘알리바이 폰’(모델명:LG-SH 400) 과 ‘허쉬 폰’(모델명:IM-S350)을 선보였다. 삼성전자와 모토로라도 곧 소음제거 기술을 도입한 제품을 선보일 예정이다.
두 개의 마이크로 소음 잡는다?
이동통신업체들이 국제전기통신연합(ITU) 기준에 따라 조사한 통화품질 ‘평균 평가 지수’ (MOS)에 따르면 MOS가 3.2점 이하로 떨어지면 이동통신업체에 접수되는 음성 품질 불만 접수가 크게 늘어난다.
통화 품질을 높이려면 휴대전화 통화를 방해하는 소음을 잡아야 한다. 소음에는 ‘정적 소음’과 ‘비정적 소음’이 있다. 정적 소음은 자동차의 엔진 소리나 선풍기가 돌아가면서 내는 소리처럼 규칙적인 소음으로 진동수나 세기에 변화가 거의 없다. 비정적 소음은 통화할 때 들리는 주변 사람들의 목소리나 음악소리 또는 탁자를 두드리는 소리 같이 불규칙적인 소음으로 진동수와 세기의 변화가 빠르다.
소음제거 기술을 개발하는 트란소노의 하동경 박사는 “규칙적으로 발생하는 정적 소음은 소음제거 기술로 쉽게 제거할 수 있지만 문제는 비정적 소음”이라고 말했다. 언제 어디로 튈지 모르는 공처럼 비정적 소음은 언제 어디서 발생할지 알 수 없기 때문이다. 게다가 불규칙하게 발생하는 비정적 소음은 반복되지 않는 경우가 많다. 소음으로 인식될 때는 이미 소음이 지나간 뒤이기 때문에 제거하기 어렵다.
주변 소음을 잡아 언제 어디서라도 알리바이를 만들어주는 ‘알리바이 폰’과 주변을 잠잠하게 만든다는 뜻(hush)을 가진 ‘허쉬 폰’의 비밀은 사람의 청각을 모방한 기술에 있다. 보통 사람은 소리가 어느 방향에서 그리고 얼마나 멀리서 들려왔는지 직관적으로 안다. 뇌에서 양 쪽 귀에 들어오는 소리의 미묘한 시간차와 강도차이를 분석하기 때문이다.
두 제품도 비정적 소음을 제거하기 위해 ‘2개의 귀’(마이크 2대)를 가졌다. 아래쪽 마이크에는 음성신호(목소리)와 소음이 함께 들어가지만 음성신호의 세기가 강하다. 반면 위쪽(스피커 부분) 마이크에는 상대적으로 소음이 강하고 음성신호는 약하게 입력되기 때문에 음성신호와 다른 소리를 구분할 수 있다.
알리바이 폰과 허쉬 폰에는 소음제거 기술을 개발하는 ‘오디언스’ 사가 개발한 ‘A1024’칩도 사용됐다. 소음을 분리해 제거하는 역할을 하는 A1024칩에는 ‘청각인지단계 분석’(ASA)기술이 쓰였다. 청각인지 단계는 사람의 귀로 들어온 소리가 달팽이관에서 뇌간을 거쳐 대뇌의 청각중추에 이르는 소리 전달 경로를 말하며, 오디언스는 이 과정을 전기회로로 구성했다. A1024칩은 사람의 뇌가 다양한 소리를 분류해 인식하듯 입력된 신호를 그룹으로 나눈 뒤 음성신호만을 골라낸다.
A1024칩은 어떻게 신호를 구분할까. A1024칩은 음높이와 고조파(배음) 같은 특성을 이용한다. 일반적으로 모든 소리는 기본진동수의 파동과 그 파동의 정수배의 파동을 갖는 고조파로 이뤄지기 때문에 진동수 패턴을 분석하면 각각의 소리를 분리할 수 있다. 예를 들어 60Hz의 소리에는 진동수의 2배(120Hz), 3배(180Hz) 등 60Hz의 정수배에 해당하는 고조파가 포함돼 있다. A1024칩은 진동수 60Hz와 120Hz, 180Hz 성분은 하나의 소리로 판단하지만 70Hz의 소리나 80Hz의 소리는 다른 소리로 구분한다.
실시간으로 잡음 제거하는 소프트웨어
알리바이 폰과 허쉬 폰을 잇는 차세대 소음제거 휴대전화에는 소프트웨어 방식의 소음 제거 기술이 도입될 전망이다. 칩으로 소음을 제거하는 방식은 비용이 많이 들 뿐만 아니라 마이크가 2개 들어가기 때문에 휴대전화 기기 설계를 변경해야 하는 어려움이 있다.
‘트란소노’가 개발한 유무선 통화 잡음제거 기술인 ‘일렉토복스’는 ‘전(前)방향 탐색’ 기술로 소음을 제거한다. 전방향 탐색이란 음성신호에서 실시간으로 소음을 찾아내 제거하는 방식이다. 기존 방식은 통화하는 도중 말을 잠시 멈추는 부분인 ‘묵음구간’에서 소음을 찾아낸 뒤 전체 구간에서 소음에 해당하는 진동수 성분을 제거했다. 그런데 소음의 진동수와 세기도 계속 변하기 때문에 묵음구간에서 추출한 신호를 기준으로 전체에서 일괄적으로 소음을 제거하면 음성신호가 왜곡되거나 찌그러지는 문제가 생긴다.
하동경 박사는 “말하는 순간에 발생한 소음보다 묵음구간에서 발생한 소음이 더 클 경우 소음의 진동수 성분보다 더 많은 부분을 제거해 음성이 왜곡된다”며 “일렉토복스는 소음을 일괄적으로 제거하는 방식이 아니라 소음의 세기나 진동수가 변하면 약 0.3초 내에 바뀐 소음의 진동수 영역을 판단하기 때문에 비정적 소음도 제거할 수 있다”고 설명했다.
일렉토복스는 ‘심리음향 기법’도 활용해 불필요한 소리를 제거한다. 심리음향 기법은 큰 소리가 난 뒤에 작은 소리가 바로 들리면 사람의 귀에는 작은 소리가 들리지 않는 현상을 이용한 기법이다. 이때 큰 소리 뒤에 발생한 작은 소리는 없애더라도 사람들의 귀에 들리는 음질은 변하지 않는다. 심리음향 기법은 CD에 담긴 음악(WAV 파일)을 mp3파일로 변환할 때도 쓰인다. 북이나 드럼 소리처럼 큰 음향효과 뒤에 있는 작은 소리를 제거하면 파일 용량을 크게 줄일 수 있기 때문이다.
채널 용량 늘리고 배터리 소모 줄인다!
최근 휴대전화에서 소음제거 기술이 주목받는 이유는 뭘까. 휴대전화는 하루가 다르게 발전하며 MP3 플레이어, 카메라, 게임, 인터넷 통신, GPS, 지상파 DMB TV 같은 부가기능을 추가했다. 최근에는 터치스크린과 동작인식 센서까지 갖추며 휴대전화는 명실상부한 ‘디지털 컨버전스’의 선두주자로 자리 잡았다. 하지만 ‘팔방미인’ 휴대전화는 더 이상 새로이 확장할 기능이 없어지면서 제조업체는 통화 품질 업그레이드에서 그 돌파구를 찾았다. 본격적으로 서비스를 시작한 영상통화도 소음제거 기술에 힘을 실었다.
통신 사업자가 소음제거 기술을 도입하는데 앞장선 측면도 있다. 서울대 전기·컴퓨터공학부 김남수 교수는 “무선통신에서는 음성신호 부분에 더 많은 비트(bit)를 할당한다”며 “소음 제거 기술로 불필요한 소음을 제거하면 대역폭(bandwidth)을 늘리는 효과가 있다”고 설명했다. 통신 사업자는 깨끗한 통화음질을 제공할 뿐 아니라 네트워크 대역폭을 확보해 채널 용량을 늘릴 수 있어 1석 2조인 셈이다. 채널 용량이 늘면 기지국에서 수용할 수 있는 소비자가 늘어난다.
사용자에게는 배터리 사용시간이 늘어나는 장점도 있다. 김 교수는 “휴대전화는 입력된 아날로그 신호를 인코더에서 디지털 신호로 변환해 전달하는데 이 과정에서 많은 전력이 소모된다”며 “소음을 제거하면 불필요한 변환과정이 줄기 때문에 휴대전화가 소모하는 전력을 크게 줄일 수 있다”고 말했다.
내 목소리만 깨끗이 전달하는 휴대전화는 강렬한 음악이 흐르는 클럽도 쥐 죽은 듯 조용하게 만든다. 나만의 알리바이를 만드는 휴대전화의 진화는 어디까지 계속될까.
평균 평가 지수 (MOS)
평균평가지수는 통화의 명료함, 음량의 크기 등으로 전화통화의 음질을 평가한 수치로 5점 만점이다. 일반 유선전화의 평균 MOS는 4.1이며 휴대전화는 3.4로 다소 낮다.
묵음구간
통화 도중 말을 잠시 멈추는 구간으로 음성신호가 입력되지 않기 때문에 이때 입력되는 신호는 모두 소음으로 볼 수 있다.
독특한 소리인지 과정 ‘칵테일파티효과’
사람의 뇌는 동시에 여러 가지 소리가 들려도 원하는 소리를 구별해 선택적으로 듣는 능력이 있다. 예를 들어 시끄러운 파티장에서 평소에 좋아하던 사람이 작게 부르더라도 그 목소리는 또렷하게 들린다. 지하철에서 안내방송 소리나 지하철 운행 소리, 사람들 떠드는 소리에 별다른 방해를 받지 않고 책을 읽을 수 있는 이유도 뇌가 소리를 선택적으로 듣기 때문이다. 이런 선택적 소리인지 과정을 ‘칵테일파티효과’라고 한다. 여러 가지 소리가 동시에 들릴 때 그 중에서 특정 음원이나 특정인의 음성에 주목하면 다른 소리가 들리지 않는 심리현상이다.
최근 영국 옥스퍼드대의 앤드류 킹 박사가 칵테일파티효과에 대한 흥미로운 실험을 해 ‘신경과학 저널’ 2008년 11월호에 발표했다. 킹 박사는 다 자란 족제비의 귀 입구 부근에 작은 마이크를 달아 귀로 들어오는 소리를 녹음한 뒤 새끼 족제비에게 들려줬다. 그리고 각 족제비의 뇌에서 청각을 담당하는 부위에 일어나는 변화를 관찰했다. 그 결과 동일한 소리자극에 대해 어른 족제비와 새끼 족제비는 뇌의 다른 부위가 활성화됐다. 같은 소리를 듣더라도 개체마다 뇌에서 다른 방식으로 소리를 해석한다는 칵테일파티효과를 증명한 것이다.
비트
신호를 나타내는 최소의 단위이며 0과 1의 조합인 2진법으로 나타낸다.
휴대전화 소음제거 기술은 3G 서비스의 상징인 영상통화에 꼭 필요한 기술.
어떻게 시끄러운 장소에서 내 목소리만 또렷하게 전달할 수 있을까.
최근 출시한 ‘알리바이 폰’과 ‘허쉬 폰’의 비밀을 파헤쳐보자.
화려한 조명 속, 스피커에서 흘러나온 강한 비트의 음악이 귓가를 울린다. 여자친구 몰래 클럽을 찾은 K씨. 리듬에 몸을 맡긴 채 춤을 추며 맘에 드는 여성에게 다가간다. 이때 갑자기 K씨의 휴대전화가 울린다.
“자기, 어디야?”
“나~? 아직 회사지~”
LG 싸이언 ‘알리바이 폰’ 광고의 한 장면에서 주변 소음을 완벽히 없애는 휴대전화 덕분에 K씨는 여자친구를 감쪽같이 속인다.
휴대전화 소음제거 기술은 지난해 실리콘밸리에서 유망 기술 13개 가운데 투자자에게 주목받는 기술 3위에 뽑혔다. 국내에도 소음제거 기술을 도입한 휴대전화가 늘고 있다. 지난해 LG전자와 팬택은 각각 ‘알리바이 폰’(모델명:LG-SH 400) 과 ‘허쉬 폰’(모델명:IM-S350)을 선보였다. 삼성전자와 모토로라도 곧 소음제거 기술을 도입한 제품을 선보일 예정이다.
두 개의 마이크로 소음 잡는다?
이동통신업체들이 국제전기통신연합(ITU) 기준에 따라 조사한 통화품질 ‘평균 평가 지수’ (MOS)에 따르면 MOS가 3.2점 이하로 떨어지면 이동통신업체에 접수되는 음성 품질 불만 접수가 크게 늘어난다.
통화 품질을 높이려면 휴대전화 통화를 방해하는 소음을 잡아야 한다. 소음에는 ‘정적 소음’과 ‘비정적 소음’이 있다. 정적 소음은 자동차의 엔진 소리나 선풍기가 돌아가면서 내는 소리처럼 규칙적인 소음으로 진동수나 세기에 변화가 거의 없다. 비정적 소음은 통화할 때 들리는 주변 사람들의 목소리나 음악소리 또는 탁자를 두드리는 소리 같이 불규칙적인 소음으로 진동수와 세기의 변화가 빠르다.
소음제거 기술을 개발하는 트란소노의 하동경 박사는 “규칙적으로 발생하는 정적 소음은 소음제거 기술로 쉽게 제거할 수 있지만 문제는 비정적 소음”이라고 말했다. 언제 어디로 튈지 모르는 공처럼 비정적 소음은 언제 어디서 발생할지 알 수 없기 때문이다. 게다가 불규칙하게 발생하는 비정적 소음은 반복되지 않는 경우가 많다. 소음으로 인식될 때는 이미 소음이 지나간 뒤이기 때문에 제거하기 어렵다.
주변 소음을 잡아 언제 어디서라도 알리바이를 만들어주는 ‘알리바이 폰’과 주변을 잠잠하게 만든다는 뜻(hush)을 가진 ‘허쉬 폰’의 비밀은 사람의 청각을 모방한 기술에 있다. 보통 사람은 소리가 어느 방향에서 그리고 얼마나 멀리서 들려왔는지 직관적으로 안다. 뇌에서 양 쪽 귀에 들어오는 소리의 미묘한 시간차와 강도차이를 분석하기 때문이다.
두 제품도 비정적 소음을 제거하기 위해 ‘2개의 귀’(마이크 2대)를 가졌다. 아래쪽 마이크에는 음성신호(목소리)와 소음이 함께 들어가지만 음성신호의 세기가 강하다. 반면 위쪽(스피커 부분) 마이크에는 상대적으로 소음이 강하고 음성신호는 약하게 입력되기 때문에 음성신호와 다른 소리를 구분할 수 있다.
알리바이 폰과 허쉬 폰에는 소음제거 기술을 개발하는 ‘오디언스’ 사가 개발한 ‘A1024’칩도 사용됐다. 소음을 분리해 제거하는 역할을 하는 A1024칩에는 ‘청각인지단계 분석’(ASA)기술이 쓰였다. 청각인지 단계는 사람의 귀로 들어온 소리가 달팽이관에서 뇌간을 거쳐 대뇌의 청각중추에 이르는 소리 전달 경로를 말하며, 오디언스는 이 과정을 전기회로로 구성했다. A1024칩은 사람의 뇌가 다양한 소리를 분류해 인식하듯 입력된 신호를 그룹으로 나눈 뒤 음성신호만을 골라낸다.
A1024칩은 어떻게 신호를 구분할까. A1024칩은 음높이와 고조파(배음) 같은 특성을 이용한다. 일반적으로 모든 소리는 기본진동수의 파동과 그 파동의 정수배의 파동을 갖는 고조파로 이뤄지기 때문에 진동수 패턴을 분석하면 각각의 소리를 분리할 수 있다. 예를 들어 60Hz의 소리에는 진동수의 2배(120Hz), 3배(180Hz) 등 60Hz의 정수배에 해당하는 고조파가 포함돼 있다. A1024칩은 진동수 60Hz와 120Hz, 180Hz 성분은 하나의 소리로 판단하지만 70Hz의 소리나 80Hz의 소리는 다른 소리로 구분한다.
실시간으로 잡음 제거하는 소프트웨어
알리바이 폰과 허쉬 폰을 잇는 차세대 소음제거 휴대전화에는 소프트웨어 방식의 소음 제거 기술이 도입될 전망이다. 칩으로 소음을 제거하는 방식은 비용이 많이 들 뿐만 아니라 마이크가 2개 들어가기 때문에 휴대전화 기기 설계를 변경해야 하는 어려움이 있다.
‘트란소노’가 개발한 유무선 통화 잡음제거 기술인 ‘일렉토복스’는 ‘전(前)방향 탐색’ 기술로 소음을 제거한다. 전방향 탐색이란 음성신호에서 실시간으로 소음을 찾아내 제거하는 방식이다. 기존 방식은 통화하는 도중 말을 잠시 멈추는 부분인 ‘묵음구간’에서 소음을 찾아낸 뒤 전체 구간에서 소음에 해당하는 진동수 성분을 제거했다. 그런데 소음의 진동수와 세기도 계속 변하기 때문에 묵음구간에서 추출한 신호를 기준으로 전체에서 일괄적으로 소음을 제거하면 음성신호가 왜곡되거나 찌그러지는 문제가 생긴다.
하동경 박사는 “말하는 순간에 발생한 소음보다 묵음구간에서 발생한 소음이 더 클 경우 소음의 진동수 성분보다 더 많은 부분을 제거해 음성이 왜곡된다”며 “일렉토복스는 소음을 일괄적으로 제거하는 방식이 아니라 소음의 세기나 진동수가 변하면 약 0.3초 내에 바뀐 소음의 진동수 영역을 판단하기 때문에 비정적 소음도 제거할 수 있다”고 설명했다.
일렉토복스는 ‘심리음향 기법’도 활용해 불필요한 소리를 제거한다. 심리음향 기법은 큰 소리가 난 뒤에 작은 소리가 바로 들리면 사람의 귀에는 작은 소리가 들리지 않는 현상을 이용한 기법이다. 이때 큰 소리 뒤에 발생한 작은 소리는 없애더라도 사람들의 귀에 들리는 음질은 변하지 않는다. 심리음향 기법은 CD에 담긴 음악(WAV 파일)을 mp3파일로 변환할 때도 쓰인다. 북이나 드럼 소리처럼 큰 음향효과 뒤에 있는 작은 소리를 제거하면 파일 용량을 크게 줄일 수 있기 때문이다.
채널 용량 늘리고 배터리 소모 줄인다!
최근 휴대전화에서 소음제거 기술이 주목받는 이유는 뭘까. 휴대전화는 하루가 다르게 발전하며 MP3 플레이어, 카메라, 게임, 인터넷 통신, GPS, 지상파 DMB TV 같은 부가기능을 추가했다. 최근에는 터치스크린과 동작인식 센서까지 갖추며 휴대전화는 명실상부한 ‘디지털 컨버전스’의 선두주자로 자리 잡았다. 하지만 ‘팔방미인’ 휴대전화는 더 이상 새로이 확장할 기능이 없어지면서 제조업체는 통화 품질 업그레이드에서 그 돌파구를 찾았다. 본격적으로 서비스를 시작한 영상통화도 소음제거 기술에 힘을 실었다.
통신 사업자가 소음제거 기술을 도입하는데 앞장선 측면도 있다. 서울대 전기·컴퓨터공학부 김남수 교수는 “무선통신에서는 음성신호 부분에 더 많은 비트(bit)를 할당한다”며 “소음 제거 기술로 불필요한 소음을 제거하면 대역폭(bandwidth)을 늘리는 효과가 있다”고 설명했다. 통신 사업자는 깨끗한 통화음질을 제공할 뿐 아니라 네트워크 대역폭을 확보해 채널 용량을 늘릴 수 있어 1석 2조인 셈이다. 채널 용량이 늘면 기지국에서 수용할 수 있는 소비자가 늘어난다.
사용자에게는 배터리 사용시간이 늘어나는 장점도 있다. 김 교수는 “휴대전화는 입력된 아날로그 신호를 인코더에서 디지털 신호로 변환해 전달하는데 이 과정에서 많은 전력이 소모된다”며 “소음을 제거하면 불필요한 변환과정이 줄기 때문에 휴대전화가 소모하는 전력을 크게 줄일 수 있다”고 말했다.
내 목소리만 깨끗이 전달하는 휴대전화는 강렬한 음악이 흐르는 클럽도 쥐 죽은 듯 조용하게 만든다. 나만의 알리바이를 만드는 휴대전화의 진화는 어디까지 계속될까.
평균 평가 지수 (MOS)
평균평가지수는 통화의 명료함, 음량의 크기 등으로 전화통화의 음질을 평가한 수치로 5점 만점이다. 일반 유선전화의 평균 MOS는 4.1이며 휴대전화는 3.4로 다소 낮다.
묵음구간
통화 도중 말을 잠시 멈추는 구간으로 음성신호가 입력되지 않기 때문에 이때 입력되는 신호는 모두 소음으로 볼 수 있다.
독특한 소리인지 과정 ‘칵테일파티효과’
사람의 뇌는 동시에 여러 가지 소리가 들려도 원하는 소리를 구별해 선택적으로 듣는 능력이 있다. 예를 들어 시끄러운 파티장에서 평소에 좋아하던 사람이 작게 부르더라도 그 목소리는 또렷하게 들린다. 지하철에서 안내방송 소리나 지하철 운행 소리, 사람들 떠드는 소리에 별다른 방해를 받지 않고 책을 읽을 수 있는 이유도 뇌가 소리를 선택적으로 듣기 때문이다. 이런 선택적 소리인지 과정을 ‘칵테일파티효과’라고 한다. 여러 가지 소리가 동시에 들릴 때 그 중에서 특정 음원이나 특정인의 음성에 주목하면 다른 소리가 들리지 않는 심리현상이다.
최근 영국 옥스퍼드대의 앤드류 킹 박사가 칵테일파티효과에 대한 흥미로운 실험을 해 ‘신경과학 저널’ 2008년 11월호에 발표했다. 킹 박사는 다 자란 족제비의 귀 입구 부근에 작은 마이크를 달아 귀로 들어오는 소리를 녹음한 뒤 새끼 족제비에게 들려줬다. 그리고 각 족제비의 뇌에서 청각을 담당하는 부위에 일어나는 변화를 관찰했다. 그 결과 동일한 소리자극에 대해 어른 족제비와 새끼 족제비는 뇌의 다른 부위가 활성화됐다. 같은 소리를 듣더라도 개체마다 뇌에서 다른 방식으로 소리를 해석한다는 칵테일파티효과를 증명한 것이다.
비트
신호를 나타내는 최소의 단위이며 0과 1의 조합인 2진법으로 나타낸다.