d라이브러리









[주요기사][Disable? This Able!] ABLE TO COMMUNICATE 자막처럼 펼쳐지는 실시간 대화 씨사운드

모든 대화를 입과 귀가 아닌 오로지 손과 눈으로만 해야 하는 청각장애인. 2023년 기준 한국의 청각장애인 인구는 43만 3000명에 달한다. 일상 속 작은 소통도 제약으로 느끼는 이들이 최근 주목하는 특별한 안경이 있다. 바로 청각장애인용 스마트글래스인 ‘씨사운드(SeeSound)’다. 과연 어떤 기술로 소리를 ‘보이게’하는지, 왜 이런 기술을 만들게 됐는지 씨사운드 제작팀의 이야기를 듣고자 제작사인 엑스퍼트아이앤씨를 찾아갔다.

 

편집자 주
보조공학은 신체의 한계를 넘어 불가능을 가능으로 바꾸는 기술입니다. 보조공학의 발전은 장애의 경계를 다시 그리고 있습니다. 현재 주목받는 기술들과 이들이 이끌어낼 변화를 살펴봅니다.

 

▲박동현
4월 1일, 기자가 직접 제작사에 방문해 청각장애인용 스마트글래스 ‘씨사운드’를 착용해봤다. 청각을 차단하고 인터뷰를 진행하는데도 담화의 대부분을 알아들을 수 있었다.

 

“오, 지금 말씀하시는 내용이 눈앞에 자막으로 보여요.”
만우절을 맞은 4월 1일, 서울 송파구에 위치한 엑스퍼트아이앤씨를 방문한 기자는 잠깐이나마 거짓말 같은 광경을 체험했다. 일반 안경처럼 생긴 스마트글래스 ‘씨사운드’를 쓰자 실시간으로 대화하는 말들이 영화 속 자막처럼 눈앞에 생생히 보였기 때문이다. 스마트글래스는 안경 형태의 웨어러블 디바이스로, 시야 내의 사물을 보면서 컴퓨터의 기능을 사용할 수 있는 장치를 말한다.


호기심을 드러내는 기자를 보며 박정남 엑스퍼트아이앤씨 대표는 흐뭇하게 이야기를 이어갔다. “평소에도 청각장애를 지닌 분들이 체험해 보고자 종종 찾아옵니다. 그중에는 안경을 써보고 감격해 눈물을 보이는 분들도 있었어요.”


2019년 설립돼 2021년부터 본격적으로 스마트글래스 시제품을 선보인 엑스퍼트아이앤씨는 청각장애인들에게 이미 ‘네임드’ 회사다. 박 대표는 평소 주말에도 일부러 회사 문을 열어 놓는다고 했다. “어르신 들이 체험하러 사무실에 많이 들른다”며 “아무래도 제품이 아직은 고가(약 170만 원)이기 때문에 자유롭게 사용해 볼 수 있도록 회사를 열어놓는 편”이라고 설명했다.


씨사운드는 전 세계 다양한 박람회에 출품하고 있다. 최근엔 미국 소비자가전전시회(CES) 2025에 나갔고, 지난 여러 해 동안 일본 도쿄 전자박람회, 홍콩 추계 전자박람회, 두바이 자이텍스 등에 참가했다. 박 대표는 “전시회에서 제품 소식을 접한 청각장애인들이 소문을 듣고 직접 체험해 보기 위해 회사까지 찾아온다”면서 “지난 주말에도 난청으로 12년을 고생하던 분이 안경을 써보고 곧바로 구매해 가셨다”고 후기를 전했다.

 

눈에 걸치는 스마트폰을 만들다

언뜻 보기엔 평범한 안경 같은 씨사운드는 작은 스마트폰처럼 기능한다. 씨사운드를 쓰면 스마트폰의 홈 화면과 같은 구성이 눈앞의 시야를 가득 채운다. 손가락으로 스마트폰 화면을 넘기듯 터치 패드를 이용해 좌우로 넘기면 언어, 글꼴, 글자 위치, 색상 등 자막 기능을 나에게 맞게 조정할 수 있다. 뿐만 아니라 앨범, 카메라, 문자 등 여타 스마트폰 속 기능도 안경으로 실행할 수 있다. 광학 디스플레이, 중앙처리장치(CPU), 통신 모듈, 마이크, 스피커 등 컴퓨터 속 기술들이 안경 형태의 씨사운드에도 내장된 덕택이다.


박 대표에 따르면 씨사운드의 한국어 정확도는 자연어(일상적 대화) 기준 98%에 달한다. 그는 이 정도의 정확도를 달성한 곳은 씨사운드가 유일하다고 자부했다. “정확도는 단어 오류율(WER)이나 응답 속도 등 국제적 기준으로 음성 정확도를 시험하는 공인 기관에서 인증을 받아야 해요. 문장 구현의 정확도, 단어 하나의 오류 등을 모두 뽑아서 평균을 내 측정을 하죠.” 그의 말대로 씨사운드를 착용한 채로 인터뷰를 해보니, 이어폰을 끼고 있어 소리가 전혀 들리지 않는데도 자막이 대체로 정확하게 출력돼 상대방이 전하고자 하는 내용을 이해하는 데 무리가 없었다.


박 대표는 자막의 정확도뿐만 아니라 공간 자막화와 자막 속도를 함께 강조했다. 공간 자막화란 발화자의 위치를 감지해 자막을 생성하는 기능이다. 누군가 말을 하면 그 사람이 있는 방향에 맞게 자막이 0.3초 만에 생성되기 때문에, 소리가 안 들려 공간지각력을 활용하지 못하는 청각장애인들도 좌우 중 어디에서 소리가 났는지 알 수 있다. 박 대표는 이를 인공지능(AI) 기반 음성엔진인 ‘STT(Speech To Text)’ 기술의 힘이라고 소개했다.


STT는 사람이 말하는 음성을 텍스트로 즉시 변환해 주는 음성 엔진이다. 박 대표는 “화자가 발성하는 문장을 자막으로 보여주는데 0.3초 정도밖에 안 걸린다”며 “주로 수어를 통해 소통하는 청각 장애인들은 상대의 눈보다 손동작에 집중해야 하지만 안경을 쓰면 그 즉시 자막으로 대화 내용이 나오니 청각장애인도 상대의 얼굴을 바라보며 소통할 수 있다”고 설명했다.

 

씨사운드 작동 원리
▲엑스퍼트아이앤
 
씨사운드의 본체인 초소형 컴퓨터는 안경알 우측 옆면에 탑재돼 있다. 초소형 컴퓨터 속에는 통신 모듈, CPU, 배터리 등이 내장돼 음성을 인식하고 분석한 뒤 자막으로 띄운다. 사용자는 안경알 좌측 옆면에 내장된 터치 패드를 이용해 이중 클릭, 스와이핑 등 다양한 동작을 조작한다.

1 안경테에 달린 마이크로 화자의 음성을 감지한다.
2 CPU가 음성을 인식 한 후 통신 모듈이 내용을 클라우드 서버로 보낸다.
3 STT(Speech To Text) 음성엔진이 클라우드 서버 데이터를 이용해 번역한다.
4 번역된 내용을 이중 유리로 구성된 안경알 속 필름에 빛을 비춰 자막으로 나타낸다.

 

 

수어 몰라도 소통할 수 있는 세상을 위해

청각장애인의 소통을 위해 탄생했을 법한 씨사운드의 초기 목적지는 뜻밖에도 산업 현장이었다. 산업 현장 작업자들이 AI 기반 자동화 공장에서 작동하는 사물인터넷(IoT) 장비들을 한눈에 파악하고 제어하기 쉽도록 돕는 스마트글래스가 초기 목표였다. 실제로 회사 설립 이듬해인 2020년 산업용 증강현실(AR) 스마트글래스를 첫 프로토타입으로 만들어 냈다.


박 대표는 산업용으로 고안한 스마트글래스를 알리기 위해 곳곳으로 홍보 활동을 하러 다녔다. 그러던 중 2021년 초 그는 우연히 한국농아인협회와 연이 닿았다. 한국농아인협회에서 만난 청각장애인들은 귀가 안 들려 불편한 일상과 험난했던 사연들을 털어놓으며 자신들을 위한 기술이 있으면 좋겠다고 호소했다. 이에 박 대표는 청각장애인을 위한 스마트글래스를 우선 개발해야겠다는 결심을 하고, 1년간의 개선을 거쳐 2022년 씨사운드를 세상에 내놨다.


청각장애인은 청각 손실 정도에 따라 난청인과 농인으로 나뉜다. 소리가 어느 정도 들려도 정확한 음성을 듣지 못하는 난청인은 흔히 귀에 넣고 사용하는 보청기의 도움을 받는다. 하지만 보청기를 끼더라도 이물감에 불편을 느끼는 경우가 많다. 장기간 사용에 따른 통증과 어지러움, 두통 등 부작용도 동반된다. 한편 어떠한 소리도 들리지 않는 농인은 오로지 수어와 글씨를 통해 의사를 표현한다. 농인과 소통하려면 상대 또한 수어를 배워야 한다. 씨사운드는 이처럼 어려움을 겪는 난청인과 농인 모두에게 소통의 편리를 제공한다.

 

▲엑스퍼트아이앤씨
엑스퍼트아이앤씨는 씨사운드를 청각장애인용 스마트글래스를 넘어 제2의 스마트폰으로 작동할 수 있게 개발하고 있다.
인터넷 검색, 동영상 시청, 건강 관리 등 스마트폰 기본 앱에 속한 여러 기능을 시험하고 있다.

 

씨사운드가 바꿀 미래의 모습

씨사운드는 장애인을 넘어 모두를 위한 기술을 꿈꾼다. 일반 사용자를 위한 씨사운드의 기능 중 눈에 띄는 항목은 언어 번역이다. 현재 씨사운드는 영어, 프랑스어, 중국어, 일본어, 등 총 8개국의 언어 번역을 제공한다. 이 기능으로 외국인과 대화할 때 스마트글래스를 쓰기만 해도 실시간으로 번역된 내용을 확인할 수 있다.


여러 외국인과 동시에 소통도 가능하다. 미국인 두 사람과 한국인 한 사람까지 총 세 사람이 대화한다고 가정하면, 입력 언어에 영어를 설정하고 출력 언어에 한국어를 지정할 시 두 미국인의 대화가 한국어로 번역된다. 박 대표는 “해외 전자박람회에서는 비영어권의 외국인들도 체험하러 부스를 찾아오는데 우리는 굳이 통역사를 두지 않아도 됐다”면서 “그들에게 씨사운드를 착용시켜 그들의 모국어로 번역되게 만든 뒤 상담을 진행했다”고 회상했다.

 

박 대표의 다음 목표는 다국어 동시통역이다. 아직 한 번에 하나의 언어만 인식해 번역할 수 있다는 한계가 있기 때문이다. 동시에 영어, 일본어 두 가지의 언어가 입력되면 둘 중 하나로만 인식된다. 그는 “두 개 이상의 언어도 한 번에 통역되는 기술 개발에 박차를 가하고 있다”면서 “외국인과의 통화도 곧바로 번역되게 하는 기능까지 2~3년 내에는 가능할 것으로 본다”고 말했다.


전문 분야의 내용을 텍스트로 전환할 때도 정확도가 떨어지는 한계가 있다. 박 대표는 전문 분야의 학습을 보강해 청각장애인들의 대중 강연 청강을 도울 것이라는 야심 찬 목표를 제시했다. “의학이나 고고학, 경제학 등 학술적이고 전문적인 용어는 일상적 대화에 비해 정확도가 조금 떨어져요. 이 문제를 해결코자 전문 용어로 이뤄진 데이터를 따로 모아서 AI에 학습하고 있죠.”


박 대표는 마지막으로 씨사운드가 바꿀 미래를 그리며 인터뷰를 마쳤다. “씨사운드는 200명 이상이 참여하는 콘퍼런스 등에서 시범적으로 쓰이고 있습니다. 강연 내용이 자동으로 텍스트로 전환되고, 나중에 이것을 문서로도 뽑아 볼 수 있거든요. 언젠가는 외국의 석학이 한국에서 강연할 때 모두가 씨사운드를 끼고 편하게 강의를 들을 수 있는 세상이 올 거라고 믿습니다.”

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2025년 5월 과학동아 정보

  • 박동현
  • 디자인

    박주현
이 기사를 읽은 분이 본
다른 인기기사는?