노래를 듣고 가사를 맞혀야 맛있는 음식을 먹을 수 있다.
실패가 거듭될수록 음식이 줄어드니 귀를 쫑긋 세우자!
놀라운 토요일의 간판 코너 도레미 마켓에서는 신동엽, 박나래를 포함한 7명의 고정 출연진과 2~3명의 초대 손님이 매주 다른 시장의 대표 음식을 걸고 ‘노래 가사 받아쓰기’를 합니다. 노래 가사 받아쓰기는 총 2라운드로, 각 라운드당 노래를 한 곡 듣고 특정 구절의 가사를 맞혀야 합니다. 라운드가 시작되면 노래 제목과 가수, 받아 쓸 구절의 앞뒤 가사를 알려주고, 노래를 들은 출연진은 들리는 대로 가사를 적습니다. 그리고 정답에 가장 가까운 답을 적은 사람을 공개하죠.
이때부터 본격적인 가사 맞히기가 시작됩니다. 가장 정답에 가까운 답을 기준으로 출연진은 힌트를 활용해 3번 안에 가사를 완벽하게 맞혀야 합니다. 1차 시도 때 맞히면 준비한 음식을 각자 1인분씩 먹을 수 있고, 2차 시도 때 맞히면 준비한 음식의 절반 가량을, 3차 시도 때 맞히면 1~2인분 정도를 9~10명이 나눠 먹어야 하죠.
고추 만둣국, 닭볶음탕 등 보기만 해도 군침이 도는 음식을 눈앞에서 놓치면 그야말로 지옥! 과연 출연진은 이번 주도 무사히 가사를 맞힐 수 있을까요?
노래 가사 받아쓰기에는 90년대 발라드, 트로트, 아이돌 댄스 음악 등 시대와 장르를 불문하고 다양한 노래가 문제로 출제됩니다. 최신 음악이 나오면 상대적으로 쉬울 것 같아도 어려운 건 매한가지입니다. 길거리나 TV에서 몇 번씩 들었던 노래도 일부러 외우지 않으면 대부분 정확한 가사를 모르거든요.
재밌는 사실은 똑같은 노래를 들어도 제각각 다른 가사를 적는다는 겁니다. 서로 다른 가사를 적었어도 힘을 모아 결국 정확한 가사를 찾아가는 게 도레미 마켓의 재미죠. 그런데 사람마다 같은 노래를 다르게 듣는 이유가 뭘까요?
Laid him on the green과 몬더그린
2012년 엠넷 아시안 뮤직 어워드에서 이솔지 아나운서의 재밌는 실수가 화제였습니다. 이 아나운서가 참석한 가수에게 누구의 공연이 가장 인상적이었냐고 묻자 ‘아담 램버트’라고 답했는데, 주변이 시끄러웠던 탓에 이를 ‘아름다운 분?’이라고 되물은 거죠.
이렇게 특정 단어가 자기가 알고 있는 다른 단어로 들리는 현상을 ‘몬더그린’이라고 합니다. 몬더그린은 1954년 미국 작가 실비아 라이트가 쓴 에세이 ‘몬더그린 아가씨의 죽음’에서 유래했습니다. 이 에세이에서 실비아는 어린 시절 엄마가 읽어 준 노래 구절 ‘And laid him on the green(앤드 레이드 힘 온 더 그린)’을 ‘And lady mondegreen(앤드 레이디 몬더그린)’으로 들었다고 고백했는데, 이후 말을 잘못 알아듣는 현상을 몬더그린이라고 부릅니다.
몬더그린이 발생하는 이유는 소리를 인식하는 과정에서 찾을 수 있습니다. 소리는 귀를 거쳐 뇌에서 소리 정보를 처리하는 청각 피질에 전달되고, 청각 피질은 ‘자동차 경적 소리’, ‘새 소리’처럼 뇌에 저장된 정보를 이용해 소리와 의미를 연결합니다. 연결하는 과정은 정확히 밝혀지지 않았지만, 유력한 가설 중 하나는 입력된 소리와 비슷한 발음을 가진 단어를 한꺼번에 떠올린 뒤 그중 가장 발음이 비슷한 단어를 고른다는 겁니다.
이 가설에 따르면 몬더그린은 소리 자체가 왜곡됐거나 그 소리에 해당하는 정보가 뇌에 없을 때 생깁니다. 그래서 가요처럼 기계음, 악기음 등 소리에 잡음이 많이 섞였거나 가수의 발음 또는 억양이 부정확하면 몬더그린이 잘 발생하죠. 또 소리와 대응하는 정보를 가지고 있지 않으면 뇌는 의미를 알고 있는 소리 중 가장 비슷한 소리를 찾아 그 단어라고 판단하기 때문에 외국 노래를 듣거나 아직 글자를 다 익히지 못한 어린아이들이 몬더그린을 자주 겪게 됩니다.
음성 인식에도 쓰이는 몬더그린 극복 방법
영국의 신경학자 올리버 색스는 몬더그린은 자연스러운 현상이므로 다른 정보를 이용해 몬더그린이 발생했다는 사실을 알아차리고 고치면 충분하다고 말합니다. 실제로 도레미 마켓의 출연진은 처음에는 들리는 대로 엉뚱한 가사를 적지만, 주어와 서술어의 순서, 조사와의 결합 같은 문법과 문제 바로 앞뒤에 나온 가사를 보고 문맥을 파악해 정확한 가사를 찾습니다.
재밌는 건 사람의 말을 정확하게 들어야 하는 음성 인식 기술에서도 이와 비슷한 방법, 즉 ‘언어 모형’을 활용해 인식의 정확도를 높인다는 겁니다. 음성 인식은 음성 신호의 주파수를 분석해 단어를 알아내는데, 이때 언어 모형을 이용해 단어들이 서로 문법적으로 맞는지 혹은 문맥적으로 어울릴지를 확률로 계산해 가장 높은 값을 최종 선택합니다. 따라서 특정 단어를 인식할 때 비슷한 발음을 가진 단어가 많거나 발음이 부정확해 인식이 어려워도 이전 단어와 어울릴 확률이 가장 높은 단어를 우선해 고르므로 잘못 인식할 가능성이 줄어들죠.
대중가요 가사에는 노래를 작사할 당시 대중의 경험이나 사고방식, 정서 등이 담겨 있습니다. 그래서 대중가요 가사를 분석해 각 시대별로 가사에 어떤 단어가 자주 쓰였고, 어떤 단어를 함께 썼는지 알아내면 출연진이 가사를 추측하는 데에 도움이 될 거예요. 실제로 출연진은 90년대 노래의 가사를 맞힐 때 ‘그때의 감성으로는 이런 단어를 많이 썼다’고 말하며 가사를 추측했습니다.
연결망 분석으로 가사 분석!
대중가요 가사의 특징은 네트워크 이론에서 사용하는 ‘연결망 분석’ 기법을 이용해 파악할 수 있습니다. 연결망 분석이란 여러 데이터의 관계를 네트워크로 나타낸 뒤 데이터 사이의 관계를 알아내는 방법으로, 그룹 또는 개인의 특징을 알아낼 수 있어요.
김용학 연세대학교 사회학과 교수는 대중가요가 비교적 많이 생산됐던 1960년대와 1980년대, 2000년대에 유행한 대중가요를 각각 100곡씩 골라 가사에서 단어를 추출했습니다. 그리고 시대별로 가장 빈번하게 나오는 단어를 100개씩 추려내 각 단어가 한 가사 안에 같이 등장한 횟수를 따져 연결망을 만들었습니다. 예를 들어 ‘사랑은 눈물의 씨앗’이라는 가사에서 사랑-눈물-씨앗을 연결하고, ‘목포의 눈물’이라는 가사에서 목포-눈물을 연결합니다. 이렇게 하면 ‘사랑’과 ‘목포’도 간접적으로 연결돼 단어들의 연결 관계를 따질 수 있죠.
가장 영향력이 높은 ‘핵심어’를 선정할 때는 ‘위세 중앙성’을 이용했습니다. 위세 중앙성은 한 단어가 몇 개의 단어와 연결되는지, 연결된 단어들이 또 다른 단어와 얼마나 연결되는지를 토대로 영향력을 계산하는 방법이에요. 예를 들면 SNS에서 평범한 사람 여럿과 친구인 사람보다 연예인 1명과 친구인 사람이 더 ‘핵심’이라고 판단하는 거지요. 이렇게 연결망을 만들어 분석해 시대별로 대중가요 가사의 특징을 파악할 수 있습니다.
도레미 마켓의 가장 큰 매력은 시청자도 노래 가사 받아쓰기를 할 수 있다는 건데요, 여러분도 토요일 오후 도레미 마켓에 들러 함께 가사를 맞혀보는 건 어떨까요? 단, 정답을 맞혔다고 음식도 따라 먹으면 금방 살이 찔 테니 주의하세요!