영국의 전설적 4인조 밴드 ‘비틀스’는 영국을 넘어 전 세계 팝 음악계 역사상 가장 영향력 있는 아티스트로 꼽힌다. 1960년 결성된 비틀스는 1970년 해체할 때까지 수십 곡의 명곡을 남겼다. 그런데 이들 명곡 중 아직까지 곡을 만든 원작자가 밝혀지지 않은 두 곡이 있다. 1964년에 발표된 ‘I Don’t Want to Spoil the Party’와 1965년에 발표된 ‘In My Life’다.
그중 ‘In My Life’는 비틀스 멤버인 존 레넌이 자신의 소소한 경험을 가사로 만든 노래다. 2010년 미국의 음악전문잡지 ‘롤링스톤’이 선정한 500대 명곡에서는 23위를 차지했다. 그런 존 레넌은 이 곡을 항상 본인이 혼자 작곡한 노래라고 주장했고, 마찬가지로 비틀스 멤버였던 폴 매카트니 역시 자신의 회고록에서 존 레넌의 가사에 자신이 곡을 붙였다고 밝혔다. 존 레넌이 1980년 사망하면서 원작자는 미궁에 빠졌다.
존 레넌 vs. 폴 매카트니 특징 분석
8월 1일 미국의 한 통계학자는 누가 이 곡의 진짜 원작자인지 알아냈다고 발표했다. 마크 글리크먼 미국 하버드대 통계학과 교수는 7월 28일~8월 2일 캐나다 밴쿠버에서 열린 세계적 통계학회 ‘JSM(The Joint Statistical Meetings) 2018’에서 ‘In My Life’의 음악적 특징들을 수학적 요소로 변환해 비교 분석한 결과를 처음 공개했다.
글리크먼 교수팀은 우선 1962~1966년 발표된 비틀스의 노래 가운데 존 레넌과 폴 매카트니가 작곡한 약 70곡을 수집했다. 그리고 이들 노래에 들어간 멜로디와 코드를 분석했다. 두 명이 작곡한 노래에서 자주 사용된 코드와 자주 사용되지 않은 코드를 분류했고, 화음 전환이 얼마나 자주 일어나는지, 멜로디에 사용된 음의 특징과 이런 음을 사용한 멜로디가 얼마나 연속적으로 반복되는지 조사했다.
멜로디 라인도 분석했다. 앞선 멜로디의 음에 비해 이어지는 멜로디의 음이 높으면 ‘up(올라감)’으로 분류하고, 앞뒤 멜로디의 음이 같을 땐 ‘stays the same(같음)’, 뒷음이 낮으면 ‘down(내려감)’으로 분류했다.
분석 결과 존 레넌과 폴 매카트니가 각각 작곡한 노래들에서 몇몇 특징이 발견됐다. 예를 들어 존 레넌의 곡은 음높이가 별로 바뀌지 않는 반면, 폴 매카트니의 노래는 음높이가 수시로 바뀌었다. 대표적인 곡이 존 레넌의 ‘Eleanor Rigby’와 폴 매카트니의 ‘Love Me Do’다(위 그림).
글리크먼 교수는 과학동아와의 e메일 인터뷰에서 “이런 방식으로 존 레넌과 폴 매카트니의 노래를 분석한 결과, 그들의 노래에서 149개에 이르는 음악적 특징을 발견했다”며 “노래마다 이들 149개의 특징이 몇 번이나 나타나는지 횟수로 변환했다”고 설명했다.
글리크먼 교수팀은 이 방식으로 ‘In My Life’를 분석한 결과 이 곡이 존 레넌의 곡일 확률이 98.2%라고 결론지었다. 글리크먼 교수는 “연구를 공동으로 진행한 제이슨 브라운 캐나다 댈하우지대 교수와 오랫동안 비틀스의 음악을 수학적 기법으로 분석하기 위해 고민했다”며 “그 결과 글의 저자를 확인하는 데 사용하는 ‘스타일측정법(stylometry)’을 곡 분석에 적용하는 방법을 개발했다”고 말했다.
희곡 ‘이중 거짓’ 원작자, 셰익스피어로 밝혀져
스타일측정법은 통계학에서 글의 저자를 구분하는 데 사용하는 기법이다. 기원은 1851년 영국의 수학자인 오거스터스 드 모르간이 단어 길이를 비교해 원작자를 구분할 수 있다고 제안한 것이다. 쉽게 말해 스타일측정법은 글 안에 담긴 각 요소의 특징을 분석하고 이를 다른 작품들과 비교해 저자를 찾아낸다.
예를 들어 짧은 문장을 주로 쓰는 사람과 긴 문장을 애용하는 사람을 구분하거나, 쌍반점(;) 등 구두점을 정확히 쓰는 사람과 생략하는 사람을 구분할 수 있다. 노벨 문학상 수상자인 미국 소설가 어니스트 헤밍웨이처럼 적은 수의 단어로 글을 쓰는 사람과 다양한 어휘를 쓰는 사람도 구분할 수 있다.
스타일측정법이 학계에서 인정받기 시작한 건 1964년 미국 하버드대 통계학자인 데이비드 월러스와 프레데릭 모스텔러가 ‘연방주의자 논집(The Federalist Papers)’의 저자를 찾아내면서부터다.
연방주의자 논집은 1787년 10월~1788년 8월 알렉산더 해밀턴, 제임스 매디슨, 존 제이 등 3명이 ‘인디펜던트 저널’ 등 미국 뉴욕에서 발행되는 신문에 연속으로 게재한 글을 모은 것이다. 당시는 미국이 연방정부를 형성하던 시기였고, 이 글은 연방정부를 반대하던 각 주 대표들의 마음을 돌리는 데 큰 역할을 한 것으로 유명하다.
문제는 이들 글이 가명으로 쓰였던 탓에 총 85편 중 12편을 누가 썼는지에 대해서는 세 명의 저자가 모두 사망할 때까지도 밝혀지지 않았다는 점이다. 글의 원저자를 알아내기 위한 시도가 150년 이상 이어졌지만 여전히 오리무중이었다.
그러던 중 1964년 월러스와 모스텔러는 스타일측정법을 이용해 원저자 찾기에 도전했다. 그들은 저자가 확실히 판명된 글들을 이용해 해밀턴, 매디슨, 제이 등 세 명의 특징을 분석했다. 그 결과 ‘may’ ‘also’ ‘an’ ‘his’ 등 특정 단어를 사용하는 빈도에서 이들 사이에 차이가 났고, 이를 이용해 작자 미상이었던 글 12편 모두 매디슨이 쓴 것으로 판명됐다. 다른 연구자들의 후속 연구에서도 99%의 확률로 매디슨이 지목됐다.
최근 컴퓨터과학이 발달하고 빅데이터 분석기법이 개발되면서 스타일측정법은 더욱 발전하고 있다. 글의 특성을 단순 비교하는 수준을 넘어 다른 분야와 접목하는 수준까지 발전했다. 2015년 라이언 보이드 미국 오스틴 텍사스대 심리학과 연구원은 희곡 ‘이중 거짓(Double Falsehood)’에서 단어를 분석해 심리 상태를 비교하는 방식으로 원저자를 밝혀냈다.
doi: 10.1177/0956797614566658
‘이중 거짓’은 18세기 후반 영국 극작가인 루이스 테오발드가 윌리엄 셰익스피어와 존 플레처의 사라진 희곡 ‘카르데니오(Cardenio)’를 재구성한 것이라며 발표한 작품이다. 하지만 원작자가 분명히 밝혀지지 않아 끊임없이 논란이 돼왔다. 보이드 연구원은 그들이 자주 사용한 단어를 추출한 뒤 이들 단어가 내포하는 감정이나 종교적 성향, 사고방식 등에 대해 점수를 매겼다. 그리고 ‘이중 거짓’에 들어 있는 단어에 대해서도 동일한 방식으로 조사했다.
그 결과 이 작품의 저자는 셰익스피어일 확률이 높고, 플레처가 공동저자일 가능성이 있는 것으로 나타났다. 보이드 연구원은 “스타일측정법으로 단어를 분석하면 글쓴이가 누구인지 추정할 수 있을 뿐만 아니라, 어떻게 생각하고 무엇을 생각하는지까지 예상할 수 있다”고 말했다.