d라이브러리









[생활] 수학으로 상대방의 마음을 꿰뚫어 본다고?

미래를 여는 수학


 

최근 친구인지 연인인지 헷갈리는 미묘한 사이를 부르는 ‘썸남썸녀’라는 말이 크게 유행하고 있다. 지금 이 시간에도 상대방이 보낸 애매한 문자메시지 한 통을 붙들고 마음앓이 하고 있을 전국의 썸남썸녀들. 이들을 위한 희소식이 생겼다. 바로 상대방이 쓴 글로 그 사람의 감정을 분석하는 것이다. 그런데 글을 통해 글쓴이의 감정을 분석하는 기술의 중심에 수학이 있다.

글쓴이의 마음을 알아내는 ‘감정 분석’


“알고 싶지만 도무지 알 수 없었던 썸남썸녀의 마음, 이제 OO이 알려 줄게요!”

이 문구는 최근 등장한 한 회사의 광고다. 이 회사는 모바일 메신저의 대화 내용을 분석해서 상대방의 현재 감정 상태뿐만 아니라, 나에 대한 호감도와 친밀도, 애정도 등을 분석하는 서비스를 제공하고 있다. 현재 63만 명 이상이 애플리케이션을 내려받아 사용하고 있다.

사람들이 이 애플리케이션에 열광하는 이유는 상대방의 감정을 알고 싶어 하는 것이 인간의 본성이기 때문이다. 상대의 감정에 따른 적절한 행동을 취할 때 사랑과 연애, 결혼에 성공할 수 있고 사회 생활에서 원만한 인간 관계를 유지할 수 있다. 이뿐만 아니라 국회의원과 대통령을 뽑거나, 소비자에게 상품을 팔 때도 유권자와 소비자의 마음을 헤아리는 것이 가장 중요한 요소다.

이 때문에 오래 전부터 과학자들은 사람의 감정을 알아내는 객관적인 방법을 찾기 위해 노력해 왔다. 감정을 분석하는 다양한 방법 중 하나는 얼굴 표정을 분석하는 것이다. 인간은 특정한 감정에 대응하는 얼굴 표정을 만들기 때문에, 얼굴 표정의 특징을 파악하면 그 사람의 감정 상태를 유추할 수 있다. 또 다른 방법은 생체 반응을 측정하는 것이다. 인간은 특정한 감정 상태에 따라 심장박동이나 호르몬 농도 등의 생체 반응이 나타난다. 긴장을 하면 심장 박동이 빨라지고, 식은땀이 나는 것처럼 말이다. 따라서 이러한 생체 반응의 특징을 측정하면 인간의 감정 상태를 유추할 수 있다.

하지만 이런 분석 방법에는 몇 가지 제약이 따른다. 우선 상대방의 몸에 미리 특수한 장비를 설치해야 한다는 점이다. 그리고 직접 대면한 상태에서 감정이 발생하는 순간에만 감정을 측정할 수 있다. 따라서 현재 감정만 판단할 수 있고, 과거의 감정은 측정 데이터를 가지고 있지 않는 한 알아낼 방법이 없다.

반면에 최근 들어 활성화되고 있는 ‘글을 통한 감정 분석’의 경우, 상대방이 자발적으로 기록한 글만 수집하면 손쉽게 과거와 현재의 감정 상태를 측정할 수 있다. 특히 오늘날은 인터넷과 소셜미디어를 통해 수많은 글이 전세계에서 실시간으로 올라오는 빅데이터 시대다. 따라서 이런 글들을 분석하면 특정한 사회 현상에 대한 긍정 혹은 부정적인 반응을 측정할 수 있다. 또한 기업은 인터넷과 소셜미디어에서 소비자들이 상품에 대해 언급한 글들을 모아서 분석할 수도 있다.

감정을 분석하는 수학 원리는 통계와 확률

감정 분석의 기본이 되는 수학 원리는 통계와 확률이다. 먼저 글이 나타내는 감정 상태를 긍정과 부정의 두 가지로 나눈다. 이때 긍정적인 글에는 긍정적인 의미의 단어가 많이 쓰이고, 부정적인 글에는 부정적인 의미의 단어가 많이 쓰일 것이라는 가정을 토대로 미리 구분해 놓은 긍정과 부정의 단어 집합을 이용한다.

단어의 긍정과 부정 성향을 구분하는 데에는 ‘PMI(Point-wise Mutual Information)’라는 수학 모델이 활용된다. 이는 통계적인 방법으로, 두 단어가 하나의 글에서 얼마나 자주 함께 사용되는지를 계산하는 방식이다. 만약 두 단어가 긍정적인 의미의 글에서 자주 함께 등장했다면 긍정적인 성격을 띤다고 판단할 수 있다. PMI는 다음과 같은 수식으로 표현된다.
 

 
이때 A와 B 중에서 긍정과 부정으로 확실히 구분할 수 있는 단어가 있다면, 다른 한 단어가 긍정에 가까운지 부정에 가까운지는 다음과 같은 식을 통해서 계산할 수 있다. 예로 들었던 A와 B 중에서는 ‘좋다’라는 단어인 B가 긍정적인 단어이므로, B를 기준으로 A(아름답다)의 성격을 판단할 수 있다.

SO-PMI(아름답다)★=PMI(좋다,아름답다)-PMI(나쁘다,아름답다)

만약 ‘아름답다’가 ‘나쁘다’라는 단어보다 ‘좋다’라는 단어와 더 많이 함께 사용됐다면, 위의 계산 결과는 양수가 된다. 즉, ‘아름답다’는 부정보다 긍정에 가까운 단어로 평가할 수 있다.

SO-PMI(아름답다)★ ‘아름답다’는 단어의 의미가 긍정에 가까운지 부정에 가까운지를 두 PMI 값의 차로 정의한다는 뜻이다.

이제는 주식 투자도 감정 분석으로!

감정 분석은 이제 막 연구실 밖으로 발을 내디딘 첨단 연구분야로, 최근에는 금융 분야에서 감정 분석을 적용하는 회사들도 속속 등장하고 있다. 주식을 사고 파는 금융활동에서 사람들의 심리 상태가 중요한 변수로 작용하기 때문이다.

예를 들어 1987년 10월 19일 미국 주식시장에서는 하루 동안 주가 지수가 22.61%나 하락하는 충격적인 사건이 있었다. 몇몇 투자자들이 가지고 있었던 주가 지수 하락에 대한 불안감이 순식간에 많은 투자자들에게 확산되면서 일어난 일이었다. 금융계에서는 이 날을 검은 월요일이라는 뜻의 ‘블랙 먼데이’라고 부른다.

최근에는 이런 사태를 막기 위해 감정 분석을 적용하고 있다. 대표적인 예로는 특정한 시점의 경제 관련 신문 기사를 모두 수집해서 주식 시장의 미래 상황을 전망하는 다양한 단어들을 추출하는 작업이 있다. 추출한 단어들이 나타내는 긍정 혹은 부정의 양을 평가해서 주식 시장에 대한 대중의 심리 상태를 알아내는 것이다.

최근 영국 더웬트 캐피탈이라는 금융회사에서는 트위터로 측정한 사람들의 감정 상태를 기반으로 주식 투자를 하는 알고리즘을 실험하고 있다. 트위터에 올라오는 수많은 글을 분석해서 감정 상태의 변동이 주식 시장에 주는 영향을 파악한 뒤, 그 결과를 바탕으로 투자 알고리즘을 만든 것이다. 현재까지 실험적인 투자 결과는 상당히 높은 수익을 거둔 것으로 나타났다.

이처럼 실생활에 유용한 감정 분석을 하기 위해서는 감정 어휘를 세부적으로 구분하는 기초 사전이 필요하다. 감정 어휘들이 글에 어떤 감정이 담겨 있는지를 분석하는 기준이 되기 때문이다. 특히 우리말 감정 분석을 하기 위해서는 당연히 우리말 감정 단어에 대한 연구가 선행되어야 한다. 우리말 어휘 중에서 긍정과 부정 등의 감정에 해당하는 어휘들을 집합으로 나누어 정리하는 작업이다. 이를 위해 국가수리과학연구소에서는 우리말 감정 표현 단어에 대한 분류 지도를 작성하는 연구를 진행하고 있다. 감정까지 꿰뚫어 보는 세상이 수학으로 성큼 다가오고 있다.

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2014년 09월 수학동아 정보

  • 권오규 박사, 선임연구원
  • 홍승표
  • 사진

    스캐터랩
  • 사진

    (주)카카오
  • 사진

    포토파크닷컴
  • 진행

    최영준(jxabbey@donga.com) 기자

🎓️ 진로 추천

  • 수학
  • 심리학
  • 컴퓨터공학
이 기사를 읽은 분이 본
다른 인기기사는?