d라이브러리










 
가우스, 뉴턴, 아인슈타인 같은 해외 유명인은 성만 불러도 누군지 금세 알 수 있다. 하지만 우리나라 사람이라면? 만약 유재석을 ‘유’라고만 불렀다고 상상해 보자. 아무도 유재석인지 모를 것이다. 십여 명만 모여도 같은 성씨를 가진 사람이 한둘이 아니기 때문이다. 실제로 전체 인구 중 김씨 성을 가진 사람은 무려 20%나 된다. 그렇다면 김씨는 언제부터 이렇게 많았을까? 500년 전, 1000년 전에도 그랬을까?

결론부터 말하자면 예나 지금이나 김씨는 전체 인구의 20%를 차지한다. 2011년 스웨덴 우메아대 백승기 박사와 페터 민한겐 교수, 성균관대 김범준 교수는 서기 500년 무렵의 우리나라 성씨 분포를 예측해 발표했다.

이 연구에 사용한 수학 모델인 임의그룹형성은 그 위력이 대단하다. 달랑 숫자 3개만 알면 성씨에 관한 모든 정보를 알 수 있기 때문이다. 먼저 사람들이 성씨를 무작위로 선택한다고 가정한다. 그리고 전체 인구 수(M)와 성씨 수(N), 가장 많이 차지하는 성씨의 인구 수(Kmax) 이 세 가지만 알면 성씨의 분포를 나타내는 그래프를 그릴 수 있다. 예를 들어 M이 1000이고, N이 20, Kmax가 150이라는 정보를 알면, 성씨 규모가 5명보다 많은 성씨는 몇 개가 있는지, 세 번째로 많은 성씨가 전체에서 몇 %를 차지하는지 등 성씨에 관한 많은 정보를 알 수 있다.

임의그룹형성이란?

M(전체 인구 수)개의 공을 N(성씨 수)개의 상자에 임의로 넣는다고 생각하자. 이때 공이 가장 많이 들어 있는 상자 속 공의 수 Kmax(가장 많이 차지하는 성씨의 인구 수)를 알면, 전체 상자에 담긴 공에 관한 여러 정보를 함수 그래프로 나타낼 수 있다.

서기 500년에도 김씨는 20%

먼저 연구팀은 임의그룹형성이 얼마나 정확한지 확인하기 위해 족보 데이터를 활용했다. 족보 10편을 골라 30년 단위로 나눠서 분석한 것이다. 족보에는 어떤 성씨의 여성이 언제 결혼했는지가 기록돼 있다. 여기서 전체 여성 수(M), 여성의 성씨 수(N), 가장 많은 성의 여성 수(Kmax)를 구해 임의그룹형성에 적용할 수 있다.

예를 들어 1600년과 1630년 사이에 350명이 결혼을 했는데, 그들 중 100명이 김씨고, 성씨의 종류는 50개라고 하자. 이를 가지고 임의그룹형성으로 만든 그래프와 실제 족보 데이터를 비교해 보는 것이다. 그 결과 임의그룹형성은 놀라울 정도로 족보 데이터와 잘 들어맞았다.

마지막으로 연구팀은 족보 데이터를 이용해 약 500년 동안 인구 변화와 성씨 수 변화 사이의 관계를 분석했다. 그러자 미래는 물론 족보 정보가 없는 과거까지 성씨에 관한 정보를 예측할 수 있었다. 그 결과 서기 500년 무렵 우리나라에는 150개 정도의 성씨가 있었고, 성을 가진 전체 인구 수는 5만 명 정도였다. 그리고 이 중에서 20%인 1만 명이 김씨였다. 지금과 비슷한 수준이다.

그런데 서기 500년에 우리나라 인구가 5만 명밖에 없었을까? 사실 삼국시대만 해도 대부분의 사람들이 성 없이 이름만 있었다. 즉 5만 명이라는 예측은 우리나라의 역사를 더 잘 반영한 결과라고 볼 수 있다.

한 번 김씨는 영원한 김씨

김범준 성균관대 교수는 인구 수와 성씨 수 사이의 관계도 연구했다. 대부분의 나라에서는 인구가 늘면 성씨 수도 비례해 늘어난다. 그런데 특이하게도 우리나라는 다르다. 우리나라에서는 인구 수가 10배 증가해도 성씨 수는 불과 몇 십 개밖에 늘어나지 않는다. 대체 왜 우리나라에서만 이런 특이한 현상이 일어난 걸까?

김 교수는 “우리나라에서는 새로운 성씨가 만들어지거나 있던 성씨가 없어지는 일이 거의 없기 때문”이라고 설명했다.

사실 우리나라에서는 성을 바꾼다는 것이 상상할 수 없는 일이다. 오죽하면 ‘내가 한 이야기가 거짓이면 성을 갈겠다’라는 말까지 있다. 하지만 외국에서는 성을 바꾸거나 새로운 성을 만드는 일이 흔하다. 실제로 스웨덴에서는 한달에 새로 만들어지는 성씨가 무려 200여 개나 된다. 일본만 해도 성씨가 무려 13만 2000여 개다.

하지만 우리나라에서는 인구 수에 따라 성씨 수를 예측하는 수학 모델을 만들 때 새로운 성이 만들어질 확률을 0으로 가정해야 정확한 예측이 나온다.

이름 유행, 길어야 15년
 

영자, 금순, 옥희 같은 이름은 할머니 세대에서, 현숙, 미숙, 미경, 영미 같은 이름은 엄마 세대에서 흔히 볼 수 있다. 하지만 요즘에는 아기에게 이런 이름을 잘 붙이지 않는다. 대체 이런 이름의 인기는 얼마나 가는 걸까?

김범준 교수는 족보 데이터를 이용해 여자 이름이 어떻게 바뀌었는지 살펴봤다. 1920년대부터 1992년까지 가장 유행한 상위 40개 여자 이름이 시간이 지남에 따라 어떻게 바뀌는지 평균을 내서 그래프 그려 살펴본 것이다. 하지만 안타깝게도 1920년대 이전 자료는 여자에게 이름을 지어주는 경우가 드물어 분석하지 못했다.

분석 결과 재미있는 경향이 나타났다. 어떤 이름이 처음 나타나 조금씩 쓰이기 시작한다. 30년 뒤부터는 급격히 늘어나다가 50년 뒤쯤에 유행의 전성기를 맞는다. 하지만 가장 인기를 끌었던 시점에서 15년이 지나면 그 이름을 사용하는 빈도가 절반으로 뚝 떨어진다. 그리고 40년 정도가 지나면 거의 사용하지 않는다.

그렇다면 남자 이름은 어떨까? 김 교수는 “남자 이름은 소위 말하는 ‘돌림자’의 영향으로 유행에 민감하지 않다”며, “학규라는 남자 이름은 조선 초기에도 있었다”고 설명했다. 돌림자는 같은 가문 안에서 서열을 분명히 하기 위해 이름에 공통으로 넣는 글자를 말한다. 형제 이름이 김민서, 김민준이라면 여기서 ‘민’자가 돌림자일 가능성이 크다.

김해 김씨는 결혼을 통해서 전국으로 흩어졌다

우리나라의 성씨는 똑같다고 해도 본관이 다른 경우가 많다. 전주 이씨, 김해 김씨처럼 앞에 붙는 지역이 본관이다. 본관과 성이 같은 사람들의 인구 분포는 크게 두 가지로 나뉜다. 바로 김해 김씨처럼 전국에 퍼져 있는 에르고딕형과 학성 이씨(주로 울산에 산다)처럼 한곳에 몰려 사는 비에르고딕형이다.
성균관대 이상훈 연구교수와 김범준 교수, 영국 옥스퍼드대 메이슨 포터 교수로 이루어진 연구팀은 우리나라 족보를 이용해 본관 분포 모형을 만들었다. 그리고 체코의 성씨 거주 자료와도 비교했다. 그 결과 체코의 모든 성씨는 비에르고딕형이었다. 그렇다면 왜 우리나라에는 에르고딕형이 있는 걸까?
우리나라의 오래된 성씨는 생긴 지 2000년이 넘으면서 결혼을 통해 성씨가 전국으로 퍼졌기 때문이다. 그런데 만들어진 지 오래되지 않은 성씨는 전국으로 퍼질 시간이 부족해 본관이 생긴 지역에만 몰려 사는 것이다. 체코의 경우 성씨라는 개념이 생긴 지 얼마 되지 않아 비에르고딕형만 나타난다.
 


2015년 02월 수학동아 정보

  • 조가현(gahyun@donga.com) 기자
  • 김경찬
  • 도움

    김범준 교수
  • 도움

    전중환 교수
  • 사진

    포토파크닷컴
  • 사진

    동아일보
  • 기타

    <수학이 사랑한 예술>, <방정식과 군론>, <진화심리학>

🎓️ 진로 추천

  • 수학
  • 통계학
  • 역사·고고학
이 기사를 읽은 분이 본
다른 인기기사는?