d라이브러리









[특집] 그래프 이론으로 밝힌 스타워즈 인물 관계도

“아주 오래전 머나먼 은하계에서… ”

 

스타워즈 시리즈 영화는 한결같은 문장으로 첫 장면을 시작한다. 스타위즈 시리즈는 스카이워커라는 제다이 가문의 일대기를 그리는 대서사시가 주요 에피소드로, 세계관을 가진 영화의 원조다. 제다이는 은하계의 평화를 지키기 위해 조직된 기사단으로 스카이워커는 제다이의 일원으로 활약한 가문이다.

 

전 세계의 스타워즈 팬덤은 어마어마하다. 스타워즈와 관련된 거라면 시시콜콜한 이야기까지 모두 정리한 온라인 백과사전인 ‘우키피디아’가 있을 정도다. 한 걸음 더 나아가 데이터 예술가이자 과학 커뮤니케이터인 키렐 벤치는 2016년에 우키피디아에 정리된 데이터를 ‘그래프 이론’으로 분석해 스타워즈 인물들 사이의 상관관계를 밝혔다.

 

그래프 이론은 대상들 사이의 관계를 점과 선의 연결로 나타내서 분석하는 수학의 한 분야로, 그 역사가 18세기 수학자 레온하르트 오일러까지 거슬러 올라간다. 오일러는 러시아 쾨니히스베르크 지역의 섬과 강변 사이에 놓인 7개의 다리의 연결 관계를 점과 그래프로 바꿔 각 점을 한 번씩만 지나면서 원래의 출발점으로 돌아오는 것은 불가능하다는 사실을 밝혔다. 이후 오일러의 연구를 발전시켜서 대상들 사이의 관계를 점과 선의 연결 관계로 분석하는 그래프 이론이 탄생했다. 현재는 순수 수학뿐 아니라 반도체 회로 설계와 물류 등 다양한 산업 분야에서도 그래프 이론을 활용하고 있다.

 

 

스타워즈 등장인물의 78%는 인간 종족, 세계관의 시간은 3만 6000년

 

벤치는 온라인 웹페이지에서 자동으로 원하는 정보만 추출하는 알고리듬을 만들었다. 그리고 이를 이용해 각자가 속한 종족과 행성, 소속 집단, 활동 시기 등 우키피디아에 기록된 스타워즈의 모든 등장인물 및 그들을 분류할 수 있는 관련 정보를 모았다. 그런 뒤 전체 등장인물 정보를 속성에 따라 각각 세부적인 그룹으로 나눠 정리했다.

 

이 과정을 마친 뒤에는 각 등장인물을 선으로 연결하는 작업을 진행했다. 예를 들어 A라는 인물을 설명하는 페이지에 B라는 인물이 언급되면 서로 관련이 있다고 보고 선으로 연결하는 것이다. 그 결과 1만 9,612명의 등장인물을 점과 선으로 연결한 네트워크를 얻을 수 있었다.

 

분석 결과 가장 많은 인물과 연결된 등장인물은 15명으로 압축됐다. 다스 베이더가 1,575명 이상, 그의 스승인 다스 시디어스가 1,350명 이상과 연결돼 악의 세력이 더 마당발인 것으로 나타났다. 루크가 뒤를 이어 약 1,300명과 연결됐고, 레아는 약 1,000명과 관계를 맺었다.

 

벤치가 등장인물의 종족과 출신 행성, 소속 집단 등을 분석한 결과에서는  2만 명에 가까운 등장인물 중에서 약 78%가 인간이었다. 나머지 외계인 종족은 인간과 비교하면 차지하는 비중이 작았다. 출신 행성은 총 294개였고, 640개의 서로 다른 집단에 속했다. 제다이 기사단에는 1,367명이 속했고, 다스 베이더와 함께 타락한 제다이 기사인 시스는 724명이 등장했다.

 

스타워즈 이야기가 펼쳐진 시간이 무려 3만 6000년이나 된다는 것을 밝혔으며, 각 인물이 어느 시기에 활동했는지도 정리했다. 이때 활동 시기에 대한 정보가 없는 등장인물의 경우 ‘꼬리표전파 알고리듬’이라는 네트워크 분석 방법을 적용해 활동 시기를 알아냈다. 이 방법은 직접 연결된 네트워크상의 인물들이 어느 시대에 활동했는지를 통해 활동 시기를 추정하는 방식이다. 결국 벤치는 연결된 인물의 정보를 통해 온전한 네트워크를 완성했다.

 

▲ 스타워즈 세계관의 주요 등장인물 7,563명의 관계를 나타낸 그래프다. 가장 마당발은 에피소드 1, 2, 3의 주인공이자 악당인 다스 베이더와 그의 스승인 다스 시디어스였다.

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

이 기사를 읽은 분이 본
다른 인기기사는?