어때유? 데이터를 요리하는 게 그렇게 어렵진 않쥬? 이제 레시피도 다 알려드렸으니 같이 요리를 해볼게유. 저만 따라하면 하나도 안 어려워유. 오늘 같이 해볼 요리는 소셜네트워크 분석이에유.
다들 트위터 알쥬? 먼저 이거 한번 보고 할게유. 제가 방탄소년단 공식 트위터 게시물을 분석한 거예유!
분석 결과를 통해 방탄소년단 멤버들이 어떤 생각과 말을 하는지를 엿볼 수 있습니다. 방탄소년단이라는 단어보다 ‘아미, 감사, 생일, 축하, 형, 오늘, 좋다, 사랑, 진심, 행복’ 같은 단어가 많이 나오네요. 방탄소년단이 가장 특별하게 생각하는 존재는 팬클럽인 아미라는 걸 짐작할 수 있는 결과입니다.
이 분석에는 트위터 단어 수를 분석하는 것 외에 특별한 수학적 지식이 필요하지는 않지만 네트워크 분석을 적용하면 수학이 본격적으로 힘을 발휘합니다. 사이람에서는 방탄소년단의 노래 가사에 담긴 단어를 분석했는데요, 2018년 7월까지 발표된 155곡에서는 ‘나’라는 단어가 2323회로 가장 많이 나왔습니다. 그런 뒤 ‘나’와 ‘너’라는 단어가 노래 가삿말에서 어떤 단어와 연결되는지를 통해 두 단어를 중심으로 한 네트워크 분석을 했습니다.
이렇게 분석한 결과를 보면 ‘나’와 ‘너’라는 단어와 공통으로 자주 등장한 단어가 무엇인지, ‘나’ 또는 ‘너’라는 단어와 함께 등장한 단어가 무엇인지 알 수 있습니다. 공통으로 ‘꿈, 마음, 생각, 사랑, 손, 곁, 인생, 삶’과 같은 단어가 두 단어와 함께 많이 쓰였네요. 방탄소년단의 노래가 나와 너의 인생, 꿈, 사랑 같은 가사를 많이 담고 있음을 알 수 있습니다.
직접 데이터 분석을 해보니 정말 재미있쥬? 수학적인 원리를 알고 분석하니 더 신나지 않나유? 방탄소년단 뿐만 아니라 여러분이 좋아하는 유명인이나 주제에 대해 분석해볼 수도 있어유.
지금까지 데이터 분석을 요리에 비유해서 살펴봤어유. 재료만 있으면 무궁무진하게 새로운 것을 만들 수 있고, 조리법과 순서만 알면 다양하게 적용해볼 수 있다는 점이 요리와 비슷하쥬? 수학과 우리를 둘러싼 세상에 관한 관심만 있으면 여러분도 훌륭한 데이터 요리사가 될 수 있어유!