d라이브러리









[News & Issue] 불법 유출물의 장례를 치러드립니다

올해 국가직무능력표준(NCS)에 생소한 신규 직군이 등록됐다. 바로 ‘디지털 장의사’.
디지털 장의사가 하는 일은 개인의 요청에 따라 인터넷의 기록을 지워주는 것이다.
자신도 모르게 퍼진 음란물 삭제 요청만 한 해 5만여 건에 이른다(2014년 기준, 방송통신심의위원회).



저도 이 일을 시작하기 전까지는 동영상 유출로 괴로워하는 피해자가 이렇게 많은지 몰랐어요.” 2월초 인터뷰를 위해 만난 김소라 포겟미코리아 전략기획실장이 처음 꺼낸 말이었다. 포겟미코리아는 지난해부터 활동해온 ‘디지털 장의사’ 전문 기업이다. 김 실장은 “피해 사례가 정말 다양하다”며 “자기도 모르는 사이에 너무 많이 퍼져버려, 고심 끝에 찾아오는 고객이 대부분”이라고 말했다. 포겟미코리아가 2015년 1월부터 6개월간 동영상 유출 피해고객 121명을 대상으로 조사한 결과, 전 이성친구에 의해 유출된 사례가 44%, 몰래카메라 피해 사례가 23%, 해킹이 22% 등 97% 이상이 타인에 의한 유출이다. 심지어 자신의 성생활이 고스란히 담긴 USB를 잃어버려 피해를 본 사람도 있다. 이 여성은 한참 뒤 한 음란 사이트에서 자신의 영상을 발견했다고 한다. “디지털 장의사는 인터넷에 남아있는 고인의 기록을 지우는 데서 비롯된 말이지만, 최근에는 동영상이나 개인정보 유출 사례가 워낙 많다 보니 이런 의뢰가 80% 이상을 차지합니다.”

웹사이트 목록 추출하는 웹 크롤링 기술 이용해

“본인이 직접 해당사이트에 삭제 요청을 하면 되지 않냐”는 질문에 김 실장은 “개인이 감당할 수 있는 양이 아니다”라고 말했다. 순식간에 퍼지는 건 물론이거니와 악의적으로 편집한 영상까지 만들어지기 때문이다. 때문에 전문 기업에서는 ‘웹크롤링’ 기술을 이용한다.

웹 크롤링 기술은 여러 웹페이지에서 찾고자 하는 정보를 추출해내는 데 필요한 기술이다(65쪽 일러스트 참조). 비유하자면, 김 씨 성을 가진 이들의 주소록을 수집하는 과정과 비슷하다. 가장 효율적으로 주소록을 만들기 위해서는 김 씨가 가장 많이 살고 있는 지역의 목록부터 작성해야 한다. 마찬가지로 웹페이지를 크롤링하는 작업 역시 동영상이 주로 유출되는 웹페이지의 목록부터 얻어낸다. 일반적인 게시물이야 네이버와 같은 검색엔진이 우선순위겠지만 음란 동영상은 주요 웹하드가 1순위다. ‘몰카’와 같은 키워드를 이용하기도 하지만 의뢰인이 유출된 동영상을 가지고 있다면 ‘해시값’을 이용해 좀 더 쉽게 웹페이지 목록을 수집할 수 있다.

해시값은 데이터가 갖는 고유한 값으로 주민등록번호 같은 존재다. 주민등록번호를 알면 그 사람의 주소를 쉽게 찾을 수 있는 것처럼 동영상 역시 해시값을 알고 있으면 찾기가 수월하다. “하지만 해시값이 만능해결사는 아니에요. 의뢰인이 원본 동영상을 가지고 있지 않은 경우도 있고, 동영상의 일부만 편집해 새로운 영상을 만들어 배포하는 경우도 있거든요.” 동영상이 편집되면 해시값이 바뀌기 때문에 이 정보만으로 찾기는 어렵다. 이럴 때를 대비해 디지털 장의사들은, 음란 동영상을 상업적으로 판매하고 해당 영상을 주기적으로 업로드하는 판매자의 정보도 함께 수집한다.

동영상이 올라간 웹페이지 목록을 얻어내고 나면 일일이 삭제요청을 하는 것 역시 디지털 장의사의 업무다. 듣기만 해도 웬만한 노력으로는 어려워 보인다. 김 실장은 “보통 삭제 업무 기간을 3~6개월 정도로 잡는다”며 “삭제 작업 이후에 또 새로 동영상이 올라올 가능성도 있기 때문에 일정기간 사후관리가 필요하다”고 말했다.


평판 관리까지 업무 분야 확대 중

“최근에는 취업을 위해 자신의 SNS나 과거 자신이 올렸던 글 등을 다 삭제하려는 사람들도 많다고 하던데, 이런 의뢰인은 없나요?” 김 실장은 개인이 평판 관리로 요청하는 사례는 30% 이내라고 말했다. 대신 개인이 아닌 기업에서 요청하는 경우가 많다고 했다. 기업에 대한 허위성 글이 유포되는 경우가 많은데, 모든 SNS나 웹페이지를 다 확인하기가 어렵기 때문이다. 디지털 장의사는 데이터마이닝 기술을 이용해 빠른 시간 안에 데이터를 분석할 수 있다.

데이터마이닝 기술은 대량의 데이터에서 의미 있는 정보만을 추출해 의사결정에 활용하는 작업이다. 예를 들어 K라는 연예인의 평판관리를 하고자 데이터마이닝 기술을 적용한다고 해보자. 우선 K에 대한 게시물의 글을 분석해 긍정적인 어구와 부정적인 어구를 분리해낸다. K는 과거 A라는 연예 프로그램에서 ‘복고 댄스’로 이름을 날렸으며, 연예인 L과 스캔들에 휘말렸던 이력이 있다. 게시글을 분석한 결과 복고 댄스와 A는 긍정적인 어구, L은 부정적인 어구로 분류됐다. 그럼 이제 웹 크롤링 기술을 이용해 K가 언급된 게시물 목록을 수집한 뒤, 게시물에서 부정 혹은 긍정적인 어구가 차지하는 비율을 계산한다. 이 과정을 거쳐 게시물을 긍정, 부정, 중립 등 세 가지 그룹으로 분류한 뒤 부정적인 게시물 중 허위사실에 대해서는 삭제 요청을 진행한다.


권리가 침해된 경우 법적으로 삭제 요청 보장돼 있어
그런데 듣다 보니 궁금한 점이 생긴다. ‘검색엔진에서 그 많은 삭제 요청을 들어주느냐’다. 검색엔진의 입장에서는 최대한 많은 정보를 가지고 있는 것이 유리한데, 너도나도 지워달라는 요청을 과연 다 수락하겠느냐는 것이다. 황지은 방송통신위원회(이하 방통위) 개인정보보호윤리과 사무관은 “삭제 요청 시 정보통신서비스 제공자는 삭제나 임시조치를 하도록 법이 제정돼 있다”고 말했다. 실제 ‘정보통신망 이용촉진 및 정보보호 등에 관한 법률’ 제44조 2항, 정보의 삭제요청과 관련된 항목에는 ‘정보통신서비스 제공자는 사생활 침해나 명예훼손 등 타인의 권리가 침해돼 삭제 요청을 받으면 지체 없이 삭제 및 임시조치를 취해야 한다’고 명시돼 있다. 임시조치는 삭제 요청을 받은 게시물의 권리 침해 여부를 판단하기 어려운 경우 해당 정보에 대한 접근을 임시적으로 차단하는 것이다(언론사의 기사는 예외로 언론 중재법에 의거해 처리한다). 이는 우리나라에만 있는 조항이다.

 

 
김소라 실장은 “법적으로 보장돼 있는 만큼 앞으로 디지털 장의사에 대한 수요는 더 늘어날 것으로 예상된다”고 말했다. 미국 IT 시장조사기관인 이마케터의 조사에 따르면 전세계 SNS 사용자는 2011년 12억 명에서 약 3년 뒤 18억5000명으로 1.5배가 늘었고, 방송통신심의위원회에 따르면 음란물에 대한 SNS 불법정보 시정요구는 2010년에 비해 2013년에는 3배 가까이 늘었다.
 
디지털 장의사에 대한 관심이 늘어가면서, 한국평판협회는 디지털 장의사가 되기 위한 자격검정을 준비하고 있다. 기술적인 능력은 물론 개인정보보호법과 같은 법적인 지식도 갖춰야 한다. 한국평판협회 자격검정팀 관계자는 “현재 교육과정은 마련돼 있는 상태로, 올해 4월에 공식적으로 발표할 예정”이라고 말했다.

2016년 03월 과학동아 정보

  • 최지원 기자
  • 일러스트

    연지

🎓️ 진로 추천

  • 컴퓨터공학
  • 법학
  • 문헌정보학
이 기사를 읽은 분이 본
다른 인기기사는?