내가 만든 데이터가 생물을 지키는 데 활용된다면 어떨까요? 이런 멋진 아이디어가 현실로 일어났어요! SK하이닉스는 지난 10월 5일부터 31일까지 ‘생물다양성 데이터 분석 경연’을 열었어요. 대학(원)생, 일반인 등 시민과학자라면 누구나 참여할 수 있는 이번 대회는 마이크로소프트와 숲과나눔재단이 함께 진행했지요. 경연엔 지구사랑탐사대 대원들이 6년간 소중히 모은 데이터가 활용됐어요. 데이터는 6000여 개의 팀, 약 2만 명의 대원이 2016년부터 6년간 누적한 자료로 활동 생태 사진과 영상 데이터는 무려 20만 개에 달했습니다.
이번 경연은 지구사랑탐사대의 관찰 데이터를 기반으로 AI 분석 결과물을 도출하는 ‘데이터 분석 리그’와 데이터 분석을 할 줄 몰라도 생물다양성을 지킬 아이디어가 있다면 제안하는 ‘아이디어 제안 리그’로 나뉘어 펼쳐졌어요. 무려 150여 개 팀이 참가했습니다. 이들은 지구사랑탐사대 데이터를 활용해 기후변화 문제를 확인했고, 생태계 보전에 기여할 수 있는 새롭고 반짝이는 아이디어를 잔뜩 내놓았답니다.
Q. 매미 데이터로 무엇을 알아내셨나요?
매미는 종에 따라 영향을 받는 기상 요인이 다르고 개발된 지역일수록 종 다양성이 낮은 것을 확인했어요. 매미 관측 자료를 통해 기후변화로 매미의 활동기간이 줄어들었다는 것도 알 수 있었지요. 저희는 ‘매미 종 다양성 지수’를 새로운 도시화 지표로 활용 가능하다는 결론을 냈어요.
Q. 특별히 매미를 분석하게 된 계기는요?
자료를 보니 매미 데이터가 세 번째로 풍부했어요. 데이터양이 많아 분석의 신뢰도를 향상시킬 수 있다고 판단했어요. 매미는 기후에 따라 개체 수, 활동 기간에도 영향을 받는 곤충이에요. 그리고 종별로 영향을 받는 기상요인이 달라 각 매미종의 관측 시간과 관측 기간, 분포를 통해 해당 지역과 우리나라 전체의 기후 변화를 예측해 볼 수 있겠다 싶었어요.
Q. 처음 지사탐 데이터를 받아 보셨을 때 어떠셨나요?
데이터양이 풍부하고 퀄리티도 높아 좋았어요. 분석하기 마땅한 데이터가 없는 경우가 많은데, 지사탐 데이터는 그렇지 않았어요. 특히, 시민과학자들이 일상 속에서 마련한 데이터라는 점에서 절대적인 데이터양도 늘릴 수 있어 유의미하다고 생각했어요. 다만, 이미 기후변화 생물지표종*으로 유명한 꿀벌 같은 생물 데이터는 없어서 보다 다양한 종에 대한 데이터가 있다면 어땠을까 하는 아쉬움이 있었어요.
Q. 분석 방법이 궁금해요.
10만 1152개나 되는 데이터들 중에서 매미 데이터만 따로 추출한 후, 분석에 필요 없는 변수는 모두 제거했습니다. 이때 어려움도 있었어요. 데이터가 2020년을 기점으로 관찰 장소에 대한 선택지가 변경되어 데이터 간 불일치가 발생했거든요. 2020년 이후의 데이터는 사용하면 안된다는 측과, 해당 데이터를 버릴 수는 없으니 적절히 합쳐야 한다는 측의 입장이 달라 팀원들 간의 의견 충돌이 생기기도 했죠.
논의 끝에 기간별로 데이터(2018~2019, 2020~2021)를 나눠서 시각화했습니다. 연도-월별 전체 매미 개체 수 변화와 매미 종별 출현 시기, 관측 장소, 기온과 습도에 따른 종별 출현 변화를 막대 그래프, 파이 그래프를 활용해 나타냈습니다. 최종적으로 매미 지도를 만들어 한눈에 매미 종과 관찰 위치를 파악할 수 있게 만들었습니다.
Q. 분석 결과를 보니 어떤 생각이 드셨나요?
개발 정도와 매미 종 다양성 사이에 반비례 경향이 있다는 걸 확인할 수 있었습니다. 인간의 편익을 위한 개발에 생물들이 영향을 받는다는 것을 실감했고 이제라도 생태계를 보전하는 것이 중요하다는 생각을 했어요.
Q. 지사탐 대원들에게 한 말씀 부탁드려요.
탐사시 구체적인 내용들을 적어 주면 지구를 지키는 데 좋은 역할을 해낼 수 있을 거예요. 앞으로도 주의 깊게 동식물들을 관찰하고 그 경험들을 나눠주시길 바랄게요!
*용어정리
기후변화 생물지표종 : 기후변화로 인해 계절에 따라 활동, 분포, 개체군 크기 변화 등이 뚜렷하거나 뚜렷할 것으로 예상되는 종. 이를 지표화한 후 정부에서 지속적인 조사와 관리가 필요하다