“5년 뒤 미래를 엿볼 수 있는 방법이 없을까?”
상상만으로도 꽤나 달콤한 질문입니다. 누군가는 미래를 예측해 주식에 투자해 큰 돈을 벌 것이고, 다른 이는 진로를 현명하게 결정하는 데 활용할 것입니다.
과학동아와 한국과학기술정보연구원(KISTI) 글로벌R&D분석센터는 질문에 답하기 위해 머리를 맞댔습니다. 그리고 이런 답을 내렸습니다.
“앞으로 연구 트렌드를 이끌어갈 분야를 찾아보자!”
논문 기반 데이터 세트 중 세계에서 가장 신뢰 받는 네덜란드 라이덴대의 최신 데이터 세트를 기반으로 말입니다.
4159개 데이터 속 진주를 찾아서
네덜란드 라이덴대 과학기술연구센터(CWTS)는 매년 누적된 출판 논문을 분석한 데이터(라이덴대 클러스터)를 공개합니다. 글로벌 학술정보기업 ‘클래리베이트’가 제공하는 데이터베이스인 ‘웹오브사이언스(WOS)’에 지금껏 등재된 모든 논문을 분석한 결과입니다. 박진서 KISTI 글로벌 R&D분석센터장은 “라이덴대 클러스터는 논문 기반 통계에서 최고의 권위와 신뢰성을 갖는다”며 “대부분의 연구 분석에 이 데이터가 활용된다”고 말했습니다.
라이덴대 클러스터는 각 논문의 인용 관계를 분석해 연구 분야를 분류해 놓은 데이터 세트입니다. 올해 라이덴대 연구팀은 총 5개의 대분야와 254개의 중분야(WOS 카테고리), 4159개의 소분야로 논문을 분류했습니다. 소분야 별로 2000년~2021년 발행된 전체 논문 수, 논문의 평균 발행 연도, 논문이 출판된 주요학술지와 논문에 쓰인 주요 용어 등을 확인할 수 있습니다.
가령 총 6만 1091편으로 가장 많은 논문이 발표된 소분야에는 ‘전기석’ ‘부쉬벨트 복합체’ ‘카보나타이트’ 등 광물학에서 많이 쓰이는 키워드가 포함됩니다. 희귀 광물을 연구한 분야에서 지금껏 가장 많은 논문이 발표됐다는 것을 알 수 있습니다. 박 센터장은 “이런 방법을 통해 4159개의 소분야의 세부 데이터를 분석하면 그 중에서 눈에 띄는 분야를 찾아낼 수 있다”고 말했습니다.
요즘 가장 유행하는 연구는?
5년 뒤 트렌드를 알기 위해서는 최근 연구가 급격히 늘고 있는 분야를 살펴 볼 필요가 있습니다. 이준영 KISTI 글로벌R&D분석센터 책임연구원은 “논문의 발행 연도를 비롯한 지표로 연구 트렌드를 이끌어 갈 분야를 찾아볼 수 있다”고 말했습니다.
가령 논문의 평균 발행 연도가 가장 최근인 소분야는 주로 환경오염과 관련된 연구였습니다. 논문은 2081편으로 적은편 이지만, 최신 연구가 많은 만큼 앞으로 그 중요성은 더 높아질 전망입니다.
앨런 포터 미국 조지아공대 교수는 논문의 초록을 바탕으로 새로운 기술이 많이 등장하는 ‘출현 점수(emergence score)’를 제시한 바 있습니다. 이 책임연구원은 “라이덴대 클러스터를 분석해 5년 뒤 트렌드를 이끌어 갈 연구분야의 점수체계를 만들어 볼 수도 있을 것”이라며 “이외에도 다양한 자료를 활용해 연구 분야를 분석해 볼 수 있다”고 말했습니다.
물론 과거의 데이터만으로 현재와 미래를 정확히 분석해내는 것은 어렵습니다. 또 데이터 자체는 객관적이지만, 분석하는 입장에서는 주관적인 기준이 개입하기도 합니다. 박 센터장은 “데이터 연구자들은 항상 책임있는 사용(responsible use) 원칙을 따르려고 노력한다”며 “사용자 입장에서는 분석 결과를 맹신하기보다는 미래를 내다보는 새로운 관점이자, 참고자료로 활용하는 것이 바람직하다”고 말했습니다.