‘구슬이서말이라도 꿰어야 보배’라는 말이 있다. 같은 구슬도 어떻게 꿰느냐에 따라 그 가치가 달라진다. 기존 생물학이 구슬을 만드는 학문이라면 생물정보학(bioinformatics)은 만든 구슬을 가치있게 꿰는 학문이다.
인간 유전자의 염기서열을 비롯해 매년 쏟아져 나오는 생물학 정보는 어마어마하다. 그런데 이런 데이터가 서로 어떻게 연관되는지 거시적인 관점에서 보는 일은 쉽지 않다. 사람이 직접 정리한다면 평생을 바쳐도 불가능한 일. 따라서 전산학이 생물학과 결합해 생물정보학이라는 분야가 탄생했다.
KAIST 바이오정보시스템연구실에서는 생물정보학의 한 분야인 ‘바이오캐드’(bioCAD)를 연구하고 있다. 기계, 건축학에서 설계도를 그리기 위해 캐드(CAD, Computer Aided Design)라는 프로그램을 사용하는 것처럼, 생물학에서는 ‘생물 설계도’를 그리기 위해 바이오캐드를 사용한다. 바이오캐드로 생물의 유전자, 단백질 등의 상호관계를 분석할 수 있다.
세계에서 바이오캐드를 연구하는 실험실이 10여개에 불과할 만큼 이 학문은 새로운 분야다.
설계도에 따라 미생물 만든다
생물학에서는 특정한 목적을 위해 유전자가 변형된 미생물을 만들어야 할 때가 있다. 이도헌 교수는 “예전에는 무작위로 수많은 미생물을 조작해서 그 중 우연히 만들어진 것을 골라냈다면 바이오캐드로 우리가 원하는 미생물을 직접 설계할 수 있게 됐다”고 말했다.
미생물의 설계도를 얻으려면 그 생물에 관한 유전자 발현, 단백질의 기능과 상호작용 등의 데이터가 있어야 한다. 연구실에서는 직접 실험해 얻은 데이터와 다른 과학자가 얻은 기존의 방대한 데이터를 함께 사용한다.
문제는 이 데이터가 얻어진 조건과 정확도가 서로 다르다는 것. 다양한 조건에서 얻은 실험 데이터를 같은 조건으로 맞춰주는 작업이 필요하다. 또 데이터 사이의 규칙성을 찾아내고 이들을 어떻게 연결할지 판단하는 복잡한 과정이 필요하다. 바이오캐드의 ‘데이터마이닝’(data mining)과 ‘인포메이션퓨전’(information fusion) 모듈을 사용하면 이 작업을 더 쉽게 할 수 있다.
모든 데이터들이 같은 조건으로 맞춰지면 상호관계를 분석한다. 이 작업은 바이오캐드의 모넷(MONET, MOdularized NETwork learning)이라는 모듈이 담당한다. 수많은 데이터를 처리해야 하기 때문에 슈퍼컴퓨터는 필수다.
결과물에는 분석한 유전자와 단백질 등이 명령체계에 따라 배치되고 상호관계가 선으로 표시된다. 둘 사이의 선이 굵을수록 긴밀한 관계를 맺고 있다는 뜻이고 화살표는 명령의 흐름을 말한다. 이렇게 얻어진 결과물을 기존 생물학과 비교해 믿을만한지 판단해서 설계도로 삼는다.
설계도에서 변형해야 하는 유전자를 찾아보면 그 유전자에 영향을 미치는 주변의 유전자와 단백질이 한눈에 들어온다. 어떤 유전자를 조작해야할지, 그 유전자를 변형했을 때 어떤 영향이 있을지 파악해 전략을 세울 수 있다.
연구실에서 설계도를 만들면 KAIST 생명화학공학과 이상엽 교수는 이 설계도를 사용해 유전자가 변형된 미생물을 만든다. 앞으로 미생물보다 더 복잡한 생물의 설계도를 그려낼 예정이다.
생물, 전자, 기계, 컴퓨터가 융합된 퓨전생물학
연구팀은 바이오캐드를 사용해서 삼성병원과 함께 암 연구를 진행 중이며 신경회로를 분석하는 ‘사이버네틱스’를 독자적으로 연구하고 있다. 이 교수가 속한 바이오시스템학과는 생물, 전자, 기계, 컴퓨터를 융합한 학과다. 이 교수는 “미래에 국가경쟁력을 가지려면 최고 분야가 있어야 한다”며 “생물정보학 같은 퓨전생물학은 이제 막 태동한 분야인만큼 우리가 세계 최고가 될 수 있다”고 강조했다.