d라이브러리









생명정보학, 게놈 데이터 더미에서 보석 캔다

염기서열 해독 비용 떨어지지만 게놈 해석 비용은 커져


최근 ‘개인게놈’이라는 말이 여기저기서 나오기 시작하면서 궁금해 하는 사람들이 많다. 2000년 6월 인간게놈 초안이 완성됐다고 발표됐을 때 앞으로는 포스트게놈(post genome) 시대가 열릴 것이라고들 했는데, 개인게놈은 포스트게놈의 한 종류일까. 그렇기도 하고 안 그렇기도 하다. 개인게놈은 인간게놈프로젝트 완성 이후(post)에 나타난 용어이므로 글자 그대로 해석하면 포스트게놈이라고 볼 수 있다. 그러나 당시 사람들은 포스트게놈이란 말을 주로 ‘유전자 정보의 산물인 mRNA나 단백질을 게놈처럼 총체적으로 연구한다’는 의미로 썼다. 따라서 한 사람 한 사람의 게놈 정보 전체를 알아내 활용하는 개인게놈 시대에 대한 비전은 없었다.

당시 사람들이 개인게놈 시대를 진지하게 생각하지 않았던 이유는 한 사람의 게놈 전체를 분석하는 비용이 수천억 원에 이르러 이 비용이 개인게놈 시대가 현실화될 수 있는 100만 원대로 내려가려면 수십 년이 걸릴 것이라고 봤기 때문이다. 그러나 모든 전문가들이 이렇게 생각한 건 아니다. 몇몇 과학자들은 근본적인 기술혁신이 가능하다는 믿음으로 새로운 염기서열 해독방법 개발에 몰두했고 불과 10년이 지난 지금 수천만 원에 한 사람의 게놈 전체를 해독하는 상용 서비스가 제공되는 시대를 맞았다.
 

큰그림 보러가기


3세대 염기해독기 개발 한창

1953년 제임스 왓슨과 프랜시스 크릭이 DNA이중나선구조를 밝혔을 때만 해도 DNA염기서열을 해독한다는 건 해결하기 어려운 난제로 보였다. 그런데 20여 년 뒤 영국의 생화학자 프레드릭 생어 박사가 훗날 생어기법으로도 불리는 다이디옥시법(dideoxy method)이라는 기발한 방법을 고안해내 DNA염기서열이 본격적으로 밝혀지기 시작했다. 비슷한 시기 미국 하버드대의 월터 길버트 교수팀도 화학적으로 염기서열을 해독하는 방법을 개발하긴 했지만 너무 복잡해서 생어의 방법에 밀렸다.

1978년 생어 박사팀은 5386개의 DNA염기로 이뤄진 파이X 174 바이러스의 게놈을 생어기법으로 완전 해독했다. 이후 생어기법은 현대 생물학의 혁명을 이끄는 게놈분석의 기초가 됐다. 1990년 시작돼 2003년 완성된 인간게놈프로젝트도 생어기법을 사용했다. 프로젝트가 진행되면서 자동화, 소형화를 통해 염기해독 비용을 낮추고 해독 속도를 높였지만 이런 ‘개선’만으로는 해독에 드는 천문학적 비용을 낮추는 데 한계가 있었다.

길버트 교수의 수제자로 1970년대부터 DNA염기서열해독법을 연구해온 현 하버드대 의대 조지 처치 교수는 또 바이러스 단백질 구멍을 이용해 염기서열을 해독하는 법 등 많은 방법을 고안해 염기서열해독 관련 세계 최고의 경험과 기술을 갖고 있다. 처치 교수는 1998년 이미 한 사람의 개인 유전체를 해독하는 데 하루면 가능한 기술에 대한 개념을 갖고 있었고, 그의 연구결과는 사람들이 새로운 염기서열 해독기를 개발하는 데 지대한 영향을 미쳤다.

차세대 해독기는 1세대 해독기에 적용된 생어의 방법과는 다른 원리를 통해 염기서열을 해독한다. 차세대 해독기는 작동 원리에 따라 몇 가지 종류가 있는데, 라이프 사이언시스사(현재 로쉬사에 합병됨)의 454는 최초로 상용화된 차세대 해독기로 2007년 제임스 왓슨의 게놈을 4달에 걸쳐 약 17억 원에 해독했다. 2010년 현재 차세대 해독기는 한 사람의 게놈을 한 달만에 5000만 원의 비용으로 해독하는 수준이다. 이런 발달 속도는 컴퓨터 칩의 집적도 발달 수준을 훨씬 상회한다. 이렇게 비용을 떨어뜨릴 수 있었던 가장 큰 원인은 나노기술을 활용해 해독 과정에서 DNA 합성과 연결을 한꺼번에 수백만 회 일어나도록 했기 때문이다.

최근에는 3세대 해독기라고 불리는 단분자서열해독기(single molecule sequencer)가 활발히 개발되고 있다. 기존 방법은 신호를 얻기 위해 DNA분자 수를 늘려야 하기 때문에 ‘증폭’과정이 필요하지만 DNA분자 하나에서 염기서열 정보를 읽을 수 있는 초감도 센서가 달린 3세대 해독기에서는 이 과정이 필요 없다.

서열해독기가 이처럼 눈부시게 발전한 덕분에 사람들의 게놈을 한꺼번에 해독해서 서로 비교할 수 있게 됐다. 게놈 비교가 왜 중요할까. 생물의 본질은 그 다양성에 있기 때문이다. 이 다양성이 지구 전체의 생명현상을 뒷받침하고 있고, 진화의 원동력이 된다. 다양성에 대한 분자차원의 메커니즘은 생명체 게놈의 변이로 설명할 수 있다. 인간 게놈 전체의 변이를 서로 비교하면, 정상인과 환자, 동양인과 서양인처럼 특성이 서로 다른 사람들의 차이를 정밀하게 분석해 그 유전적 원인을 찾을 수 있다.

이것은 마치 자동차 두 대를 비교할 때, 모양을 보고 분해하고 화학실험을 해 서로 어떻게 다른가를 연구하는 것이 아니라, 그 둘의 설계도를 보면서 차이점을 찾는 일과 같다. 이제 게놈의 변이 연구를 통해 생명현상을 분석, 설계, 조작, 합성하는 일은 시간문제로 보인다.


정보기술로 게놈에서 질병 관련 유전자 찾는다

그런데 게놈의 염기서열을 다 해독했다고 해서 게놈 정보가 분석돼 나오는 것은 아니다. 2000년 6월 인간게놈 초안이 발표됐을 때 이 성과를 가능케 한 가장 핵심 원동력은 당시 셀레라사의 크레이그 벤터 박사가 이용했던 산탄총기법을 활용한 해독법이었다. 이 방법의 핵심은 생물학이 아니라 정보기술(IT)이었다. 이 기법으로 해독된 수십억 개의 DNA 조각들을 컴퓨터로 조합해 완전한 게놈염기서열로 배치할 수 있는가가 프로젝트 성공 여부를 결정할 마지막 고비였다. 게놈의 염기서열에서 유전자 개수 같은 유용한 정보를 추출해내는 일도 물론 정보기술이 적용된다. 이런 과정을 연구하는 분야를 ‘생명정보학(bioinformatics)’라고 부른다.

서열 해독기술 발전 상황을 보면 컴퓨터 산업의 변화가 떠오른다. 최초의 컴퓨터가 나왔을 때 한 대를 만들기 위해 수년간 수백억 원이 들었는데, 지금은 수십만 원만 주면 날 집채만 한 컴퓨터보다 1000배, 1만 배 더 성능이 좋은 컴퓨터를 살 수 있다. 하지만 수십만 원짜리 컴퓨터에서 작동하는 소프트웨어 가운데 비싼 건 수천만 원이나 한다.

싼 값에 해독된 인간 게놈 데이터를 제대로 활용하기 위해 생명정보학으로 분석하는 데 현재 수천만 원이 들지만 미래에는 그 비용이 더 올라가리라고 예측한다. 왜냐하면 앞으로 서로 비교해야 할 게놈의 수가 더 늘어나고, 분석하는 데 필요한 소프트웨어의 가격도 올라갈 것이기 때문이다. 초창기인 지금은 공짜로 쓸 수 있게 공개된 프로그램도 머지않아 돈을 내고 써야 하는 날이 올 것이다.


10년 뒤, 많은 사람들이 자신의 게놈 데이터를 신용카드나 USB메모리에 넣고 다니는 날이 왔을 때, 그 정보를 병원 같은 곳에서 이용하려면 엄청난 양의 정보를 빠른 시간 내에 분석할 수 있는 인프라를 구축해야 한다. 서열해독이 싸질수록, 즉 처리해야 할 데이터가 급증할수록 심각한 병목현상이 일어나 생명정보학 분석은 더욱더 중요해질 것이다. 현재 많은 유전체학 전문가들이 이구동성으로 하는 말이 있는데, 생명정보학이 개인게놈 시대의 핵심이라는 점이다. 중국과 같은 게놈 분야 선진국은 국가적으로 이런 생명정보학의 중요성을 일찍부터 알고 지원해왔다. 그 결과 베이징게놈연구소(BGI)에만 400명의 생명정보학 연구자가 일하고 있다. 이는 우리나라 전체 생명정보학 연구자보다 많은 수다.

생명정보학은 근본적으로 생명을 정보처리 현상으로 이해한다. 따라서 게놈도 생명정보학에서는 정보의 덩어리에 불과하다. 단지 그 정보의 덩어리가 자체의 법칙을 따르고 네트워크를 형성하는 복잡한 대상이라는 점이 특이할 뿐이다. 생명정보학에서 중요한 작업은 정보를 ‘지도화’하는 일이다. 게놈은 그런 지도 중에서도 가장 중요한 지도다. 게놈 지도가 완성되면, 질병을 일으키는 변이가 어디에 있는지, 구체적으로 어떤 변이인지 등이 적나라하게 나온다. 생명정보학자는 알려지지 않은 생명현상 세계의 ‘지도’를 만드는 사람이다. 생명정보학은 어마어마한 양의 정보를 다루므로 분석을 자동화하는 프로그램을 개발하는 일이 가장 핵심이다.

생명정보학은 한 사람당 60억 염기쌍이나 되는 60억 명 지구촌 사람들의 게놈을 분석한 뒤 생명현상의 메커니즘을 정보의 관점에서 파악해 컴퓨터에 저장하고 활용하는데 핵심 역할을 할 것이다. 개개인의 모든 게놈과 특성을 지도화하며, 그것에 기반해 새로운 유전자의 설계, 합성, 조작을 하는 것은 생명정보학의 주요 작업이며, 사실은 생물학의 미래이자 주업이 될 것이다. 생명정보학이 생물학이고, 생물학이 생명정보학이라는 말이 나오는 이유다.



▼관련기사를 계속 보시려면?

2010 개인게놈 시대 개막 선언
생명정보학, 게놈 데이터 더미에서 보석 캔다
개인게놈 시대 미리 맛보기

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2010년 06월 과학동아 정보

  • 박종화 테라젠 바이오연구소 소장 기자

🎓️ 진로 추천

  • 생명과학·생명공학
  • 컴퓨터공학
  • 의학
이 기사를 읽은 분이 본
다른 인기기사는?