d라이브러리









DNA 해독 기술 어디까지 왔나

유전자 해독 기술

오늘날 생명과학은 DNA에서 시작해 DNA에서 끝난다고 해도 과언이 아니다. DNA를 토대로 생명의 비밀을 밝히고 DNA를 토대로 질병의 원인을 찾는다. 하지만 인간이 인간의 DNA를 해독하기 시작한 건 불과 40년 전이고, 모든 염기서열을 읽어낸 건 20년도 채 안 된다. DNA 해독 기술이 매우 빠르게 발전해왔다는 뜻이다. 특히 최근에는 나노기술을 이용해 성염색체 중 X염색체를 99.995%의 정확도로 해독한 연구 결과도 나왔다.

 

미국 산타크루즈 캘리포니아대(UC산타크루즈) 연구팀은 3세대 DNA 해독 기술로 불리는 ‘나노포어 시퀀싱(nano-pore sequencing)’ 등을 활용해  X염색체의 DNA 염기서열을 99.995%의 정확도로 정밀하게 풀었다고 국제학술지 ‘네이처’ 7월 14일자에 발표했다. doi: 10.1038/s41586-020-2547-7


생명과학에 관심이 많은 독자는 이 대목에서 이런 질문을 던질지 모르겠다. X염색체의 DNA 염기서열은 이미 밝혀진 것 아니었던가? 


실제로 미국 국립보건원(NIH) 등 국제 공동연구팀은 1990~2003년 ‘인간게놈프로젝트(HGP·Human Genome Project)’를 진행하며 인간 표준 게놈 지도를 만드는 데 성공했다. 게놈(유전체)은 유전자(gene)와 염색체(chromosome)의 합성어로, 염색체 안에 담긴 유전자를 총칭하는 말이다.

 

 

반복되는 염기서열 해독이 관건 


차이는 정확도다. 모든 생명체의 세포에는 ‘설계도’에 해당하는 유전 정보가 들어있다. 사람의 경우 세포 1개에 유전 정보를 담은 실타래인 염색체가 46개(23쌍) 들어있고, 여기에 돌돌 말려 있는 DNA를 늘어 놓으면 길이가 2m에 이른다. 


DNA는 1953년 영국의 제임스 왓슨과 프랜시스 크릭이 밝힌 것처럼 이중나선 구조를 띠는데, 자세히 보면 아데닌(A), 구아닌(G), 티민(T), 시토신(C) 등 4가지 염기가 쌍을 이뤄 늘어선 형태다. 
유전자는 이런 염기쌍들이 여러 개 모여 하나의 유전 정보를 나타낼 수 있도록 구성된 세트다. 즉, 유전 정보를 해독하려면 DNA 염기서열을 읽어내는 것이 먼저다. 참고로 DNA는 약 30억 개의 염기쌍, 약 2만 개의 유전자로 이뤄져 있다. 


그런데 염색체의 양쪽 말단에 있는 텔로미어(Telomere)나 염색체 중간에 있는 중앙체(Centromere)에는 무수히 많은 반복서열이 존재한다. 길게는 수백만 개 염기쌍으로 이뤄진 염기서열이 반복적으로 자리하고 있다. 


DNA 염기서열을 읽어낸다는 것은 엄밀하게 따지면 염색체의 한쪽 끝에 위치한 텔로미어에서부터 다른 쪽 끝에 있는 텔로미어까지, 반복서열을 포함한 모든 염기서열을 밝히는 작업이다. 이를 ‘텔로미어 투 텔로미어(T2T)’ 게놈 지도라고 한다. 


인간게놈프로젝트에는 1세대 DNA 해독 기술이 쓰였는데, 이 기술로는 T2T 게놈 지도를 완성할 수 없었다. 1세대 DNA 해독 기술은 프레데릭 생어 영국 케임브리지대 MRC 분자생물학연구소 박사가 1977년 ‘미국국립과학원회보(PNAS)’에 처음 발표했다. 이 기술은 복제 과정을 중단시켰을 때 생성되는 DNA 조각을 겔 전기영동법(gel electrophoresis)을 이용해 크기에 따라 줄 세운 뒤 순서대로 염기서열을 읽는다. 


참고로 생어 박사는 이 연구로 1980년 노벨화학상을 수상했는데, 이는 그의 두 번째 노벨상 수상이었다. 그는 인슐린의 아미노산 배열 순서를 포함한 단백질의 구조를 밝혀내 1958년 첫 번째 노벨화학상을 받았다. 


1세대 DNA 해독 장비는 냉장고만큼 컸지만, 한 번에 읽을 수 있는 DNA 염기서열은 300~1000개에 불과했다. 그러다 보니 당시로서는 가장 빠른 컴퓨터를 써도 DNA 염기서열 조각들을 조합해 무수히 많은 반복서열의 순서를 맞추기가 거의 불가능했다. 이 기술을 이용해 2003년 완성된 인간 표준 게놈 지도의 상당 부분은 사실상 빈 공간으로 남아있는 상태였다.


2000년대 초 조지 처치 미국 하버드대 의대 교수는 1세대보다 수천 배 빠른 2세대 DNA 해독 기술인 ‘차세대 염기서열시퀀싱(NGS·Next Generation Sequencing)’을 개발했다. 하지만 반복서열의 염기서열을 채워 넣는 건 여전히 역부족이었다. 


NGS는 DNA를 무작위로 무수히 많은 조각으로 자른 다음, 각 조각의 염기서열을 병렬로 해독하는 방식이다. 이를 통해 짧은 시간에 많은 유전체를 확인할 수 있었고, 개인의 유전체를 분석하는 데 드는 비용을 수억 원에서 100만 원 수준으로 크게 낮췄다. 


하지만 NGS는 150여 개 염기서열로 이뤄진 한 가닥의 짧은 DNA 조각을 다량 생성하기 때문에, 1000개 이상의 염기서열을 읽을 경우 해독의 정확도가 1세대 DNA 해독 기술보다 떨어진다는 단점이 있었다. 30억 개의 염기쌍으로 이뤄진 길고 긴 인간의 DNA 염기서열을 정확하게 읽어낼 수 없었다. 

 

DNA 해독에 나노기술을 더하다


그런데 2010년대 중반 3세대 DNA 해독 기술인 나노포어 시퀀싱이 개발되면서 상황이 달라졌다. 나노포어 시퀀싱의 시작은 앞서 2세대 DNA 해독 기술을 개발했던 처치 교수와 다니엘 브랜턴 하버드대 화학과 교수가 열었다. 


두 연구자는 1995년 기름기가 있는 생체막을 물에 띄우고 그 위에 단백질을 넣어 지름이 nm(나노미터·1nm는 10억분의 1m) 수준인 작은 구멍을 만들면, 막을 중심으로 두 개의 구역이 생긴다는 점에 주목했다. 그들은 나노 구멍 양쪽에 전압을 걸고 구멍 속으로 DNA 염기서열을 통과시키면 통과하는 염기에 따라 전기신호가 달라지는 현상을 활용했다. 전기신호의 차이를 컴퓨터로 분석하면 염기서열을 해독할 수 있었다. 


나노포어 시퀀싱은 이론적으로는 100만 개 염기로 된 한 가닥의 DNA 염기서열을 한 번에 읽어낼 수 있다. 2018년 영국 노팅엄대 연구팀은 227만 개의 염기서열을 한 번에 읽어낸 연구 결과를 발표하기도 했다. 


영국의 유전체 해독 기업인 옥스퍼드 나노포어 테크놀로지스가 개발한 나노포어 시퀀싱 장치인 ‘미니온(MinION)’은 심지어 크기도 작다. 이 회사는 2000년대 초 하버드대 연구팀의 기술 특허를 사들여 2014년 외장 하드 크기의 미니온을 개발하는 데 성공했다. 미니온을 컴퓨터에 연결하면 연구실 밖 현장에서도 간편하게 사용할 수 있다. 


최근 캐런 미가 UC산타크루즈 유전학연구소 교수팀은 미니온을 이용해 인간이 가진 성염색체 중 X염색체의 DNA 염기서열을 해독했다. 연구팀은 155Gb(기가베이스·1Gb는 100만 베이스)에 이르는 막대한 양의 데이터를 확보했다. 특히 확보된 DNA 염기서열 조각들은 절반 이상이 염기 7만 개 이상으로 구성된 매우 긴 조각들이었다. 가장 긴 DNA 염기서열 조각의 길이는 염기가 100만 개에 달했다. 


연구팀은 나노포어 시퀀싱 기술로 얻은 긴 DNA 염기서열 조각과 NGS 기술 등을 활용해 얻은 짧은 DNA 염기서열 조각을 함께 분석했다. 그 결과 그동안 확인되지 않았던 29개의 갭(gap)을 포함한 T2T 게놈 지도를 처음으로 완성했다. 지도의 정확도는 99.995%에 달했다.

 

정확한 게놈지도 필요한 이유 


미가 교수팀이 밝힌 X염색체의 T2T 게놈 지도는 2003년에 완성한 인간 표준 게놈 지도와 비교해 2가지 면에서 장점이 있다. 이것이 한 사람의 인간이 가진 X염색체의 인간 표준 게놈 지도라는 점이다. 2003년에 완성한 인간 표준 게놈 지도는 한 사람이 아닌, 여러 사람의 DNA 염기서열 조각을 분석해 조합한 결과였다. 


또 미가 교수팀이 분석한 X염색체는 ‘가짜로’ 임신한 여성의 자궁 혹 세포에서 추출한 X염색체였다. 여기서 가짜로 임신했다는 것은 핵이 없는 난자에 정자가 수정이 된 경우를 말한다. 발생학적으로 수정란은 부모의 게놈을 절반씩 물려받아야 하지만, 게놈이 없는 빈 난자에 남자(아빠)의 게놈만 들어간 것이다. 이 경우 수정란은 혹으로 자라날 뿐 온전한 배아로 성장하지 못한다. 


결국 연구팀이 사용한 자궁 혹 세포의 X염색체는 정자를 제공한 남자의 X염색체인 것이다. 발생학적으로는 문제가 있는 상황이지만, 그 덕분에 얻은 순수한 염색체가 아니었다면 아무리 나노포어 시퀀싱이라도 T2T 게놈 지도를 만드는 데는 더 오랜 시간이 걸렸을 것이다.  


모든 염색체에 대해 T2T 게놈 지도를 완성해야 하는 것은 아니다. 인간이 가진 2만여 개 유전자에 대한 표준 게놈 지도를 이용해 질병을 일으키는 돌연변이만 집중적으로 연구해도 충분히 인류의 건강을 이롭게 할 수 있다. 


하지만 정밀한 T2T 게놈 지도도 분명히 필요하다. 가령 지구상에 존재하는 수천만 생물종의 T2T 게놈 지도를 완성하면, 바이러스 감염 같은 문제가 발생했을 때 더 빠르고 정확하게 원인을 찾을 수 있다. 


실제로 최근 신종 코로나바이러스 감염증(코로나19) 사태에서 3세대 DNA 해독 기술의 위력이 빛을 발했다. 김빛내리 서울대 생명과학부 교수가 이끄는 기초과학연구원(IBS) RNA 연구단은 미니온 장비로 코로나19를 일으킨 사스코로나바이러스-2(SARS-CoV-2)의 RNA를 빠르고 정확하게 해독해 국제학술지 ‘셀’ 5월 14일자에 발표했다. doi: 10.1016/j.cell.2020.04.011 


각국의 바이오기업들은 이 유전자 지도를 바탕으로 짧게는 수 시간 만에 사스코로나바이러스-2 진단키트를 설계해냈다. 3세대 DNA 해독 기술로 해낼 수 있는 일은 앞으로 더 많아질 것이다. 

 

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2020년 09월 과학동아 정보

  • 박종화 울산과학기술원(UNIST) 생명과학부 교수
  • 에디터

    김진호 기자

🎓️ 진로 추천

  • 생명과학·생명공학
  • 컴퓨터공학
  • 화학·화학공학
이 기사를 읽은 분이 본
다른 인기기사는?