d라이브러리









왜 통계물리학자가 단백질 연구에 매달릴까

입체 구조의 생성 비밀 근본부터 밝힌다

전통적으로 생명과학자의 연구 대상인 단백질이 통계물리학자의 관심사가 되고 있다. 생명현상의 수수께끼인 단백질의 3차원 구조 문제를 해결 하기 위해서다. 그들은 단백질 구조에 대한 실험적 방법의 한계를 극복하고 근본적인 이해를 위해 통계물리적 접근을 시도한다.

지난해 2월 인간 게놈을 이루는 약 30억개의 DNA 염기서열 지도가 발표되자 전세계 과학자, 지식인, 기업인들의 관심사가 되고 있다. 인간 게놈지도 완성의 중요성은 종종 1969년 인류의 첫 달 착륙과 비교되는데, 인류에 미칠 파급효과는 훨씬 더 크리라 예상되고 있다.

이제 인간 게놈지도의 정보를 이용해 생명 현상의 수수께끼인 단백질의 3차원 구조에 대한 문제를 본격적으로 연구해야 할때다. 그런데 ‘단백질 접힘’이라고 불리는 단백질 구조에 대한 문제가 최근 들어 물리학자, 특히 통계물리학자의 중요한 연구대상이되고 있다. 전통적으로 생명과학자의 연구 대상이었던 단백질을 왜 통계물리학자가 연구하려는 것일까.

실험적으로 밝혀진 1%

단백질은 20가지 아미노산으로 구성돼 있으며 생명체의 모든 효소와 항체, 상당수의 호르몬 등으로서 생명을 유지·제어하는 모든 화학반응에 관여한다. 그럼으로써 생명체에서 가장 중요한 역할을 하는 거대분자다.

단백질이 생체 내의 다른 거대분자와 다른점은 자기 고유의 역할을 수행하기 위해서 반드시 자기 자신만의 고유한 모양으로 있어야 한다는 것이다. 즉 각 단백질은 자기 고유의 모양 하나씩을 갖고 있고, 만약 그렇지 못하면 그 기능을 잃게 되며 잘못된 모양으로 있을 경우 질병으로 발전하게 된다. 알츠하이머병처럼 우리가 알고 있는 상당수 질병이 바로 단백질의 구조 이상에서 비롯된다. 때문에 많은 과학자들이 단백질의 3차원 구조를 밝혀내는 일에 매달리고 있다.

문제는 인간이 갖고 있는 10만여개 단백질의 3차원 구조를 밝히는 일이 그리 만만치 않다는 것이다. 현재 과학자들이 단백질의 3차원 구조를 얻는 가장 정확한 방법은 X선 결정학이다. 지금까지 구조가 밝혀져 단백질 데이터은행(PDB, www.rcsb.org/pdb)에 수록된 인간을 비롯한 다양한 생물의 1만8천여개 단백질의 구조가 대개 이 실험적 방법으로 얻어졌다.

그러나 이 방법으로 구조를 밝히기 위해서는 단백질의 결정을 만드는 어려운 작업이 필요하다. 이 작업은 상당한 시간과 비용이 소요된다. 때문에 실험적인 방법만으로 사람이 갖는 10만여개 이상의 단백질을 알아내기란 역부족이다.

사람 단백질 중 구조가 밝혀진 것은 고작 1% 미만으로 나머지 99%에 대해서는 앞으로 연구해야 할 과제로 남아있다. PDB에 수록된 인간 단백질의 개수는 1천여개도 안된다. 이 나머지를 실험만으로 결정하려면 앞으로 수십년 이상이 걸릴지 모른다. 따라서 실험을 통하지 않고 이론과 이에 바탕을 둔 계산으로 단백질의 구조와 기능을 예측하는 연구가 활발히 진행되고 있다.

그렇다면 단백질의 구조를 밝히는 이론적인 방법에는 어떤 것들이 있을까. 현재 단백질 3차원 구조를 예측하는 방법에는 세가지가 있다. 상동성 모형화(homology modeling), 엮기(threading), 그리고 아비니시오(abinitio) 방법이다.

상동성 모형화는 지금까지 실험으로 밝혀진 PDB에 수록된 단백질의 구조를 살펴보면 아미노산 서열이 유사한 단백질들의 경우 구조 역시 비슷하다는 점에 근거를 둔 방법이다. 구조를 밝혀야 할 단백질의 아미노산 서열과 이미 PDB에 구조가 밝혀진 단백질의 서열이 매우 비슷할 경우(상동성이 높을 경우), 밝혀진 단백질의 구조를 이용해 목표 단백질의 구조를 예측할 수 있다.

엮기 방법은 다음 두가지 점에 바탕을 둔다. 첫째 PDB에는 1만8천여개의 단백질이 수록돼 있지만 그 중에는 크게 봐서 단지 수백여개의 독특한 구조만 있다는 점이다. 둘째로는 아미노산 서열 상동성이 높지 않은 경우에도 3차원 구조가 매우 비슷한 단백질들이 많다는 점이다.

따라서 이 방법은 밝혀야 할 단백질의 구조가 이미 PDB에 수록된 독특한 구조들 중 하나라는 가정에서, 이미 알고 있는 PDB의 단백질 구조 중 어디에 속하는지 알아내는 방법이다. 목표 아미노산 서열을 이미 알려진 구조에 끼워 맞춰(threading) 가장 높은 점수를 주는 구조를 골라낸다.
 

지난해 2월 발표된 인간 게놈지도는 생명의 그림자일 뿐이다. 생명현상의 수수께끼인 단백질의 3차원 구조에 대한 문제는 인간 게놈지도 완성의 성과를 이 용해서 본격적으로 연구되기 시작했다


‘처음부터’ 원리 파고드는 아비니시오

그러나 이 두 방법으로는 이미 알려진 PDB 구조 외의 다른 구조를 가진 단백질에 대해서는 속수무책이다. 게다가 이들 방법은 단백질 접힘에 대한 근본적인 이해와는 거리가 있다.

이는 천문학과 물리학의 초기 발전과정과 비슷한 상황이다. 케플러와 그 이전 과학자들의 천문 관찰을 돌이켜 생각해보면 이들은 행성 주기의 현상 등에 대한 관찰을 바탕으로 여러 법칙을 만들어낼 수 있었다. 하지만 고전역학의 완전한 이해가 이뤄진 것은 뉴턴의 운동역학이 발표되면서였다.

마찬가지로 물리학자는 경험적인 수준에서 벗어나 단백질 구조에 대한 근본적인 이해를 위한 연구를 수행하고 있다. 이를 위해 통계물리학적 방법이 이용되는 것이다. 이것이 바로 단백질 구조 해명에 대한 세번째 이론적 방법인 아비니시오다. 아비니시오는 라틴어로‘처음부터’란 뜻을 갖는데, 원리로부터 시작해 문제를 풀어나가는 방법인 셈이다.

아비니시오 방법을 구체적으로 알아보기 전에 우선 대다수 사람들에게 낯선 통계물리에 대해서 간단히 짚고 넘어가자. 통계물리란 많은 입자로 이뤄진 복잡한 계를 연구할 때 주로 사용되는 학문이다. 전통적으로 통계물리는 열역학에 대한 연구에 주로 쓰였다. 예를 들어 기체에 대해 연구할 때 모든 분자 하나하나의 미시적인 움직임을 일일이 파악하기보다는 전체 계의 거시적인 성질, 즉 온도나 압력 등을 통계적인 방법으로알아낸다.

최근에는 이같은 통계적인 접근법이 여러 복잡한 문제를 푸는 수단이 되고 있다. 주가변동이나 지진 발생 주기와 같은 확률론적 현상이나, 카오스와 같은 해석학적 방법으로 풀수 없는 복잡한 문제를 해결하는데 통계적 방법이 이용되고 있다.
 

온도 조건에 따라 자유 에너지가 달라 진다는 의미다. 이 점이 단백질 3차원 구조를 밝히는데 이용되고 있다.


상온에서 물이 액체인 까닭

단백질 구조 규명에는 통계물리가 어떻게 이용될까. 미국의 생화학자 크리스찬 안핀센은 1950년대 말부터 1960년대 말에 걸쳐 리보핵산가수분해효소(ribonuclease)라는 단백질의 실험을 통해 단백질의 3차원 구조가 아미노산의 서열만으로 결정된다는 점을 밝혔다. 그는 시험관 안에서 생리학적 환경조건을 바꾸면 리보핵산 가수 분해 효소의 생체내 3차원 구조가 풀려서 제멋대로 되고(unfolding), 생리학적 환경조건을 다시 원상 복구하면 그전의 생체 내 자기 고유의 구조로 되돌아가는(refolding) 실험을 수행했다.

이때 안핀센은 열역학적 가설을 세웠다. 이가설에 따르면 단백질이 선택하는 3차원 구조는 주어진 생리학적 환경조건에서 계의자유 에너지가 가장 낮은 구조다. 통계물리에서 어떤 상태의 자유 에너지가 가장 낮다는 개념은 확률적으로 그 상태가 일어날 가능성이 가장 높다는 뜻이다. 예를 들어 상온에서 물이 얼음으로 있지 않고 물로 있는 것은 얼음으로 있을 수도 있지만 물로 있는 상태가 자유 에너지가 가장 낮은 상태이기 때문이다. 안핀센은 이 공로로 1972년 노벨화학상을 수상했다.

안핀센의 열역학 가설은 단백질 구조 문제해결에 통계물리적인 접근이 가능하도록 했다. 어떤 계에 대한 자유 에너지가 가장 낮은 상태는 오랫동안 통계물리학의 연구대상이었기 때문이다. 그래서 안핀센의 열역학 가설 정립 이후, 통계물리학자들은 단백질 분자를 이루는 원자 사이의 상호작용 에너지를 기술하고, 전체 계의 에너지를 단백질 분자 3차원 구조의 함수로 서술한 다음, 전체 에너지의 최소값을 구함으로써 주어진 단백질의 고유 구조를 구하려고 시도했다.

그러나 단백질의 에너지 함수의 지속적인 개발과 최근 20-30년동안 이뤄진 눈부신 컴퓨터 속도 발전에도 불구하고 안핀센의 열역학 가설에 근거한 방법은 최근까지 이렇다할 성과를 거두지 못하고 있다. 그 까닭은 단백질을 기술하는 에너지 함수들의 형태나 매개변수들이 아직 정확하지 않기 때문이다.

펨토초로 세도 우주나이 이상 걸려

에너지 함수만이 문제는 아니다. 단백질의 구조를 기술하는 에너지 함수를 구했다 해도 곧바로 자유 에너지가 가장 낮은 상태를 얻을 수 있는 것이 아니다.

한개의 아미노산에는 대략 10가지 정도의 다른 구조가 가능하다. 따라서 1백개의 아미노산으로 만들어진 단백질이 수학적으로 가질 수 있는 구조의 수는 ${10}^{100}$으로 천문학적인 숫자다. 이 중에서 자유 에너지가 가장 낮은 상태를 과연 찾을 수 있을까.

만약 한가지 구조를 찾는데 걸리는 시간을 1펨토초(${10}^{-15}$초)일정도로매우짧다면, 이모든 가능한 구조 중에서 해를 찾는데 걸리는 시간은 무려 ${10}^{85}$초로 약 ${10}^{18}$초인 우주 나이와 비교할 때 어마어마하게 긴 시간이다. 일반적으로 단백질은 1백50-2백개의 아미노산을 갖는다. 따라서 단백질이 가질 수 있는 모든 모양을 일일이 세 그 중에서 자유 에너지가 가장 낮은 구조를 찾는 방법으로는 실제 생체 안에서나 시험관안에서 수초 내지 수분만에 단백질이 자기 모양으로 접히는 것을 설명할 수없다. 이것을 레빈탈 패러독스(LevintalParadox)라고부른다. 이 패러독스의 명칭은 이를 처음으로 제기한 미 컬럼비아대 사이러스 레빈탈 교수의 이름을 따 붙여졌다.

단백질의 레빈탈 패러독스는 이미 수학에서 오래 전부터 다뤄왔던 최적화 문제의 결정판에 속한다. 수학에서 세일즈맨이 N개의 도시를 거쳐 다시 출발지로 돌아올 때 그가 선택할 수 있는 여정은 (N-1)!/2가지다. 이 중에서 가장 최단거리의 여정을 찾는 문제는 아직 해결되지 않았다.

통계물리학적으로 레빈탈 패러독스를 극복하기 위해 다양한 최적화 방법들이 개발되고 있다. 그 중에서 가장 보편적인 방법은 외부환경 온도를 변화시킴으로써 가장 낮은 자유 에너지 상태를 얻는다는 것이다. 이 방법은 화산폭발시 지표면에 드러나는 마그마가 식으면서 결정을 형성할 때 식는 속도에 따라 암석을 구성하는 결정의 크기가 달라진다는 점에서 착안됐다. 마그마가 순식간에 식어 암석으로 굳을 때는 암석을 구성하는 결정의 크기가 작다. 그러나 마그마가 천천히 식으면 결정 크기는 커진다. 그런데 자유 에너지는 결정의 크기에 따라 정해진다. 따라서 외부 온도조건의 변화에 따라 자유 에너지를 기술할 수 있는 함수를 개발하면 가장 낮은 자유 에너지 상태를 구할 수 있다. 암석이 가질 수 있는 여러 상태를 일일이 세지 않고 외부 조건의 변화에 따른 자유 에너지 상태를 기술함으로써 좀더 쉽게 해를 구할 수있다.

실제로 이같은 최적화 방법을 단백질에 적용하려는 연구가 한창 진행중이다. 단백질의 외부 온도를 높은 상태에서 점점 낮추면서 가장 낮은 자유 에너지를 갖는 때를 찾는 이론적인 방법을 개발하고 있다.

결국 통계물리학적인 방법에 기초한(즉 안핀센의 열역학 가설에 근거를 둔) 아비니시오 방법이 성공하려면 정확한 에너지함수를 구하고, 이 함수로 기술되는 단백질의 모양을 효과적으로 탐색할 수 있는 최적화 방법을 개발하는 작업이 필요하다. 이 두 문제가 동시에 풀려야만 단백질 3차원 구조의 접힘에 대한 근본적인 이해와 이에 따른 단백질의 3차원 구조 및 기능 예측도 가능해진다.
 

물리학자들은 단백질 구조 문제를 근본적으로 들여다보기 위해서 다양한 이론적인 방법을 연구하고 있다. 이 연구에는 슈퍼컴퓨터가 쓰이기도 한다.


국내 연구팀으로는 고등과학원이 유일

아쉽게도 물리학적 방법에 기초한 아비니시오 방법은 현재까지 경험에 바탕을 둔 다른 두 방법에 비해 그다지 좋은 결과를 내지 못해 왔다. 하지만 다행히도 몇몇 단백질의경우 상동성 모형화나 엮기에 의한 예측보다 더 정확한 단백질 구조가 아비니시오 방법에 의해 구할 수 있다는 연구결과가 1998년과 2000년에 나오기 시작하면서 단백질의 3차원 구조 예측에 새로운 전기를 맞고 있다. 앞으로 이 방면 연구 발전의 귀추가 주목된다.

물리학이란 소립자, 초전도, 광학, 상전이와 같은 연구분야에 국한돼 정의되는 것이 아니다. 어떤 자연현상이건 그것을 과학적인 도구와 이론을 사용해 설명할 수 있는 근본적인 원리를 찾고자 추구하는 학문이다. 이런뜻에서 통계물리학이 단백질 접힘 문제에서 시뮬레이션, 최적화 방법 등으로 생명현상의 근본을 풀어나가는데 쓰이고 있으며, 단백질 접힘 문제의 원리규명을 통해 생명에 대한 근본적인 이해와 인류복지에 이바지하리라 기대된다.

현재 전세계에서 단백질 구조를 이론적으로 예측하는 연구팀은 2백개 이상으로 추정 된다. 통계물리학자를 포함한 여러 분야의 연구자들의 참여가 늘어나면서 이 중 아비니시오 방법을 연구하는 팀은 약 50개로 큰 부분을 차지하고 있다.

그러나 국내에서는 통계물리학의 이론과 대규모 컴퓨터 계산을 통해 단백질 접힘 문제와 같은 생명활동의 근본문제를 이해하려는 연구팀은 고등과학원 연구진이 유일하다. 그 이유는 이 문제를 풀기 위해서 통계물리학뿐 아니라 전산과학과 생명정보학 등 여러 지식을 필요로 하는데, 이런 학계 간 연구를 수행할 인력이 국내에 부족하기 때문이다. 국내의 참된 생명기술 분야의 발전을 위해서 단백질 접힘 연구팀에 대한 지원은 물론, 이분야의 우수한 젊은 과학자의 지속적인 육성이 시급한 때다.

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2002년 10월 과학동아 정보

    🎓️ 진로 추천

    • 생명과학·생명공학
    • 물리학
    • 컴퓨터공학
    이 기사를 읽은 분이 본
    다른 인기기사는?