컴퓨터를 사용해 단백질 구조형성 문제를 해결하기 위한 일반적 접근방법은 다음의 두가지 단계로 크게 나눌 수 있다.
첫째는 단백질의 구조를 간략히 표현하는 방법이다. 단백질은 몇가지 규칙적인 2차구조를 제외하고는 어떤 구조도 가질 수 있다. 단백질의 3차구조들을 모아 놓은 자료(PDB, protein data bank)를 보면 단백질의 구조가 얼마나 복잡한지 알 수 있다. 이렇게 복잡한 단백질의 구조 문제를 해결하기는 아직 불가능하다. 그래서 많은 과학자는 단백질의 구조를 좀더 단순화시켜 가상적인 단백질 모델을 개발했다. 대표적 모델이 ‘격자 모델’(lattice model)과 ‘비격자 모델’(off-lattice model)이다. 격자 모델은 컴퓨터 상의 3차원 정육면체 공간에 아미노산을 단순화시켜 배열하는 방법이고, 비격자 모델은 격자로 구성되지 않은 자유공간에서 단백질을 입체적으로 표현하는 방법이다. 양자 모두 컴퓨터 프로그램을 이용해 단순한 단백질 모델을 구현한다.
두번째는 수많은 단백질의 구조 중 에너지적으로 가장 안정한 구조 즉, 자연계에 존재하는 구조를 설명할 수 있는 화학적 규칙이나 기준을 만드는 일이다. 많은 과학자는 가장 안정한 단백질 구조를 찾는 것이 구조 문제의 해답이라고 믿고 있다. 그래서 단백질 구조의 안정한 정도를 적절히 표현할 수 있는 기준을 정하려 한다.
대표적 기준으로는 아미노산 곁가지들 사이의 ‘정전기적 상호작용’(coulomb interaction)과 ‘수소 결합’(hydrogen bonding), ‘중성 분자간의 약한 인력’(van der Waals forces) 등이 있다. 이들을 모두 고려한 프로그램을 사용하면 화학적으로 가장 안정된 단백질 구조를 찾을 수 있다.
첫번째 단계에서 단백질 구조를 단순화시켜 가상적인 단백질 구조를 만든다. 이렇게 만들어진 각각 구조들의 안정도를 두번째 단계에서 정한 화학적 기준을 적용해 측정한다. 그래서 가장 안정하다고 생각되는 구조를 해답으로 택한다. 하지만 격자 모델과 같은 단순하고 가상적인 단백질 구조 모델을 사용한다 해도 만들어질 수 있는 가능한 구조 수는 천문학적이다.
이 문제를 해결하기 위해서 과학자들은 가능한 모든 구조에 대해 안정도를 측정하지 않고도 가장 안정한 구조를 모색하는 방법을 찾고 있다. 대표적 예가 ‘몬테카를로 탐색’(Monte Carlo search)법이다. 우선 임의적으로 하나의 구조를 만들고 안정도를 측정한 후 같은 방법으로 또다른 구조를 만든다. 그리고 이 둘의 안정도를 측정해 더 안정한 구조를 택하는 방법이다. 이 과정을 수십만에서 수억번 이상 반복해 마지막에 남는 구조를 택한다.
20개 아미노산 단 두개로 표현
단백질 구조형성 문제를 좀더 구체적으로 살펴보기 위해 가장 단순하며 이해하기 쉬운 2차원 HP 격자 모델에 대해 알아보자. 이 모델은 각 아미노산의 크기와 아미노산 사이의 결합길이를 단일화한다. 또한 아미노산 종류를 곁가지를 기준으로 물을 싫어하는 소수성(Hydrophobic)과, 물을 좋아하는 친수성(Polar, Hydrophilic)의 두가지 종류로 단순화한다. 이렇게 하면 20가지의 아미노산은 H, P 2개의 문자로 표현될 수 있다.
아미노산 서열이 PHPPHHPH인 단백질을 생각해보자. 첫번째 아미노산 P 다음에 두번째 아미노산 H를 평면상에서 연결하는 방법은 위, 아래, 오른쪽 이렇게 총 3가지가 있다. 위 단백질의 경우 아미노산 개수가 8개이므로 가능한 평면구조는 37개다. 대부분의 단백질은 수백-수천개의 아미노산으로 이뤄져 있으므로 가능한 구조는 기하급수적으로 늘어난다. 이렇게 무수히 많은 가능한 구조를 대상으로 가장 낮은 에너지 즉, 가장 안정한 상태를 찾기 위해서 몬테카를로 탐색법을 사용한다.
이렇게 얻어진 구조는 옆의 표에 의해서 에너지로 계산된다.
총 에너지값이 가장 낮은 구조가 가장 안정된 구조다. 직접적으로 연결돼 있지 않은 소수성 아미노산이 접촉하면 에너지가 -1이고 나머지의 경우에는 0으로 약속한다. 이 값은 자연계에 존재하는 단백질 구조를 참고로 결정됐다.
아미노산 서열이 PHPPHHPH인 단백질의 가능한 2천1백87개의 구조 중 에너지 값이 -2인 2차원 HP 격자 모델의 구조를 나타내면 위 그림과 같다.