
“지난번에는 사실 저희도 놀랐는데…. 또 좋은 성적을 거둬 무척 기쁩니다.”
지난해 12월 이탈리아 칼리아리에서 열린 ‘제8회 단백질구조예측대회’(CASP8)에서 고해상도 분야와 단백질 기능부위 예측 분야에서 각각 1등을 차지한 고등과학원 계산과학부 이주영 교수는 수상을 축하한다는 말에 쑥스러워하면서도 기쁨을 감추지 못했다. 단백질구조예측대회는 2년마다 열리는데 지난 2006년 7회 대회에서도 이 교수팀은 고해상도 분야에서 우승했다.
“사실 고해상도 분야는 2005년에야 본격적으로 연구를 시작했습니다. 그런데 경험삼아 참가한 2006년 대회에서 1등을 했으니 저희도 당황했죠.” 단백질 구조 예측 분야에서 내로라하는 외국의 유명 연구팀들을 제치고 불과 1~2년 만에 확고한 실력자로 자리매김한 이 교수의 성공비결은 무엇일까.
연구 고비마다 시뮬레이션이 해결

1977년 고 3이던 이 교수는 의대 진학을 희망했던 부모님의 기대를 저버리고 서울대 물리학과에 지원했다. 의학에는 도통 관심이 없었기 때문. 평소 자유분방한 성격인지라 대학에 들어가서도 진득하니 자리를 잡고 집중하지 못했던 그는 만만치 않은 수업내용에 고전을 면치 못했다. 어느새 4학년이 된 그는 새로 부임한 젊은 교수가 맡은 세미나수업을 듣게 됐는데 이때 처음으로 물리학이 재미있는 학문이라는 걸 깨달았다.
“지금도 서울대에 계시는 김두철 교수님 수업이었습니다. 통계물리학을 전공한 분이셨는데 번뜩이는 통찰력과 어려운 문제를 간단명료하게 설명하는 모습에 제가 압도됐죠.” 통계물리학은 천문학적인 숫자의 원자나 분자의 움직임을 통계적인 관점에서 해석해 물리현상을 규명해내는 분야로 ‘엔트로피’ 같은 개념이 여기서 나왔다. 결국 김 교수 연구실에서 대학원 생활을 한 이 교수는 연구를 하다가 처음으로 컴퓨터를 이용한 간단한 계산을 하게 된다.
“1980년대 초반에는 서울대 안에 컴퓨터가 몇 대 없었습니다. 물론 성능도 지금과는 비교할 수 없었지요.” 이 교수는 포트란이라는 컴퓨터 언어를 배우고 이를 이용해 프로그램을 짜 시뮬레이션으로 원하는 결과를 얻었지만 당시는 훗날 컴퓨터가 이렇게 중요해지리라고는 상상도 못했다.
석사학위를 받은 이 교수는 병역을 마치고 미국 브라운대로 유학길을 떠났다. 1년간 대학원 수업을 들은 뒤 그는 저명한 통계물리학자인 마이클 코스텔리츠 교수의 연구실에 들어갔다. 그런데 코스텔리츠 교수는 자기 학생인 이 교수에게 연구주제만 던져준 채 통 관심이 없었다. 대학원생 연구실에는 거의 들르지 않을뿐더러 복도에서 만나도 아는 채 마는 채였다. 3년이 지났지만 연구는 진척이 없고 이 교수는 점차 초조해졌다. 그러던 1989년 여름 어느 날, 코스텔리츠 교수가 이 교수를 찾았다.
‘웬일이지?’ 약간의 희망을 안고 달려간 이 교수에게 전혀 예상하지 못한 선고가 떨어졌다.
“주영, 연구비가 다 떨어져가니 빨리 졸업해야겠는데….”
“교수님, 아직까지 해놓은 게 없는데요….”
이 교수의 연구주제는 물질의 상전이 현상을 해석하는 일이었는데 결정적인 문제 하나가 풀리지 않아 연구가 진전되지 못하고 있었다. 코스텔리츠 교수는 연필과 종이만 있으면 되는 전형적인 이론물리학자. 그런 그가 연구 상황을 검토한 뒤 내린 결론은 몬테카를로 시뮬레이션을 해야겠다는 것.
그런데 문제는 코스텔리츠 교수는 컴퓨터를 이용한 연구를 해보지 않았다는 사실. 결국 이 교수는 사실상 스스로 공부하며 시뮬레이션 프로그램을 짜야했다. 그런데 이 과정에서 이 교수는 놀라운 경험을 하게 된다. 그가 짠 프로그램으로 어떤 상전이에 대한 시뮬레이션을 해봤는데 빈더라는 저명한 물리학자가 세운 식이 예측하는 패턴과 다른 결과를 얻었던 것.
“빈더 교수의 논문을 몇 번이고 읽었는데 중간의 수식 하나가 어떻게 유도됐는지 이해가 안 되더군요. 아무래도 논리적인 비약이 있다고 밖엔 볼 수 없었습니다.” 빈더 같은 저명한 교수의 수식을 일개 대학원생이 틀렸다고 지적하자 코스텔리츠 교수도 처음엔 당황했다. 그러나 이 교수의 끈질긴 설명과 시뮬레이션 결과를 바탕으로 그가 구한 새로운 식을 면밀히 검토한 뒤 빈더 교수의 이론이 틀렸다는 논문을 함께 썼다.
“컴퓨터 시뮬레이션이 이론의 진위를 검증하는 강력한 도구가 될 수 있다는데 깊은 감명을 받았습니다.” 박사학위를 받은 이 교수는 미국 플로리다주립대 슈퍼컴퓨팅센터에서 박사후 연구원으로 있으면서 다양한 물리현상을 시뮬레이션으로 해석하는 연구에 재미를 붙였다. 그러던 어느 날 옆 연구실의 고분자학자와 담소를 나누던 이 교수는 아미노산 5개로 된 폴리펩티드의 구조를 시뮬레이션으로 구할 수 있겠느냐는 제안을 받았다. 재미삼아 해본 시뮬레이션은 성공적이었고 그 결과로 논문까지 썼다.

“아미노산이나 단백질은 고등학교 생물 시간에 배운 게 전부였지만 한 번 도전해볼 만한 분야라는 생각이 들더군요.” 본격적으로 단백질 연구를 하기로 결심한 이 교수는 1994년 이 분야의 대가인 코넬대 슈라가 교수 연구팀에 들어가 2000년까지 단백질 구조 시뮬레이션 연구를 진행했다.
분자구조 규명에 한몫

“2000년 고등과학원 초청을 받아 2주가량 머물렀는데 연구 환경이 좋더군요.” 당시 고등과학원은 수학부와 물리학부가 있었는데 새로이 계산과학부를 개설하기로 하고 이 교수를 초빙했던 것. 15년간의 미국생활을 정리하고 귀국한 이 교수는 국내에서 단백질 시뮬레이션 연구가 전무하다는 사실을 알았다.
“연구를 진행하는 것과 함께 이곳저곳을 찾아다니며 이 분야의 연구가 중요하다는 사실을 알렸습니다.” 그런데 반응은 차가웠다. 물리학자나 컴퓨터과학자들은 생체 분자의 구조에 별 관심이 없었고 생명과학자들은 이 교수의 연구가 그다지 도움이 안 된다고 고개를 저었다.
이때까지 이 교수가 연구하던 방법은 주어진 아미노산 서열을 물리 계수가 잔뜩 들어있는 수식에 대입해 컴퓨터로 풀어 가장 안정된(에너지가 가장 낮은) 3차원 구조를 찾는 ‘ab initio’ 방법이었다. 이 교수는 고등과학원에 자리를 잡은 지 얼마 되지 않은 2004년 단백질구조예측대회(CASP6)의 ‘ab initio’ 분야에 나가 8위를 차지한 실력자다.
그런데 문제는 이 분야의 1위라도 점수는 40~50점 정도로 X선 결정법으로 밝힌 진짜 구조와는 상당한 차이가 있다. 이 교수는 “아마노산 하나가 단 3가지 구조만을 갖는다고 가정할 때, 아미노산 분자 두 개가 서로 결합할 때 가능한 구조는 9가지가 된다”며 “아미노산 100개로 이뤄진 사슬이 갖는 구조의 가능성은 3100 즉 1047보다도 큰 천문학적 수로 가장 안정된 구조를 찾기 위해 이 모든 경우를 계산하는 건 불가능하다”고 말했다. 지금까지 계산량을 줄이기 위한 여러 기법들을 개발했는데 아직까지는 만족스러운 결과를 얻지 못하고 있다. 결국 이렇게 나온 불확실한 정보는 진짜 단백질을 다루는 생명과학자들에겐 별 도움이 안 됐던 것.
이 교수가 만난 몇몇 생명과학자들은 이 방법 대신 ‘호몰로지 모델링’을 연구해달라고 부탁했다. 호몰로지 모델링(homology modeling)이란 알고자 하는 단백질과 아미노산 서열이 비슷한 단백질을 찾은 뒤, 이 가운데 이미 실험으로 구조가 알려진 단백질이 있으면 이를 주형으로 삼아 단백질의 구조를 예측하는 방법이다. 호몰로지 모델링이 성공적으로 적용될 경우 구조 정확도는 90%가 넘는다. 단백질구조예측대회 ‘고해상도 분야’에서 이 방법을 쓴다. 결국 이 교수는 생명과학자에게 쓸모가 있는 호몰로지 모델링으로 연구방향을 돌렸다.
“여기서는 물리 지식뿐 아니라 생명정보학 지식이 무척 중요합니다. 수많은 단백질 가운데 주형이 될 최적의 후보를 선정하고 둘 사이의 관계를 제대로 설정하는 일이 연구의 출발점이기 때문입니다.” 이 교수팀이 빠른 시간 내에 새로운 분야에 적응할 수 있었던 건 생명정보학과 기존의 물리적 방법을 융합해 다른 어떤 팀보다도 정확한 계산을 수행했기 때문이다.

“저희 팀의 주기형 박사와 함께 컴퓨터 시뮬레이션으로 MukB의 구조를 구했습니다. 흥미롭게도 저희 쪽에서는 오 교수팀이 구조를 밝히지 못한 부분이 오히려 쉽게 구조가 밝혀지더군요.” 오 교수팀은 이 교수팀의 시뮬레이션 결과를 바탕으로 실험 데이터를 재해석해 MukB 단백질의 전체 구조를 명확히 밝힐 수 있었다. 오 교수팀의 연구결과는 생명과학분야의 권위있는 학술지인 ‘셀’ 1월 9일자에 실렸다.
“사실 시뮬레이션 연구가 실제 실험에 이렇게 도움이 될지는 저희도 몰랐습니다. 앞으로도 저희 방법이 실험을 하는 연구자들에게 큰 힘이 됐으면 좋겠습니다.” 컴퓨터 시뮬레이션은 실험을 할 수는 있지만 현실적으로 많은 비용과 시간이 드는 경우를 대체하기도 한다. 예를 들어 DB에서 특정한 효소기능이 있을 것으로 추정하는 단백질이 50여개일 때 이중 효소기능이 가장 뛰어난 걸 찾으려면 기존에는 각 생명체로부터 실제 단백질을 얻어 효소활성을 시험해야했다. 서너 개라면 해볼 만하지만 50개는 도저히 무리다. 그런데 효소의 구조를 컴퓨터 시뮬레이션으로 구한 뒤 역시 시뮬레이션으로 효소의 활성을 측정할 수 있다.

“제가 단장을 맡은 ‘인 실리코(in silico) 단백질연구단’은 생명과학 문제에 적용하는 연구에 서울대 화학부 석차옥 교수팀, 계산과 정보화 연구에 한국표준과학연구원 이인호 박사팀이 함께 참여합니다. 앞으로 좋은 결과가 나올 겁니다.”
이 교수는 초창기 물리학의 범위를 넘어 이제는 생명과학의 영역으로 적용의 폭을 넓히고 있는 시뮬레이션 연구의 잠재성에 스스로도 놀란다면서 연구단이 이 분야의 발전에 크게 기여할 수 있기를 희망했다.
몬테카를로 시뮬레이션
엄밀한 계산으로 답을 구하기가 어려운 상황에서 임의로 견본을 택해 계산해 실제 값에 가까운 수치를 구하는 방법이다. 예를 들어 몬테카를로 방법으로 파이(π)값을 구할 수 있는데 한 변의 길이가 2인 정사각형 가운데를 중심으로 반지름 1인 원을 그리고 난수를 발생시키는 간단한 컴퓨터 프로그램으로 얻은 좌표 값이 원 안에 들어가는 비율에 4를 곱한 값을 구하면 횟수가 늘어날수록 실제 π 값에 접근한다.
in silico
단백질 구조 연구의 Global Leader
인 실리코 단백질 창의연구단
고등과학원 계산과학부 이주영 교수의 인 실리코 단백질 창의연구단은 단백질 구조를 분석·예측하는 연구를 통해 질병의 유발 원인을 알아내고, 이를 통해 신약개발을 가능케 하는 생명과학의 최첨단 연구를 수행하고 있습니다.
인 실리코 단백질 창의연구단은 슈퍼컴퓨터를 이용한 대규모 계산을 통해 단백질의 구조와 그 기능을 연구해오고 있으며, 그 결과 세계 단백질구조예측 대회(CASP, Critical Assessment of Techniques for Protein Structure Prediction) 고해상도 예측분야에서 2006, 2008년 2회 연속 세계 1위를 차지했습니다.
또한 올해는 생명과학 저널인 ‘Cell’에 발표한 논문에서 박테리아의 염색체 응축을 담당하는 단백질 복합체가 ‘고리모양’의 분자구조로 돼 있음을 단백질 구조 모델링과 실험을 통해 규명했습니다. 인 실리코 단백질 창의연구단은 단백질 구조와 그 기능을 밝혀 신물질 개발 및 광우병, 파킨슨병, 알츠하이머병 등과 같은 난치병을 치료하는 신약개발에 필요한 원천기술을 확보하고자 합니다.
인 실리코 단백질 창의연구단은 혁신적이고 독창적인 연구 활동을 통해 생명과학 분야의 Global Leader가 되겠습니다.
서울시 동대문구 청량리2동 207-43 고등과학원 인 실리코 단백질 창의연구단 (우: 130-722) | Homepage http://gene.kias.re.kr/home/ Tel 02-958-3869 Fax 02-958-3820