주메뉴바로가기 본문바로가기

바이러스 껍질, 캡시드의 기하학

고대 그리스의 철학자 플라톤은 만물의 이상적인 상태인 이데아를 추구했다. 그래서인지 수학을 매우 높게 평가했는데, 그가 세운 아테네 학당의 정문에는 ‘기하학을 모르는 자는 이 문으로 들어오지 말라’라는 현판이 걸려 있었다고 한다. 플라톤과 수학 하면 떠오르는 또 다른 내용은 정다면체가 5가지만 존재한다는 ‘플라톤의 다면체’다.

정사면체, 정육면체, 정팔면체, 정십이면체, 정이십면체가 5가지 정다면체다. 정사면체, 정팔면체, 정이십면체는 정삼각형 면으로 이뤄져 있고 정육면체는 정사각형 면, 정십이면체는 정오각형 면으로 이뤄져 있다. 정다면체 가운데 정십이면체와 정이십면체가 구에 가깝다.

흥미롭게도 수학적으로 완벽한 도형인 정이십면체가 실제 세계에서도 존재하는데, 대표적인 예가 바이러스다. 바이러스는 크기가 수십~수백nm(나노미터, 1nm=10-9m)에 불과하기 때문에 전자현미경이 발명되기 전까지는 모습을 볼 수도 없었다. 이런 단순한 생명체가 어떻게 수학적으로 이상적인 구조를 ‘채택’할 수 있었을까.



핵산을 감싸는 가장 효율적인 방법



20세기 중반 과학자들은 여러 생화학적 방법을 동원해 바이러스가 단백질과 유전물질인 핵산(DNA나 RNA)으로 이뤄진 ‘입자’라는 사실을 밝혀냈다. 즉 세포라는 기본단위로 이뤄진 기존의 생명체들과는 본질적으로 다른 존재임이 드러난 셈이다. 그럼에도 핵산과 단백질이 어떤 식으로 모여 하나의 바이러스 입자를 이루는지는 베일에 가려져 있었다.

1953년 DNA이중나선구조를 발견해 일약 스타과학자가 된 프랜시스 크릭과 제임스 왓슨은 1956년 ‘네이처’에 흥미로운 논문을 발표했다. 이들은 논문에서 바이러스를 찍은 X선 회절 이미지와 전자현미경 이미지를 바탕으로 바이러스의 구조를 추측했다.

크릭과 왓슨은 DNA이중나선구조를 예측했던 놀라운 상상력을 이번에도 유감없이 발휘했다. 먼저 바이러스는 단백질이 유전물질인 핵산을 감싸 보호하는 구조라고 생각했다. 전자현미경에서 드러난 바이러스 형태가 구형이나 막대형이 많은 이유에 대해서 핵산이 실타래처럼 뭉쳐 있다면 단백질이 구형으로 감싸는 게 가장 효율적이고 핵산이 길게 풀려 있는 상태라면 전선의 피복처럼 얇고 긴 원통형으로 감싸기 때문이라고 설명했다.



이들의 천재성은 단백질이 어떻게 핵산을 감싸느냐를 추론한 부분. 만일 단백질 하나가 핵산을 감싸려면 속이 빈 구나 원통 형태여야 하는데, 이런 복잡한 구조를 만들려면 단백질 하나가 매우 커야 한다. 하지만 짧은 건 길이가 불과 수천 개의 염기에 불과한 바이러스 유전체가 이런 거대한 단백질의 유전정보를 담고 있는 건 불가능하다. 따라서 크릭과 왓슨은 동일한 작은 단백질 여럿이 핵산 주위를 둘러쌀 것이라고 추측했고 이 과정에서 규칙적인 배열이 반복될 것이라고 제안했다. 구형 바이러스의 경우 실제로는 플라톤의 다면체 가운데 하나일 것이라고 주장했다.

이들의 예측대로 바이러스는 작은 단백질이 핵산을 감싸고 있는 구조였고 전자현미경에서 구형처럼 보이는 바이러스를 자세히 관찰한 결과 정이십면체라는 사실이 밝혀졌다. 이처럼 핵산을 감싸고 있는 단백질 껍질을 캡시드(capsid)라고 부른다. 캡시드는 ‘상자’를 뜻하는 라틴어(capsa)에서 유래한 말이다.



흥미로운 사실은 같은 정이십면체라도 바이러스 크기에 따라 이를 구성하는 단백질의 개수가 다르다는 점이다. 즉 작은 바이러스는 불과 60개의 단백질로 캡시드가 만들어지는 반면, 캡시드 하나를 만드는 데 단백질이 780개나 들어가는 커다란 바이러스도 있다. 그런데 바이러스가 정이십면체인데, 최소한도로 필요한 단백질은 왜 20개가 아니라 60개일까.

정이십면체는 크기가 같은 정삼각형 20개로 이뤄져 있다. 따라서 정삼각형 판처럼 생긴 단백질이 핵산을 감싸는 구조가 가능할 것이다. 그러나 실제로 이런 구조를 하고 있는 바이러스는 없다. 단백질 60개로 된 바이러스를 보면 사다리꼴 모양의 단백질이 3개씩 모여 정삼각형 하나를 이루고 있다. 바이러스가 굳이 이런 구조를 띠는 이유는 무엇일까.





먼저 유전자 크기가 3분의 1로 줄어든다는 이점을 생각해볼 수 있다. 예를 들어 단백질 60개로 이뤄진 캡시드의 개별 단백질이 100개의 아미노산으로 이뤄져 있다면 단백질 20개로 이뤄진 같은 크기의 캡시드는 단백질 하나가 아미노산 300개로 구성돼야 한다. 즉 캡시드를 이루는 단백질 수가 늘면 그만큼 유전자가 작아지는 셈이다. 그러나 진짜 중요한 이유는 단백질의 자기조립성 여부에 있다. 숙주세포에 침투한 바이러스의 증식과정을 보면 세포 안에서 핵산과 단백질을 따로 합성한 뒤 수많은 바이러스로 조립된다. 따라서 단백질이 쉽게 조립될 수 있는 구조여야 하는데, 먼저 단백질 몇몇이 합쳐진 뒤 이들이 모여 정이십면체를 이룬다는 사실이 밝혀졌다.



바이러스와 축구공의 공통점

정이십면체는 꼭짓점이 12개인데, 각 꼭짓점은 오각뿔 꼭대기에 자리하고 있다. 바이러스는 단백질 5개가 모여 오각뿔 형태를 이룬다. 이런 단위체를 펜타머(pentamer) 또는 펜톤(penton)이라고 부른다. 펜트(pent)는 ‘5’를 뜻하는 그리스어다. 결국 바이러스 캡시드는 펜타머 12개가 정이십면체의 꼭짓점 위치에 배열돼 있는 셈이다(12×5=60). 지름이 18nm에 불과한 위성담배모자이크바이러스는 캡시드가 단백질 60개로 이뤄져 있는데, 이 안에는 1063개의 염기로 이뤄진 초미니 RNA단일가닥 유전체가 들어 있다.





약 5000개의 염기로 이뤄진 RNA단일가닥 바이러스인 소베모바이러스(sobemovirus) 역시 정이십면체 구조로 지름이 약 30nm다. 이 경우는 단백질 60개가 아니라 180개가 모여 캡시드를 만든다. 즉 펜타머 12개가 헥사머(hexamer) 20개와 함께 모여 캡시드를 이룬다(12×5+20×6=180). 헥사머는 단백질 6개가 모인 단위체로 헥손(hexon)이라고도 부르는데, 헥스(hex)는 ‘6’을 뜻하는 그리스어다.

헥사머는 정이십면체의 면을 이루는 정삼각형 가운데를 중심으로 배열돼 있다. 전체적으로 납작한 정삼각뿔 형태다. 펜타머와 헥사머는 톱니바퀴처럼 서로 물려 있어 안정된 캡시드를 만드는데, 엄밀히 말하면 정이십면체가 아니라 마름모삼십면체에 가깝다. 따라서 캡시드 하나는 단백질 180개로 이뤄져 있다. 만일 펜타머와 헥사머가 만나는 경계를 직선으로 만들고 펜타머는 검은색, 헥사머는 흰색으로 칠하면 우리에게 익숙한 형태가 나타난다. 바로 전형적인 축구공 무늬다. 사실 축구공 무늬는 꼭짓점이 잘린 정이십면체다.

좀 더 큰 정이십면체 바이러스의 캡시드는 단백질 240개로 이뤄져 있다. 꼭짓점 12개는 펜타머가 둘러싸고 있고 정이십면체의 선분 30개에 헥사머 중심이 놓여 있는 구조다. 얼핏 보면 단백질 180개로 이뤄진 캡시드와 혼동되지만 정삼각형 하나를 이루는 단백질이 9개가 아니라 12개임을 알 수 있다. 캡시드 지름이 40nm인 알파바이러스가 여기에 속한다.





캡시드 지름이 70nm에 이르는 비르나바이러스(birnavirus)는 정이십면체를 이루는 데 단백질이 780개나 들어간다. 비르나바이러스는 RNA이중가닥이 유전체인데, 마찬가지로 꼭짓점 12개는 펜타머가 둘러싸고 있고 나머지 면에 여러 헥사머가 놓여 있다. 정삼각형 하나당 단백질은 39개나 된다.





구형 바이러스의 캡시드가 모두 정이십면체라는 공통점은 있지만 실제 캡시드가 만들어지는 메커니즘은 종류마다 다르다. 먼저 캡시드가 조립된 뒤 속의 빈 공간으로 핵산(유전체)이 들어가는 경우도 있지만 핵산의 존재가 캡시드의 형성을 결정하기도 한다. 예를 들어 비르나바이러스는 유전체가 없는 상태에서 캡시드 단백질만 있을 경우 캡시드의 최소 단위인 불과 60개의 단백질이 모여 지름 26nm의 작은 정이십면체 캡시드를 만든다.







막대형 바이러스는 나선형 배치

모든 바이러스 캡시드가 구형, 즉 정이십면체인 건 아니다. 자연계에는 구형만큼 단순한 막대형 바이러스도 많다. 담배 잎에 감염해 허연 얼룩을 내는 담배모자이크바이러스(Tobacco Mosaic Virus, TMV)가 대표적인 예다. 앞에 소개한 위성담배모자이크바이러스의‘위성’이란 말은 TMV에 의존해서 살아가는 존재라는 뜻이다. TMV를 전자현미경으로 보면 마치 성냥개비처럼 보인다. TMV는 지름이 18nm, 길이가 300nm이므로 나노 성냥개비인 셈이다.



TMV는 염기 6400개로 이뤄진 RNA단일가닥 유전체를 단백질 2130개가 감싸고 있다. 이때 RNA 가닥은 실타래처럼 엉켜 있지 않고 DNA이중나선처럼 나선을 이루고 있다. 단백질은 RNA 나선을 따라 감싸고 있는데, 단백질 하나당 염기 3개를 커버한다. 이처럼 규칙적인 구조의 단백질 캡시드 덕분에 막대형 바이러스는 열에 강하다. TMV의 경우 50℃의 건조한 담배잎 표면에서 30분을 버틸 수 있다.

박테리아에 감염하는 M13 박테리오파지 역시 막대형 바이러스로 염기 6407개로 이뤄진 DNA단일가닥 유전체를 단백질 2700개가 감싸고 있다. 역시 단백질의 개수는 염기 크기와 밀접한 관계가 있음을 짐작할 수 있다. 실제로 M13 박테리오파지의 유전체 대신 불과 221개의 염기로 이뤄진 DNA단일가닥 고리를 넣어주면 단백질이 95개만 참여하는 미니 바이러스가 만들어진다. 이 경우 지름은 6.5nm로 같지만 길이는 930nm에서 50nm로 줄어든다.

몇몇 바이러스는 원형과 막대형이 복합된 구조를 띠고 있다. 박테리오파지 T4가 대표적인 예다. 박테리오파지 T4는 DNA염기쌍 17만 개로 이뤄진 큰 바이러스로 유전자도 70여 개나 된다. 커다란 유전체를 담을 캡시드는 정이십면체 구조이고 유전체를 박테리아 세포 속으로 주입할 꼬리관을 단백질이 나선형으로 덮고 있다. 여기에 섬유단백질이 달려 있는 다소 복잡한 구조다.



박테리오파지 T4의 전자현미경 사진을 보면 어떤 대상을 축소한 조립식 장난감 같다는 인상을 준다. 그 대상이란 바로 아폴로 달착륙선이다. 박테리아 세포벽에 달라붙은 바이러스가 달 표면에 안착한 달착륙선을 꼭 닮았다. 과학자들이 아폴로 달착륙선을 설계할 때 박테리오파지 T4의 구조를 참고한 걸까.

 

 

1, 3, 4, 7, 9 다음은?

바이러스 구조를 연구하던 과학자들은 정이십면체 바이러스의 캡시드를 이루는 단백질 숫자(Np)가 다음 식을 따른다는 사실을 발견했다.

Np =12×5(펜타머)+10(T-1)×6(헥사머)
=60T

여기서 T는 ‘삼각화 수(triangulation number)’인데, 바이러스 캡시드의 경우 T=1, 3, 4, 7, 9 … 등의 값을 가질 수 있다. 따라서 T=1일 때 가장 적은 숫자의 단백질(60개)로 이뤄진 캡시드가, T=3일 때 축구공 같은 구조가 생긴다. 결국 바이러스는 유전체가 커져 캡시드 내부에 더 넓은 공간이 필요할 경우 T값이 커져 이 문제를 해결한다. 그런데 왜 T=2나 T=5는 안 될까. 그것은 T가 아래의 식으로 주어지기 때문이다.



이 식을 이해하려면 정이십면체를 찬찬히 살펴봐야 한다. 정이십면체는 정삼각형 면이 20개 모인 정다면체다. 정삼각형의 내각은 60˚다. 따라서 한 점을 중심으로 정삼각형 6개를 배치해 양쪽 변이 서로 닿게 하면 2차원 평면에 놓이는, 면적이 6배인 정육면체가 생긴다. 모든 정삼각형이 이렇게 배열돼 있다면 3차원 도형인 다면체를 만들 수 없다. 따라서 3차원 도형의 꼭짓점을 공유하는 정삼각형의 수는 6개 미만이어야 한다. 정이십면체는 12개의 꼭짓점마다 정삼각형 5개가 만난 오각뿔이 위치한 구조다.

정삼각형 모양의 격자가 그려진 평면에 정이십면체의 전개도를 그린다고 생각해보자. 격자의 한 축은 h, 여기에 시계반대방향으로 60˚인 축은 k다. 정이십면체의 꼭짓점을 이루는 한 점의 좌표를 (0, 0)이라고 하자. 만일 어떤 한 점이 정이십면체의 꼭짓점이라면 주위를 둘러싼 정삼각형 6개 가운데 하나는 전개도에 포함되면 안 된다. 좌표 (0, 0)에 닿아 있는 삼각형 가운데 하나에 해당하는 영역을 어둡게 칠한 이유다.



가장 작은 정이십면체는 격자를 이루는 삼각형 하나가 한 면을 이루는 경우로 인접한 꼭짓점까지 거리(S)가 1이다. h=1, k=0(또는 h=0, k=1)인 경우다. 그 다음으로 작은 정이십면체는 어떻게 만들 수 있을까. 점(0, 0)에서 다음으로 가까운 격자점은 (1, 1), 즉 h=1, k=1인 경우다. 그렇다면 이 두 점 사이의 거리는 얼마일까. 피타고라스의 정리를 이용하면 쉽게 구할 수 있는데, 점(1, 1)에서 h축에 수선을 그어 직각삼각형을 만들면 된다.




따라서 T값은 주어진 두 점이 정이십면체의 이웃한 꼭짓점을 이룰 경우 정삼각형 면의 넓이가 된다. 즉 두 번째로 작은 정이십면체를 ‘T=3’인 정이십면체라고 부르는 이유는 정삼각형 면적이 가장 작은 정이십면체의 정삼각형 면적의 3배이기 때문이다. 이런 식으로 삼각형의 넓이를 넓혀 가면 T=1, 3, 4, 7, 9, 12, 13, 16…로 진행된다. 몇몇 예외가 있지만 구형 바이러스의 캡시드 단백질 개수가 60(T=1), 180(T=3), 240(T=4), 420(T=7)…인 이유다.

수학은 순수한 사유의 결과물이라지만 물리적 실체인 자연의 패턴을 ‘통제’하는 강력한 힘도 갖고 있는 것이 아닐까.

 

 

 

 

 

글 : 강석기 sukki@donga.com

과학동아 2009년 08호