그 주인공은 바로 구글 딥마인드의 인공지능(AI) ‘알파폴드2’! 아니, 당신은 2016년 이세돌을 꺾은 ‘알파고’의 후손 아닌가요? 왜 딥마인드는 단백질의 구조를 푸는 도전을 한 걸까요?
구글 AI, 단백질 구조 맞추기 대회에서 승리하다!
지난 11월 30일, 구글 딥마인드의 단백질 구조 예측 AI ‘알파폴드2’가 단백질의 3차원 구조를 맞추는 14회 ‘단백질 구조 예측 학술대회(CASP)’에서 평균 92.4점으로 최고점을 받았다는 소식이 전해졌어요. 이번 결과에 생물학자들은 50년 동안 풀리지 않은 난제가 풀렸다며 열띤 반응을 보였죠. 과학자들이 왜 이렇게 흥분했을까요?
단백질은 우리 몸을 이루는 주성분이에요. 장기 기관을 이루고, 효소처럼 몸속 화학 반응을 조절해요. 이런 기능은 단백질의 3차원 구조에 따라 달라져요. 즉 단백질의 3차원 구조를 알아야 단백질의 기능을 파악할 수 있는 것이죠. 하지만 실험실에서 단백질의 구조를 알아내려면 큰 노력과 시간이 들어요. 그래서 이를 연구하던 ‘구조생물학자’들은 단백질 구조를 예측하는 프로그램을 만들려 했어요.
단백질은 ‘아미노산’이라 부르는 재료 분자가 길게 이어져 만들어져요. 아미노산의 종류와 순서(서열)에 따라 복잡한 3차원 구조가 만들어지죠. 1994년 미국 메릴랜드대학교의 존 몰트 교수는 아미노산 서열만으로 단백질 구조를 예측하는 ‘단백질 구조 예측 학술대회(CASP)’를 열었어요. 구조 예측을 좀 더 잘 하는 프로그램을 만들기 위해서였죠. 이 대회에는 실험실에서 이미 구조가 밝혀졌지만, 아직 그 결과가 공개되지 않은 단백질의 아미노산 서열 100여 개가 문제로 출제돼요. 대회 참가자들이 자신들이 만든 프로그램으로 단백질의 3차원 구조를 예측하면 실제 구조와 비교해 얼마나 일치하는지 점수를 매겨요.
단백질의 구조를 예측하려면 복잡한 계산을 거쳐야 해요. 구글 딥마인드는 2018년 처음 CASP에 참석했는데, 올해는 이전보다 무려 30점이 올랐어요. 실험실에서 알아낸 단백질 구조와 거의 차이가 없는 결과였죠.