핵심 요약
ㆍ 20204 노벨 화학상 수상자 데이비드 베이커와 구글 딥마인드 연구팀은 단백질 설계와 구조 예측에서 중요한 성과를 거뒀다. 특히 AI 모델인 알파폴드와 로제타폴드는 단백질의 3D 구조 예측 및 설계에 활용되어 신약과 백신 개발에 기여하고 있다.
ㆍ 과학자들은 AI를 도구로 활용해 문제 해결 능력을 극대화하고, 인간과 AI가 공존하며 연구를 발전시킬 방안을 모색하고 있다.
2024 노벨 과학상을 한 단어로 정리하자면 단연 ‘AI’다. 노벨 물리학상과 노벨 화학상 모두 AI를 개발하고 활용한 연구자들에게 돌아갔다. 동시에 과학계에는 AI를 어떻게 바라봐야 할지에 대한 의문이 든다. 노벨상 수상 연구를 알아보고, 과학 연구에서 AI를 효과적으로 이용하는 방법을 살펴본다.
[물리학상] 챗GPT 낳은 인공신경망 토대 구축한 과학자
ㆍ 존 홉필드, 제프리 힌턴 수상 👨👦: 노벨위원회는 “인공신경망을 통한 기계학습을 가능케 한 기초적인 발견을 한 공로”로 존 홉필드 미국 프린스턴대 물리학과 교수와 제프리 힌턴 캐나다 토론토대 교수를 노벨 물리학상 수상자로 선정했다.
ㆍ AI 연구가 왜 노벨 물리학상을? 🔎: 노벨위원회는 이들이 ‘물리학의 도구’를 사용해 머신러닝의 기반을 마련했다는 점을 강조한다. 물리학, 보다 정확하게는 통계 물리학의 도구를 활용했다.
ㆍ AI 연구가 통계 물리학 활용하는 이유는? 💻: ‘큰 그림’을 그려가며 시스템을 파악하는 통계 물리학의 관점을 이용하면 복잡한 시스템을 효율적으로 분석할 수 있기 때문이다. 또 통계 물리학에서 나온 확률적인 방법론은 데이터의 패턴을 학습할 때 도움이 됐다.
이번 노벨 물리학상을 받은 ‘홉필드 네트워크’와 ‘볼츠만 머신’은 둘 다 통계 물리학을 활용해 개발됐다. 통계 물리학은 여러 가지 요소로 구성된 시스템을 설명하는 물리학 분야다. 예를 들어 기체를 이루는 입자를 하나하나 추적하는 것은 어렵지만, 이 분자들을 종합적으로 고려해 계산하면 압력이나 온도 같은 기체의 전체적인 특성을 파악할 수 있다. 통계 물리학은 이런 총체적인 특성에 초점을 맞춰, 경향성을 통계적으로 살펴보는 학문이다.
ㆍ 입자 스핀에서 착안한 홉필드 네트워크 💫: 홉필드 교수는 1980년대에 인공신경망 모델 '홉필드 네트워크'를 제시했다. 이전까지의 인공신경망 알고리즘은 계산이나 학습 과정이 일방향으로만 진행됐다. 반면 홉필드 네트워크는 정보에 대한 피드백을 지속적으로 반영하기 때문에 불완전하거나 왜곡된 정보도 정답에 가깝게 추측해낼 수 있다. 홉필드 네트워크의 작동 방식은 ‘스핀’에서 착안했다. 스핀은 물리학에서 원자나 전자와 같은 작은 입자가 특정한 방향을 갖는 상태를 말한다.
ㆍ 홉필드 네트워크 발전시킨 볼츠만 머신 🔗: 힌턴 교수는 홉필드 네트워크를 한 단계 발전시킨 볼츠만 머신 알고리즘을 개발했다. 이 알고리즘은 인공신경망에서 각각의 정보를 받아내는 연결점들을 복잡한 거미줄처럼 구성했다. 연결점들은 드러난 점과 숨겨진 점으로 구분되는데, 볼츠만 머신은 숨겨진 노드를 활용해 알고리즘의 계산 효율을 높이고 네트워크가 최적의 상태를 유지할 수 있도록 했다.
ㆍ 생성형 모형의 고전 모델이 볼츠만 머신 📂: 조정효 서울대 물리교육과 교수는 “머신러닝에서 생성 모형은 어떤 데이터를 들여다봤을 때 각 샘플이 나올 확률을 학습한다”며 “현재 널리 쓰이는 언어 모델 챗GPT처럼 이미지를 생성하는 모델은 다 생성 모형”이라고 말했다. 이어 “생성 모형의 기반이 되는 아주 고전적인 모델이 볼츠만 머신”이라고 설명했다.
▶기사 원문 보기 과학동아 2024년 11월호 특집
[화학상] 생명현상의 기본 ‘단백질’ 설계·구조 예측 AI 개발 과학자들
ㆍ 데이비드 베이커, 데미스 허사비스, 존 점퍼 수상 👦👨👱: 노벨위원회는 “단백질의 놀라운 구조에 대한 코드를 해독한 공로”로 데이비드 베이커 미국 워싱턴대 교수와 데미스 허사비스 영국 구글 딥마인드 CEO, 존 점퍼 구글 딥마인드 수석연구원을 노벨 화학상 수상자로 선정했다. 이들의 성과를 활용하면 세상을 혁신할 신약, 나노 물질, 백신 등을 개발할 수 있다고 밝혔다.
ㆍ 화학상 핵심 키워드는 단백질 구조 🔎: 2024년 노벨 화학상은 두 연구에 공동 수여됐다. 둘을 관통하는 핵심 키워드는 바로 ‘단백질 구조’다. 베이커 교수는 전에 없던 새로운 단백질을 설계하고 창조한 공로로 상을 받았다. 한편 구글 딥마인드의 두 연구자는 ‘알파폴드’라는 인공지능(AI) 프로그램을 이용해 이미 세상에 존재하는 단백질의 구조를 손쉽게 알아내는 방법을 찾았다.
ㆍ 딥마인드, 알파고 만들다 왜 단백질 구조 연구를? : 허사비스는 단백질 구조 분야의 한 학회에서 “베이커 교수가 개발한 폴드잇(Foldit)이라는 단백질 접힘에 관한 퍼즐 게임을 하며 단백질 구조 예측에 관심을 갖기 시작했다”고 말했다. 그렇게 시작된 연구가 노벨상으로 이어졌다.
ㆍ 컴퓨터로 단백질 설계하는 방법 개발 : 베이커 교수는 2003년 단백질의 기본 요소인 아미노산을 사용해 기존 단백질과는 완전히 다른 새로운 단백질을 컴퓨터로 설계하는 데 성공했다. 이후 베이커 교수의 연구팀은 의약품, 백신, 나노물질, 초소형 센서 등으로 쓰일 수 있는 단백질을 잇따라 설계했다. 단백질은 20종의 아미노산이 복잡한 사슬 구조로 연결된 형태다. 사슬이 꼬이고 얽히며 접히는 현상이 일어나고 복잡한 입체 구조를 형성한다. 주어진 아미노산 서열로 만들 수 있는 단백질의 구조를 알면 이 단백질이 생체 내에서 어떤 기능을 할 수 있는지 가늠할 수 있다. 거꾸로 구조를 바꿔가며 원하는 기능을 하는 단백질을 설계하는 일 또한 가능하다.
ㆍ 단백질 구조 예측하는 AI 알파폴드 : 허사비스와 점퍼가 이끄는 연구팀은 2018년 AI를 이용해 단백질 구조를 예측하는 알파폴드, 2020년 알파폴드2를 발표했다. 이를 이용해 아미노산 서열로부터 단백질의 3차원(3D) 구조를 예측하는 문제를 해결하는 데 성공했다. 즉 2억 개에 달하는 모든 단백질의 구조를 예측해냈다. 하나의 단백질이 아닌 단백질-단백질 복합체 구조까지 예측하는 수준으로까지 발전했다.
지난 6월 공개한 알파폴드3는 범위를 더 확장해 항체-항원 상호작용, 유전물질인 RNA와 DNA, 이온 등 다른 분자와 단백질 사이의 상호작용도 예측할 수 있다. 단백질을 넘어 광범위한 생체 분자 유형에 대해 결합 구조를 알아낼 수 있게 됐다.
ㆍ 베이커 교수의 로제타폴드 : 베이커 교수는 알파폴드에 영감을 받아 단백질 구조를 해독하고 설계하는 AI 모델인 로제타폴드(RF)를 만들었다. 로제타폴드는 특정 단백질을 읽으면 보유한 단백질 데이터베이스를 이용해 이 단백질과 비슷한 아미노산 서열을 찾는다. 동시에 아미노산들이 어떻게 연결될지를 예측하고 이를 토대로 어떤 입체 구조를 띠고 있을지 예측한다. 이 과정을 반복하고 압축하면서 최종적으로 단백질 구조를 예측하며, 이를 기반으로 새로운 단백질을 설계한다.
👀AI 생화학자는 인간 생화학자와 공존할 수 있을까?
알파폴드의 성과를 보면 AI 생화학자가 언젠가는 인간 생화학자의 자리를 뺏을지도 모른단 생각이 든다. 하지만 화학자들은 오히려 AI라는 좋은 도구가 추가된 걸 반기는 분위기다. 결국 과학자는 질문에 대한 답을 찾아가는 사람이니까 말이다. 답을 쉽게 찾게 도와주는 도구가 생겼다고 해서, 질문을 던지는 역할을 뺏겼다고는 볼 수 없다.
👱베이커 교수와 구글 딥마인드는 라이벌?💻
베이커 교수의 연구 인생은 AI를 대하는 연구자의 자세를 보여주는 좋은 예시다. 그가 노벨 화학상을 받은 건 2003년, 새로운 단백질을 설계하고 합성해낸 공로 덕이다. 이 단백질의 이름은 ‘Top7’. 인류가 컴퓨터를 활용해 설계한 첫 인공 단백질이었다. 그런데 베이커 교수에게는 또 다른 업적이 있다. 그는 ‘알파폴드의 대항마, 로제타폴드의 아버지’로도 잘 알려져 있다.
✔ 구글 딥마인드가 해낸, 아미노산 서열을 보고 단백질의 구조를 예측하는 일.
✔ 베이커 교수가 천착한 단백질 구조를 설계하고 이걸 만들 수 있는 아미노산 서열을 짜는 일.
구글 딥마인드와 베이커 교수의 업적은 서로 반대 방향처럼 보인다. 하지만 이 둘은 서로 긴밀하게 연결돼 있다. 전에 없던 단백질을 창조하려면 결국 설계한 아미노산 서열로 단백질을 만들 때 원하는 구조가 나오는지 확인하는 기술이 필수불가결하기 때문이다.
그래서 알파폴드2의 활약을 지켜본 베이커 교수는 곧장 독자적인 단백질 구조 예측 AI 프로그램인 로제타폴드를 개발했다. 여기서 한발 더 나아가 2022년엔 단백질을 설계하는 AI ‘로제타폴드 디퓨전’을 내놓기도 했다.
베이커 교수는 “처음 알파폴드2를 봤을 때 저는 딥러닝의 힘을 느낄 수 있었다. 경쟁의식을 느끼기보다는 영감을 많이 받았다”고 노벨상 수상 소식을 들은 직후 베이커 교수가 노벨재단과의 인터뷰에서 말했다.
▶기사 원문 보기 과학동아 2024년 11월호 특집
추천 탐구 활동
통계 물리학의 개념이 인공신경망 설계에 어떻게 적용됐는지 조사.
2. AI가 생화학 연구에 미치는 영향
알파폴드와 로제타폴드의 성과를 기반으로 AI가 생화학자와 협력해 이 분야 연구를 어떻게 발전시키고 있는지 조사.
관련교과
ㆍ 2022 개정 : 물리학, 화학, 생명과학, 데이터과학
관련계열 및 학과
ㆍ 공학 계열 : 컴퓨터공학과/소프트웨어공학과, 전기전자공학과,생명공학과, 데이터과학과/AI학과
ㆍ 교육 계열 : 물리교육과, 컴퓨터교육과, 생물교육과, 화학교육과
ㆍ 의학 계열 : 의예과, 약학과, 의생명공학과
ㆍ 인문 계열 : 심리학과, 철학과, 윤리학과