뉴스정보

정보광장

“AI 알파폴드, 지구상 모든 단백질 3차원(3D) 구조 예측” : 지구상 100만 종 생명체의 2억 개 단백질 구조 예측 완료

작성자
관리자
작성일
2022-07-29 17:49
조회
80

“AI 알파폴드, 지구상 모든 단백질 삼차원(3D) 구조 예측” 

지구상 100만 종 생명체의 2억 개 단백질 구조 예측 완료

알파고로 유명한 딥마인드의 단백질 구조 예측 인공지능(AI) “알파폴드(AlphaFold)”가 지구상에 존재하는 100만종의 생명체가 만들어낼 수 있는 2.14억 개의 단백질의 삼차원(3D) 구조 전체의 예측을 완료했다고 네이처가 7월 28일 보도했다.

구글의 자회사인 딥마인드는 2020년 11월 처음 딥러닝 인공지능 기술을 이용하여 단백질의 1차원 아미노산 서열 정보로부터 단백질폴딩을 예측하여 3차원구조를 풀어내는 “알파폴드(AlphaFold)”를 개발하여 발표하였다.

알파폴드는 처음 발표된지 8개월만인 2021년 7월 인체 2만여 개의 단백질 전체를 포함해 대장균, 초파리, 생쥐까지 20종의 다른 생명체에서 생성되는 35만 개의 단백질 구조를 3D로 예측했고 해당 데이터베이스를 무료로 공개했다.

그리고 또다시 1년 만인 2022년 7월, 지구상의 거의 모든 생명체가 만들어낼 수 있는 단백질 전체의 구조를 규명해 발표하였다.  3차원(3D) 구조 예측을 위한 단백질 1차원 아미노산 서열 정보는 UniProt protein DB 정보를 사용하였다.

딥마인드는 단백질 구조를 이루는 상호작용이 진화론적으로 보존된다는 원리에 따라 단백질 정보은행 (PDB: Protein Data Bank)의 17만개 구조정보 DB를 토대로 단백질 아미노산 서열정보와 3차원 구조에 대한 딥러닝을 진행했으며, 이를 통해 아미노산 서열만으로 단백질의 3차원 구조를 거의 정확하게 예측할 수 있다고 설명했다.

유럽분자생물연구소(EMBL-EBI)에 따르면 알파폴드로 예측한 2.14억 개의 단백질 3차원 구조 중 약 35%는 정확도가 매우 높아서 실험적으로 결정된 구조만큼 우수하며 또 다른 45%는 많은 응용 분야에 바로 사용될 수 있을 만큼 충분히 정확도가 높다.

딥마인드 설립자이자 최고경영자인 데미스 하사비스는 이날 이를 발표하면서 유럽분자생물연구소(EMBL-EBI)와 손잡고 구축한 2.14억 개의 단백질 3D 구조 데이터베이스를 무료 공개하겠다고 밝혔다.

딥마인드의 '알파폴드 단백질 구조 데이터베이스'는 현재까지 190개국에서 50만명 이상의 연구 및 개발자등이 2백만 개 이상의 구조를 확인했으며, 2억 개 이상의 모든 구조는 구글 클라우드 공개 데이터세트(Google Cloud Public Datasets)와 깃허브(바로가기)를 통해 대량 다운로드가 가능해져 전 세계 연구 및 과학자 개발자들의 접근성을 혁신적으로 높였다.

Nature 기사 바로가기   
‘The entire protein universe’: AI predicts shape of nearly every known protein

한글기사 바로가기
출처 : 한건필 기자 (코메디닷컴)
“AI 알파폴드, 지구상 모든 단백질 구조 예측” 지구상 100만 종 생명체의 2억 개 단백질 구조 예측 완료

한글기사바로가기
출처 : 최창현기자 (인공지능신문)

인공지능 플랫폼 '알파폴드', 지구상 거의 모든 단백질 구조 예측...2억개 이상 ‘3D 단백질 구조' 오픈소스로!