연구동향
초-거대 화합물 라이브러리 (Ultra-Large Chemical Libraries) 활용 신약개발연구
Author
관리자
Date
2025-04-07 14:06
Views
123
글로벌 신약개발연구 통계에 의하면 임상진입 신약후보물질의 90%는 여러 가지 이유(약물성 or 약효 부족)로 실패하며 오직 10% 정도만 FDA의 허가를 받는 것으로 나타났다. 그리고 2020년 기준 글로벌 신약 1개의 개발비용은 평균 28억달러(4조원)에 달한다고 보고되어 있다.
신약개발비용에는 90%의 실패비용도 포함되어 있으므로 효과적으로 신약을 개발하기 위해서는 전임상단계에서 우수한 효능과 약물성을 가진 최적의 후보물질을 발굴하여 임상연구를 진행하는 것이 신약개발의 성공률을 높이고 개발비용을 절감할 수 있을 것이다.
빠른 시간내에 저비용으로 우수한 약물성을 가지는 화합물을 찾는 방법으로 대량의 화합물 라이브러리를 활용하여 고효율 가상검색 (High-Throughput Virtual Screening) 기술을 사용하는 방법이 많이 이용되고 있다. 컴퓨터의 연산 능력(computational power)과 대량의 화합물 구조 및 정보를 처리할 수 있는 알고리즘 기술 및 관련 소프트웨어의 발전에 따라 가상검색에 활용할 수 있는 화합물 라이브러리의 규모도 급격하게 증가하고 있다.
대표적으로 신약개발 가상탐색연구에 많이 사용되고 있는 ZINC database에 포함된 (commercial available compounds) 화합물의 개수는 2004년 73만개였으나 2023년에 발표된 ZINC-22 database에는 370억개 이상의 화합물 구조와 정보를 제공한다. 즉, 18년 사이에 database의 규모가 5만배 이상 증가하였다.
ZINC-22에 포함된 370억개 이상의 화합물 라이브러리는 2D-포맷으로 열거 및 검색이 가능하며 (enumerated, searchable, commercially available compounds in 2D), 그중 45억 개 이상의 화합물은 특정 생물학적 타깃에 대하여 docking 연구를 할 수 있는 3D-포맷으로 구축되어 있다 (biologically relevant ready-to-dock 3D formats). (논문 바로가기)
화합물 라이브러리 규모의 획기적 증가는 주로 “make-on-demand” 라이브러리 화합물의 증가에 기인한다. 2010년대 초반까지의 화합물 database는 대부분 “in-stock” 라이브러리 화합물로 구성되어 있었기 때문에 가상탐색의 결과 우수한 약효 및 활성을 가질 것으로 예측된 후보물질은 쉽게 실물 화합물을 확보하여 실험으로 검증할 수 있었다. 그러나 “in-stock” 화합물 라이브러리를 빠르게 확장하기는 물리적으로 쉽지 않기 때문에 2010년대 후반부터 “make-on-demand” 화합물 라이브러리가 도입되어 화합물 database 규모가 획기적으로 증가하게 되었다. (ZINC database에 포함된 화합물의 99% 이상은 make-on-demand 라이브러리 화합물로 구성됨. 주로 Enamine의 “REAL”, WuXi의 “GalaXi”, Mcule의 “Ultimate”로 구성)

현재 Enamine, Chembridge, WiXi, Mcule 등 수백만개 이상의 building block을 판매하고 있는 화합물 vendor들을 중심으로 수십억~수백억개 이상 규모의 make-on-demand 화합물 라이브러리가 제공되고 있다. 앞으로 새로운 구조의 drug-like 화합물을 합성할 수 있는 혁신적인 합성방법이 개발될수록 활용할 수 있는 make-on-demand 라이브러리의 규모는 훨씬 증가할 것이며 따라서 신약개발연구에서 접근할 수 있는 chemical space도 훨씬 넓어질 수 있을 것이다.
또한 최근 알파폴드-2 및 3의 개발에 따라 단백질의 서열 정보만 있으면 3차원 구조를 얻을 수 있고 더불어 더 많은 화합물 라이브러리를 활용하여 보다 넓은 chemical space에 대한 가상탐색연구를 할 수 있으므로 신약개발연구의 효율성 및 성공율도 높아질 수 있을 것이다.
고효율 가상검색에 활용할 수 있는 화합물 라이브러리의 규모의 획기적 증가와 함께 선별된 화합물을 어떻게 쉽게 확보할 수 있는가 하는 관점에서 저렴하고 쉽게 선별화합물을 확보할 수 있는 make-on-demand 라이브러리 연구가 수많은 building block을 판매하고 있는 글로벌 화합물 vendor를 중심으로 진행되고 많이 있다.

고효율 가상검색 (High-Throughput Virtual Screening)에 활용할 수 있는 공공 및 상업적으로 제공되고 있는 대표적인 make-on-demand 라이브러리를 소개한다.
1. REAL(REadily AccessibLe) space : 649억개(64.9B) 화합물로 구성 (바로가기)
신약개발비용에는 90%의 실패비용도 포함되어 있으므로 효과적으로 신약을 개발하기 위해서는 전임상단계에서 우수한 효능과 약물성을 가진 최적의 후보물질을 발굴하여 임상연구를 진행하는 것이 신약개발의 성공률을 높이고 개발비용을 절감할 수 있을 것이다.
빠른 시간내에 저비용으로 우수한 약물성을 가지는 화합물을 찾는 방법으로 대량의 화합물 라이브러리를 활용하여 고효율 가상검색 (High-Throughput Virtual Screening) 기술을 사용하는 방법이 많이 이용되고 있다. 컴퓨터의 연산 능력(computational power)과 대량의 화합물 구조 및 정보를 처리할 수 있는 알고리즘 기술 및 관련 소프트웨어의 발전에 따라 가상검색에 활용할 수 있는 화합물 라이브러리의 규모도 급격하게 증가하고 있다.
대표적으로 신약개발 가상탐색연구에 많이 사용되고 있는 ZINC database에 포함된 (commercial available compounds) 화합물의 개수는 2004년 73만개였으나 2023년에 발표된 ZINC-22 database에는 370억개 이상의 화합물 구조와 정보를 제공한다. 즉, 18년 사이에 database의 규모가 5만배 이상 증가하였다.
ZINC-22에 포함된 370억개 이상의 화합물 라이브러리는 2D-포맷으로 열거 및 검색이 가능하며 (enumerated, searchable, commercially available compounds in 2D), 그중 45억 개 이상의 화합물은 특정 생물학적 타깃에 대하여 docking 연구를 할 수 있는 3D-포맷으로 구축되어 있다 (biologically relevant ready-to-dock 3D formats). (논문 바로가기)
화합물 라이브러리 규모의 획기적 증가는 주로 “make-on-demand” 라이브러리 화합물의 증가에 기인한다. 2010년대 초반까지의 화합물 database는 대부분 “in-stock” 라이브러리 화합물로 구성되어 있었기 때문에 가상탐색의 결과 우수한 약효 및 활성을 가질 것으로 예측된 후보물질은 쉽게 실물 화합물을 확보하여 실험으로 검증할 수 있었다. 그러나 “in-stock” 화합물 라이브러리를 빠르게 확장하기는 물리적으로 쉽지 않기 때문에 2010년대 후반부터 “make-on-demand” 화합물 라이브러리가 도입되어 화합물 database 규모가 획기적으로 증가하게 되었다. (ZINC database에 포함된 화합물의 99% 이상은 make-on-demand 라이브러리 화합물로 구성됨. 주로 Enamine의 “REAL”, WuXi의 “GalaXi”, Mcule의 “Ultimate”로 구성)
- “in-stock” 라이브러리 : “이미 합성되어 있어서” (상업적으로) 쉽게 확보할 수 있는 화합물 라이브러리
- “make-on-demand” 라이브러리 (주문형 합성 화합물 라이브러리) : "현재 실물 화합물은 없지만" (1) 라이브러리 화합물의 합성 방법이 잘 확립되어 있고 (검증되어 있고) (2) 라이브러리 화합물을 합성할 수 있는 출발물질(building block)을 쉽게 확보(구매)할 수 있기 때문에 필요하면 (가상탐색 결과로 hit 화합물이 도출되면) 맞춤형으로 즉시 합성 요청하여 확보할 수 있는 화합물 라이브러리. 수많은 building block을 조합적(combinatorial)으로 활용하여 검증된 다양한 합성방법에 따라 라이브러리를 구성할 수 있는 화합물의 수는 급격하게 확대될 수 있다. 예로서, (building block 1: 1만종) x (building block 2: 1만종) x (확립된 합성방법: 100종류) = 100억종 make-on-demand 화합물 라이브러리 구성 가능.
[초-거대 화합물 라이브러리를 활용한 가상탐색 Scheme]

(1) 구매 가능한 빌딩 블록을 인실리코(in silico)로 조합적으로 결합하여 수십억 개의 화합물을 포함하는 make-on-demand library 구성. make-on-demand library에서 선택된 화합물은 화합물 vendor로 부터 저렴한 비용으로 신속하게 주문합성 가능. (2) 대형 라이브러리 docking screening을 위한 표적 단백질 템플릿은 실험적(X-ray, cryoEM) 또는 AlphaFold2/3 예측구조 활용.
현재 Enamine, Chembridge, WiXi, Mcule 등 수백만개 이상의 building block을 판매하고 있는 화합물 vendor들을 중심으로 수십억~수백억개 이상 규모의 make-on-demand 화합물 라이브러리가 제공되고 있다. 앞으로 새로운 구조의 drug-like 화합물을 합성할 수 있는 혁신적인 합성방법이 개발될수록 활용할 수 있는 make-on-demand 라이브러리의 규모는 훨씬 증가할 것이며 따라서 신약개발연구에서 접근할 수 있는 chemical space도 훨씬 넓어질 수 있을 것이다.
또한 최근 알파폴드-2 및 3의 개발에 따라 단백질의 서열 정보만 있으면 3차원 구조를 얻을 수 있고 더불어 더 많은 화합물 라이브러리를 활용하여 보다 넓은 chemical space에 대한 가상탐색연구를 할 수 있으므로 신약개발연구의 효율성 및 성공율도 높아질 수 있을 것이다.
고효율 가상검색에 활용할 수 있는 화합물 라이브러리의 규모의 획기적 증가와 함께 선별된 화합물을 어떻게 쉽게 확보할 수 있는가 하는 관점에서 저렴하고 쉽게 선별화합물을 확보할 수 있는 make-on-demand 라이브러리 연구가 수많은 building block을 판매하고 있는 글로벌 화합물 vendor를 중심으로 진행되고 많이 있다.
[“초-거대 화합물 라이브러리” 종류, 화합물 규모, 사용구분 (commercial, public, proprietary)] (바로가기)

고효율 가상검색 (High-Throughput Virtual Screening)에 활용할 수 있는 공공 및 상업적으로 제공되고 있는 대표적인 make-on-demand 라이브러리를 소개한다.
1. REAL(REadily AccessibLe) space : 649억개(64.9B) 화합물로 구성 (바로가기)
- 글로벌 화합물 vendor인 “Enamine”사가 제공하는 make-on-demand 화합물 라이브러리
- Enamine사가 보유하고 있는 170,000종 이상의 building block을 사용하여 167개의 잘 검증된 병렬합성 반응을 통하여 조립된 649억개 화합물로 구성됨
- REAL database : drug-like property (Ro5 & Veber criteria: MW≤500, SlogP≤5, HBA≤10, HBD≤5, RotBonds≤10, and TPSA≤140)를 만족하는 화합물 96억개로 구성
- 모든 화합물은 요청하면 3~4주 내 합성하여 제공
- 글로벌 화합물 vendor인 “OTAVA”사가 제공하는 make-on-demand 화합물 라이브러리
- 독자적인 325개의 합성반응(multi-component & ring-closure 반응 등)을 통하여 조립된 550억개의 화합물로 구성됨
- Peptidomimetic, PROTAC, Natural Product-like, PPI Modulator 등 RO5를 넘어서는 화합물도 포함
- 모든 화합물은 요청하면 4~8주 내 합성하여 제공
- Computational Chemistry, Bioinformatics & Machine Learning을 활용한 신약개발 솔루션을 제공하는 회사인 “Chemspace”사에서 제공하는 make-on-demand 화합물 라이브러리
- 40개의 합성반응과 ML(Machine Learning)을 통해 선별한 building block을 통하여 조립된 1420억개(142B) 화합물로 구성
- RO5를 만족하는 drug-like 화합물 200억개와 RO5를 넘어서는 화합물 680억개 포함
- 모든 화합물은 요청하면 4~6주 내 합성하여 제공
- 글로벌 화합물 vendor인 “Ambinter”사가 제공하는 make-on-demand 화합물 라이브러리
- 자사가 보유하고 있는 선별된 building block 5만여개와 32개의 선별된 합성반응을 통하여 조합된 1100억개(110B) 화합물로 구성
- 대부분 drug-like 물성을 가지는 화합물로 구성
- 모든 화합물은 요청하면 합성하여 제공
- 신약개발연구에 활용되는 화합물을 판매하는 210여개의 글로벌 vendor의 정보를 모아서 화합물(building blocks & screening compounds) 검색 및 구매, 합성 방법, 관리, 규제정보 등을 취합/가공하여 제공하는 플랫폼 회사인 “eMolecules”사가 제공하는 make-on-demand 화합물 라이브러리
- 자사가 확보할 수 있는 building block과 45개의 검증된 합성반응을 통하여 조합된 4조9000억개(4.9T) 화합물로 구성
- 대부분 drug-like 물성을 가지는 화합물로 구성
- “Do-it-yourself” : “eMolecules”은 화합물을 직접 합성/판매하는 회사가 아니므로 필요 화합물에 대하여 출발물질(building block)만 제공하며 사용자가 직접 합성하거나 CRO를 통해서 합성하여야 함
- 신약개발관련 화합물(small molecules, oligonucleotides, peptides 등)의 합성/판매, 관련 연구지원(CRDMO: Contract Research, Development and Manufacturing Organization)을 제공하는 회사인 “WuXi AppTec”이 만든 개방형 기술 플랫폼인 “WuXi LabNetwork”와 컴퓨터 활용 신약개발 기술 및 소프트웨어 개발회사인 독일의 “BioSolveIT”사가 협동하여 제공하는 make-on-demand 화합물 라이브러리
- 미국 국립 암연구소 (National Cancer Institute/NIH)가 개발하여 제공하는 공공(public) make-on-demand 화합물 라이브러리
- 53개의 검증된 합성반응과 Enamine사에서 즉시 구입할 수 있는 150,000종의 building block으로 조합된 17.5억개(1.75B) 화합물로 구성
- Canada 연구자들이 개발한 특별한(unique) 합성반응과 ZINC database에서 저렴하고 쉽게 구할 수 있는 building block을 조합하여 만들어진 1500억개(150B) 화합물로 구성
- RO5 및 Veber rule를 만족하는 drug-like 화합물로 구성
- Enamine의 “REAL” 이나 NCI의 “SAVI” 같은 잘 알려진 ultra-large make-on-demand 화합물 라이브러리와 중복되지 않는 화합물로 구성됨
- 컴퓨터 활용 신약개발 기술 및 소프트웨어 개발회사인 독일의 “BioSolveIT”사와 글로벌 화합물 vendor인 “Enamine”사가 공동으로 제공하는 2조4000억개의 화합물로 구성된 make-on-demand 화합물 라이브러리
- 컴퓨터 및 AI 활용 신약개발 지원 플랫폼 회사인 “히츠(HITS)”가 eMolecules 화합물을 활용하여 제공하는 7조개의 화합물과 딥러닝(Deep Learning) 기술을 활용하여 효율적으로 가상탐색을 할 수 있는 시스템 제공.
작성 : 이현규(한국화학연구원)
참고자료- Chemical Spaces, Ultra-Large Compound Collections (바로가기)
- Exploration of Ultra-large Compound Collections for Drug Discovery. Journal of Chemical Information and Modeling, 2022. (바로가기)
- Structure-based virtual screening of vast chemical space as a starting point for drug discovery. Current Opinion in Structural Biology, 2014. (바로가기)
- The ‘Big Bang’ of the chemical universe. Nature Chemical Biology, 2023. (바로가기)
- Ultra-Large Virtual Screening: Definition, Recent Advances, and Challenges in Drug Design. Molecular Informatics, 2025. (바로가기)