라이브러리

AI 활용신약DB 상세

MOSES(MOlecule SEtS) database 2023-12-13
조회수 195

ZINC Clean Leads 컬렉션 기반의 데이터셋입니다.

250~350 Dalton 범위의 분자량으로 필터링하였고,  C, N, S, O, F, Cl, Br, H 이외의 전하를 띤 원자나 원자 또는 8개 이상의 원자를 포함하는 분자를 제거한 데이터입니다.

 약 1.6M, 176k 및 176k 분자를 포함하는 훈련, 테스트 및 스캐폴드 테스트 세트로 분할되어 있으며, 스캐폴드 테스트 세트에는 훈련 세트와 테스트 세트에는 없는 고유한 Bemis-Murcko 스캐폴드가 포함되어있습니다.


https://github.com/molecularsets/moses

  • Generative model ZINC Clean Leads Scaffold VAE GAN