ChatPaper.aiChatPaper

PepTune: 다중 목적으로 안내된 이산 확산을 이용한 치료용 펩타이드의 새로운 생성

PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

December 23, 2024
저자: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI

초록

펩타이드 치료제는 당뇨병과 암과 같은 질병에서 혁명적인 GLP-1 수용체 작용제와 같은 사례를 통해 주목할만한 성과를 거두었습니다. 그러나 성공에도 불구하고, 대상 결합 친화도, 용해도, 및 막 투과성과 같은 여러 상충하는 목표를 충족하는 펩타이드를 설계하는 것은 여전히 주요한 과제입니다. 이러한 작업에 대해 고전적인 약물 개발 및 구조 기반 설계는 치료 효과에 중요한 전역 기능적 특성을 최적화하지 못하여 비효과적입니다. 기존 생성 프레임워크는 주로 연속 공간, 조건 없는 출력 또는 단일 목적 가이드만을 다루어 여러 속성을 가로지르는 이산적인 시퀀스 최적화에는 적합하지 않습니다. 이에 대응하여 우리는 PepTune을 제시합니다. PepTune은 치료용 펩타이드 SMILES의 동시 생성 및 최적화를 위한 다중 목적 이산 확산 모델로, Masked Discrete Language Model (MDLM) 프레임워크 위에 구축되어 상태 의존적 마스킹 일정과 패널티 기반 목적을 보장합니다. 확산 과정을 안내하기 위해, 우리는 탐사와 개척을 균형있게 조절하는 몬테 카를로 트리 탐색(MCTS) 기반 전략을 제안하여 Pareto-최적 시퀀스를 반복적으로 정제합니다. MCTS는 분류기 기반 보상을 탐색 트리 확장과 통합하여, 이산 공간에 내재된 기울기 추정 도전과 데이터 희소성을 극복합니다. PepTune을 사용하여, 우리는 다양하고 화학적으로 수정된 펩타이드를 생성하여 여러 치료적 특성에 최적화하였습니다. 이를 통해 우리의 결과는 MCTS로 안내되는 이산 확산이 이산 상태 공간에서 다중 목적 시퀀스 설계에 강력하고 모듈식 접근 방식임을 입증합니다.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

Summary

AI-Generated Summary

PDF42December 26, 2024