PepTune: Generazione De Novo di Peptidi Terapeutici con Diffusione Discreta Guidata da Multi-Obiettivo
PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion
December 23, 2024
Autori: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI
Abstract
I terapeutici peptidici, una classe principale di medicinali, hanno ottenuto un notevole successo in diverse patologie come il diabete e il cancro, con esempi di rilievo come gli agonisti del recettore GLP-1 che hanno rivoluzionato il trattamento del diabete di tipo 2 e dell'obesità. Nonostante il loro successo, progettare peptidi che soddisfino obiettivi contrastanti multipli, come l'affinità di legame con il bersaglio, la solubilità e la permeabilità della membrana, rimane una sfida importante. Lo sviluppo di farmaci classico e il design basato sulla struttura sono inefficaci per compiti del genere, poiché non riescono ad ottimizzare le proprietà funzionali globali critiche per l'efficacia terapeutica. I framework generativi esistenti sono in gran parte limitati a spazi continui, output non condizionati o guida a singolo obiettivo, rendendoli inadatti all'ottimizzazione di sequenze discrete attraverso proprietà multiple. Per affrontare questo problema, presentiamo PepTune, un modello di diffusione discreta multi-obiettivo per la generazione e l'ottimizzazione simultanea di SMILES peptidici terapeutici. Basato sul framework Masked Discrete Language Model (MDLM), PepTune garantisce strutture peptidiche valide con programmi di mascheramento dipendenti dallo stato e obiettivi basati su penalità. Per guidare il processo di diffusione, proponiamo una strategia basata su Monte Carlo Tree Search (MCTS) che bilancia l'esplorazione e lo sfruttamento per affinare iterativamente sequenze di Pareto ottimali. MCTS integra ricompense basate su classificatori con l'espansione dell'albero di ricerca, superando le sfide di stima del gradiente e la scarsità di dati intrinseche agli spazi discreti. Utilizzando PepTune, generiamo peptidi diversi e chimicamente modificati ottimizzati per molteplici proprietà terapeutiche, inclusa l'affinità di legame con il bersaglio, la permeabilità della membrana, la solubilità, l'emolisi e le caratteristiche anti-incrostazione su vari bersagli rilevanti per malattie. Nel complesso, i nostri risultati dimostrano che la diffusione discreta guidata da MCTS è un approccio potente e modulare per il design di sequenze multi-obiettivo in spazi di stato discreti.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable
success across diseases such as diabetes and cancer, with landmark examples
such as GLP-1 receptor agonists revolutionizing the treatment of type-2
diabetes and obesity. Despite their success, designing peptides that satisfy
multiple conflicting objectives, such as target binding affinity, solubility,
and membrane permeability, remains a major challenge. Classical drug
development and structure-based design are ineffective for such tasks, as they
fail to optimize global functional properties critical for therapeutic
efficacy. Existing generative frameworks are largely limited to continuous
spaces, unconditioned outputs, or single-objective guidance, making them
unsuitable for discrete sequence optimization across multiple properties. To
address this, we present PepTune, a multi-objective discrete diffusion model
for the simultaneous generation and optimization of therapeutic peptide SMILES.
Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures
valid peptide structures with state-dependent masking schedules and
penalty-based objectives. To guide the diffusion process, we propose a Monte
Carlo Tree Search (MCTS)-based strategy that balances exploration and
exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates
classifier-based rewards with search-tree expansion, overcoming gradient
estimation challenges and data sparsity inherent to discrete spaces. Using
PepTune, we generate diverse, chemically-modified peptides optimized for
multiple therapeutic properties, including target binding affinity, membrane
permeability, solubility, hemolysis, and non-fouling characteristics on various
disease-relevant targets. In total, our results demonstrate that MCTS-guided
discrete diffusion is a powerful and modular approach for multi-objective
sequence design in discrete state spaces.Summary
AI-Generated Summary