PepTune: Generazione De Novo di Peptidi Terapeutici con Diffusione Discreta Guidata da Multi-Obiettivo

PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

December 23, 2024
Autori: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI

Abstract

I terapeutici peptidici, una classe principale di medicinali, hanno ottenuto un notevole successo in diverse patologie come il diabete e il cancro, con esempi di rilievo come gli agonisti del recettore GLP-1 che hanno rivoluzionato il trattamento del diabete di tipo 2 e dell'obesità. Nonostante il loro successo, progettare peptidi che soddisfino obiettivi contrastanti multipli, come l'affinità di legame con il bersaglio, la solubilità e la permeabilità della membrana, rimane una sfida importante. Lo sviluppo di farmaci classico e il design basato sulla struttura sono inefficaci per compiti del genere, poiché non riescono ad ottimizzare le proprietà funzionali globali critiche per l'efficacia terapeutica. I framework generativi esistenti sono in gran parte limitati a spazi continui, output non condizionati o guida a singolo obiettivo, rendendoli inadatti all'ottimizzazione di sequenze discrete attraverso proprietà multiple. Per affrontare questo problema, presentiamo PepTune, un modello di diffusione discreta multi-obiettivo per la generazione e l'ottimizzazione simultanea di SMILES peptidici terapeutici. Basato sul framework Masked Discrete Language Model (MDLM), PepTune garantisce strutture peptidiche valide con programmi di mascheramento dipendenti dallo stato e obiettivi basati su penalità. Per guidare il processo di diffusione, proponiamo una strategia basata su Monte Carlo Tree Search (MCTS) che bilancia l'esplorazione e lo sfruttamento per affinare iterativamente sequenze di Pareto ottimali. MCTS integra ricompense basate su classificatori con l'espansione dell'albero di ricerca, superando le sfide di stima del gradiente e la scarsità di dati intrinseche agli spazi discreti. Utilizzando PepTune, generiamo peptidi diversi e chimicamente modificati ottimizzati per molteplici proprietà terapeutiche, inclusa l'affinità di legame con il bersaglio, la permeabilità della membrana, la solubilità, l'emolisi e le caratteristiche anti-incrostazione su vari bersagli rilevanti per malattie. Nel complesso, i nostri risultati dimostrano che la diffusione discreta guidata da MCTS è un approccio potente e modulare per il design di sequenze multi-obiettivo in spazi di stato discreti.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

Summary

AI-Generated Summary

PDF32December 26, 2024