PepTune: Geração De Novo de Peptídeos Terapêuticos com Difusão Discreta Guiada por Múltiplos Objetivos

PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

December 23, 2024
Autores: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI

Resumo

As terapêuticas peptídicas, uma importante classe de medicamentos, alcançaram um sucesso notável em diversas doenças, como diabetes e câncer, com exemplos marcantes como os agonistas do receptor GLP-1 revolucionando o tratamento do diabetes tipo 2 e da obesidade. Apesar de seu sucesso, o desafio de projetar peptídeos que satisfaçam múltiplos objetivos conflitantes, como afinidade de ligação ao alvo, solubilidade e permeabilidade da membrana, ainda persiste. O desenvolvimento de medicamentos clássico e o design baseado em estrutura são ineficazes para tais tarefas, pois falham em otimizar propriedades funcionais globais críticas para a eficácia terapêutica. Os frameworks generativos existentes são amplamente limitados a espaços contínuos, saídas não condicionadas ou orientação de um único objetivo, tornando-os inadequados para a otimização de sequências discretas em múltiplas propriedades. Para lidar com isso, apresentamos o PepTune, um modelo de difusão discreta multiobjetivo para a geração e otimização simultâneas de SMILES de peptídeos terapêuticos. Construído sobre o framework do Modelo de Linguagem Discreta Mascara (MDLM), o PepTune garante estruturas de peptídeos válidas com programações de mascaramento dependentes do estado e objetivos baseados em penalidades. Para guiar o processo de difusão, propomos uma estratégia baseada em Busca de Árvore de Monte Carlo (MCTS) que equilibra a exploração e a exploração para refinar iterativamente sequências de Pareto ótimas. O MCTS integra recompensas baseadas em classificadores com expansão de árvore de busca, superando desafios de estimação de gradiente e a escassez de dados inerentes a espaços discretos. Usando o PepTune, geramos peptídeos diversificados e quimicamente modificados otimizados para múltiplas propriedades terapêuticas, incluindo afinidade de ligação ao alvo, permeabilidade da membrana, solubilidade, hemólise e características de não-incrustação em vários alvos relevantes para doenças. No total, nossos resultados demonstram que a difusão discreta guiada por MCTS é uma abordagem poderosa e modular para o design de sequências multiobjetivo em espaços de estado discretos.
English
Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

Summary

AI-Generated Summary

PDF32December 26, 2024