ChatPaper.aiChatPaper

PepTune: 多目的に誘導された離散拡散による治療用ペプチドのDe Novo生成

PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

December 23, 2024
著者: Sophia Tang, Yinuo Zhang, Pranam Chatterjee
cs.AI

要旨

ペプチド医薬品は、糖尿病やがんなどの疾患で顕著な成功を収めており、GLP-1受容体アゴニストなどの画期的な例により、2型糖尿病や肥満の治療が革新されています。その成功にもかかわらず、標的結合親和性、溶解性、および膜透過性など、複数の相反する目標を満たすペプチドを設計することは依然として大きな課題です。従来の薬物開発や構造ベースの設計は、治療効果に重要なグローバルな機能特性を最適化することができないため、このようなタスクには効果がありません。既存の生成フレームワークは、主に連続空間、非条件付き出力、または単一目的のガイダンスに限定されており、複数の特性にわたる離散系列の最適化には適していません。この課題に対処するため、我々はPepTuneを提案します。これは、治療用ペプチドSMILESの同時生成と最適化のための多目的離散拡散モデルです。Masked Discrete Language Model(MDLM)フレームワークに基づいて構築されたPepTuneは、状態依存のマスキングスケジュールとペナルティベースの目的を用いて有効なペプチド構造を確保します。拡散プロセスをガイドするために、Monte Carlo Tree Search(MCTS)ベースの戦略を提案し、探索と活用をバランスよく取り入れてパレート最適なシーケンスを反復的に洗練します。MCTSは、分類器ベースの報酬と探索木の展開を統合し、離散空間固有の勾配推定の課題とデータのまばらさを克服します。PepTuneを用いて、標的結合親和性、膜透過性、溶解性、溶血作用、および各種疾患関連標的における非付着特性など、複数の治療特性に最適化された多様な化学修飾ペプチドを生成します。総じて、我々の結果は、MCTSによる離散拡散が離散状態空間における多目的シーケンス設計において強力かつモジュラーなアプローチであることを示しています。
English
Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

Summary

AI-Generated Summary

PDF52December 26, 2024