맞춤형 동역학을 위한 언어 확산 모델 기반 에이전트형 종단 간 데노보 단백질 설계
Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model
February 14, 2025
저자: Bo Ni, Markus J. Buehler
cs.AI
초록
단백질은 효소 촉매, 신호 전달, 구조적 적응 등 생물학적 기능이 그 움직임과 본질적으로 연결된 동적 분자 기계입니다. 그러나 특정 동적 특성을 가진 단백질을 설계하는 것은 서열, 구조, 분자 운동 간의 복잡하고 퇴화된 관계로 인해 여전히 도전적인 과제로 남아 있습니다. 본 연구에서는 정규 모드 진동에 기반한 종단간 데노보 단백질 설계를 가능하게 하는 생성형 AI 프레임워크인 VibeGen을 소개합니다. VibeGen은 지정된 진동 모드를 기반으로 서열 후보를 생성하는 단백질 설계자와 이들의 동적 정확성을 평가하는 단백질 예측자로 구성된 에이전트 이중 모델 아키텍처를 채택합니다. 이 접근법은 설계 과정에서 다양성, 정확성, 그리고 독창성을 시너지적으로 결합합니다. 전체 원자 수준의 분자 시뮬레이션을 통한 직접 검증을 통해, 설계된 단백질들이 다양한 안정적이고 기능적으로 관련된 구조를 채택하면서도 백본 전체에 걸쳐 규정된 정규 모드 진폭을 정확히 재현함을 입증했습니다. 특히, 생성된 서열들은 데노보로, 자연계 단백질과 유의미한 유사성을 보이지 않아, 진화적 제약을 넘어 접근 가능한 단백질 공간을 확장합니다. 우리의 연구는 단백질 동역학을 생성형 단백질 설계에 통합하고, 서열과 진동 행동 간의 직접적이고 양방향적인 연결을 확립함으로써, 맞춤형 동적 및 기능적 특성을 가진 생체분자 공학을 위한 새로운 경로를 열었습니다. 이 프레임워크는 유연한 효소, 동적 스캐폴드, 생체재료의 합리적 설계에 광범위한 함의를 가지며, 동역학 정보를 기반으로 한 AI 주도 단백질 공학으로의 길을 열어줍니다.
English
Proteins are dynamic molecular machines whose biological functions, spanning
enzymatic catalysis, signal transduction, and structural adaptation, are
intrinsically linked to their motions. Designing proteins with targeted dynamic
properties, however, remains a challenge due to the complex, degenerate
relationships between sequence, structure, and molecular motion. Here, we
introduce VibeGen, a generative AI framework that enables end-to-end de novo
protein design conditioned on normal mode vibrations. VibeGen employs an
agentic dual-model architecture, comprising a protein designer that generates
sequence candidates based on specified vibrational modes and a protein
predictor that evaluates their dynamic accuracy. This approach synergizes
diversity, accuracy, and novelty during the design process. Via full-atom
molecular simulations as direct validation, we demonstrate that the designed
proteins accurately reproduce the prescribed normal mode amplitudes across the
backbone while adopting various stable, functionally relevant structures.
Notably, generated sequences are de novo, exhibiting no significant similarity
to natural proteins, thereby expanding the accessible protein space beyond
evolutionary constraints. Our work integrates protein dynamics into generative
protein design, and establishes a direct, bidirectional link between sequence
and vibrational behavior, unlocking new pathways for engineering biomolecules
with tailored dynamical and functional properties. This framework holds broad
implications for the rational design of flexible enzymes, dynamic scaffolds,
and biomaterials, paving the way toward dynamics-informed AI-driven protein
engineering.Summary
AI-Generated Summary