ChatPaper.aiChatPaper

지침을 따르는 단일 세포 분석을 위한 멀티 모달 AI 동승자

A Multi-Modal AI Copilot for Single-Cell Analysis with Instruction Following

January 14, 2025
저자: Yin Fang, Xinle Deng, Kangwei Liu, Ningyu Zhang, Jingyang Qian, Penghui Yang, Xiaohui Fan, Huajun Chen
cs.AI

초록

대형 언어 모델은 복잡한 자연어 지시를 해석하는 데 뛰어나며, 이를 통해 다양한 작업을 수행할 수 있습니다. 생명 과학 분야에서 단일 세포 RNA 시퀀싱(scRNA-seq) 데이터는 세포 생물학의 "언어"로 기능하며, 단일 세포 수준에서 복잡한 유전자 발현 패턴을 포착합니다. 그러나 이 "언어"와 상호 작용하기 위해 전통적인 도구를 사용하는 것은 종종 비효율적이고 직관적이지 않아 연구자들에게 어려움을 줍니다. 이러한 제한을 해결하기 위해 우리는 InstructCell을 제안합니다. 이는 자연어를 매개로 더 직접적이고 유연한 단일 세포 분석을 위한 멀티 모달 AI 동료입니다. 우리는 텍스트 기반 지시사항과 다양한 조직 및 종의 scRNA-seq 프로필을 짝지은 포괄적인 멀티 모달 지시 데이터셋을 구축합니다. 이를 기반으로 우리는 동시에 두 가지 모드를 해석하고 처리할 수 있는 멀티 모달 세포 언어 아키텍처를 개발합니다. InstructCell은 연구자들이 세포 유형 주석, 조건부 의사 세포 생성, 그리고 약물 민감도 예측과 같은 중요한 작업을 간편한 자연어 명령을 사용하여 수행할 수 있도록 돕습니다. 철저한 평가 결과, InstructCell은 기존의 단일 세포 기반 모델의 성능을 일관되게 능가하며, 다양한 실험 조건에 적응합니다. 더 중요한 것은, InstructCell은 복잡한 단일 세포 데이터를 탐색하기 위한 접근 가능하고 직관적인 도구를 제공하여 기술적 장벽을 낮추고 더 깊은 생물학적 통찰력을 제공합니다.
English
Large language models excel at interpreting complex natural language instructions, enabling them to perform a wide range of tasks. In the life sciences, single-cell RNA sequencing (scRNA-seq) data serves as the "language of cellular biology", capturing intricate gene expression patterns at the single-cell level. However, interacting with this "language" through conventional tools is often inefficient and unintuitive, posing challenges for researchers. To address these limitations, we present InstructCell, a multi-modal AI copilot that leverages natural language as a medium for more direct and flexible single-cell analysis. We construct a comprehensive multi-modal instruction dataset that pairs text-based instructions with scRNA-seq profiles from diverse tissues and species. Building on this, we develop a multi-modal cell language architecture capable of simultaneously interpreting and processing both modalities. InstructCell empowers researchers to accomplish critical tasks-such as cell type annotation, conditional pseudo-cell generation, and drug sensitivity prediction-using straightforward natural language commands. Extensive evaluations demonstrate that InstructCell consistently meets or exceeds the performance of existing single-cell foundation models, while adapting to diverse experimental conditions. More importantly, InstructCell provides an accessible and intuitive tool for exploring complex single-cell data, lowering technical barriers and enabling deeper biological insights.

Summary

AI-Generated Summary

PDF242January 15, 2025