指示に従ったシングルセル解析のためのマルチモーダルAIコパイロット
A Multi-Modal AI Copilot for Single-Cell Analysis with Instruction Following
January 14, 2025
著者: Yin Fang, Xinle Deng, Kangwei Liu, Ningyu Zhang, Jingyang Qian, Penghui Yang, Xiaohui Fan, Huajun Chen
cs.AI
要旨
大規模言語モデルは、複雑な自然言語の指示を解釈するのに優れており、幅広いタスクを実行することができます。生命科学において、単一細胞RNAシーケンシング(scRNA-seq)データは細胞生物学の「言語」として機能し、単一細胞レベルで複雑な遺伝子発現パターンを捉えます。しかし、この「言語」とのやり取りを従来のツールを通じて行うことはしばしば非効率的で直感的でなく、研究者にとって課題を提起しています。これらの制約に対処するために、私たちはInstructCellを提案します。これは、自然言語をより直接的かつ柔軟に単一細胞解析に活用するためのマルチモーダルAIコパイロットです。私たちは、テキストベースの指示とさまざまな組織や種のscRNA-seqプロファイルをペアにした包括的なマルチモーダル指示データセットを構築します。これに基づいて、両方のモダリティを同時に解釈および処理できるマルチモーダル細胞言語アーキテクチャを開発します。InstructCellは、研究者が細胞型注釈、条件付き擬似細胞生成、および薬剤感受性予測などの重要なタスクを、わかりやすい自然言語コマンドを使用して達成できるようにします。包括的な評価により、InstructCellが既存の単一細胞基盤モデルの性能を一貫して満たすか上回ることが示され、さまざまな実験条件に適応します。さらに重要なことに、InstructCellは複雑な単一細胞データを探索するためのアクセスしやすく直感的なツールを提供し、技術的な障壁を低くし、より深い生物学的洞察を可能にします。
English
Large language models excel at interpreting complex natural language
instructions, enabling them to perform a wide range of tasks. In the life
sciences, single-cell RNA sequencing (scRNA-seq) data serves as the "language
of cellular biology", capturing intricate gene expression patterns at the
single-cell level. However, interacting with this "language" through
conventional tools is often inefficient and unintuitive, posing challenges for
researchers. To address these limitations, we present InstructCell, a
multi-modal AI copilot that leverages natural language as a medium for more
direct and flexible single-cell analysis. We construct a comprehensive
multi-modal instruction dataset that pairs text-based instructions with
scRNA-seq profiles from diverse tissues and species. Building on this, we
develop a multi-modal cell language architecture capable of simultaneously
interpreting and processing both modalities. InstructCell empowers researchers
to accomplish critical tasks-such as cell type annotation, conditional
pseudo-cell generation, and drug sensitivity prediction-using straightforward
natural language commands. Extensive evaluations demonstrate that InstructCell
consistently meets or exceeds the performance of existing single-cell
foundation models, while adapting to diverse experimental conditions. More
importantly, InstructCell provides an accessible and intuitive tool for
exploring complex single-cell data, lowering technical barriers and enabling
deeper biological insights.Summary
AI-Generated Summary