虚拟细胞研究进入Next Level：中国学者推出“细胞锻造厂”，让AI智能体自主设计优化虚拟细胞模型

发布时间：2026-04-13来源：生物世界

撰文丨王聪

编辑丨王多鱼

排版丨水成文

在计算生物学这一融合了生命科学与数据科学的前沿领域，科学家们长期面临一个巨大挑战：如何设计出能精准预测细胞在药物、基因编辑等干预下如何反应的数学模型（即虚拟细胞模型）。这个过程需要同时精通机器学习、统计学和深厚的生物学知识，以同时解决生物学复杂性、多模态数据异质性以及跨学科专业知识，堪称“跨学科炼金术”。

近日，耶鲁大学博士生唐相儒等人联合宾夕法尼亚大学、亥姆霍兹慕尼黑中心、斯坦福大学、谷歌 DeepMind 及哈佛大学等机构的研究人员，在预印本平台 arXiv 上发表了题为：CellForge: Agentic Design of Virtual Cell Models 的研究论文。

该研究推出了 CellForge（细胞锻造厂），这是一个多智能体框架，其作为 AI 科研总指挥，能够根据不同的生物医学研究任务，自主设计、优化并实现一套完整的虚拟细胞模型，其表现甚至能与人类专家设计的顶尖虚拟细胞模型一较高下。

CellForge 突显了多智能体框架的科学价值：多个专业智能体之间的协作能够实现真正的方法创新以及单个智能体或人类专家无法实现的可执行解决方案。这标志着计算生物学中自主科学方法开发范式的转变。

虚拟细胞：数字世界里的生命模拟

要理解 CellForge 做了什么，首先要了解“虚拟细胞建模”（Virtual Cell Modeling）这个领域。简单来说，它的目标是在计算机中模拟一个细胞，并预测当这个细胞遭遇“扰动”时会发生什么。

这些“扰动”可以是一次基因敲除、一种新药的刺激，或是细胞因子的作用。通过单细胞 RNA 测序（scRNA-seq）等技术，科学家能获取细胞在扰动前后数万个基因的表达数据，海量而复杂。

传统上，针对每一个新数据集、新扰动类型，研究人员都需要结合领域知识，手动设计或挑选合适的机器学习模型架构，过程繁琐且高度依赖专家经验。这就像为每一位病人量身定制一套完全不同的诊断算法，效率低下且难以推广。

从“单打独斗”到“团队作战”：AI 智能体的科研革命

CellForge 的核心创新，在于它采用了“多智能体”（Multi-Agent）协作框架。可以理解为这是一个高度专业化的 AI 科研团队，而不是一个单一的、试图解决所有问题的“超级 AI”。

这个团队分工明确，配合默契——

1、任务分析模块：相当于团队的“情报官”和“文献调研员”。它首先自动解析用户给的单细胞数据集，理解其中包含的细胞类型、扰动信息、数据特征等。接着，它会自动检索相关的科学文献，从中汲取设计模型的灵感和原则。

2、设计模块：这是团队的“智囊团”和“辩论会”。系统会动态组建一个专家小组，成员可能包括“数据专家”、“单细胞生物学专家”、“深度学习架构师”等。它们以“角色扮演”的方式，围绕任务展开基于图结构的讨论。

每位专家提出自己的模型设计方案。
一位“评审专家”负责点评每个方案的优缺点并打分。
专家们也会互相评价同行的方案。
通过多轮辩论，方案不断融合、改进，直到所有专家对某个设计达成高度共识。这个过程能催生出人类专家可能想不到的创新架构，例如论文中提到的、用于处理时间动态数据的“轨迹感知编码器”。

3、实验执行模块：这是团队的“工程师”和“实验员”。一旦设计方案确定，该模块会自动将其转化为可运行的代码，并管理整个训练过程。它具备“自我调试”能力，遇到代码错误时会分析问题、自动修补并重新尝试。训练中还能进行轻量的超参数调优，并在完成后自动验证模型性能。

这个框架的魅力在于，它不是从一堆预设的模板中做选择，而是通过智能体之间基于知识的辩论与协作，真正从零开始“创造”出一个新的、针对特定任务优化的模型。这超越了简单的超参数调优，实现了方法论层面的创新。

实战检验：媲美顶尖专家，探索未知领域

研究团队在六个公开的单细胞扰动数据集上对 CellForge 进行了全面测试，任务涵盖基因敲除、药物处理、细胞因子刺激等多种类型，数据模态也包括了 scRNA-seq（用于检测基因表达情况）、scATAC-seq（用于分析染色质可及性）、CITE-seq（同时检测 RNA 和蛋白质）等。

在已知方法较多的领域（例如基因敲除的 scRNA-seq 数据），CellForge 自动设计的模型表现出了强大的竞争力。在 Adamson 和 Norman 这两个经典数据集上，其模型在预测扰动后基因表达的关键指标（例如 MSE、PCC、R²）上，与 CPA、scGPT、Biolord 等人类设计的顶尖模型不相上下，甚至在部分指标上实现超越。

在缺乏成熟方法的“无人区”，CellForge 的价值更加凸显。例如，在预测染色质可及性变化（scATAC-seq 数据）或蛋白质表达变化（CITE-seq 数据）的任务上，由于没有现成的专用模型，传统的基线方法（例如线性回归、随机森林）表现平平。而 CellForge 能够自主设计出适应这些独特数据模态的定制化架构，取得了显著的性能提升。这证明了其方法具备强大的泛化能力和探索性。

不止于预测：理解生命的“黑匣子”

一个好的模型不仅要预测得准，还要让人类理解其决策。CellForge 的设计也考虑到了生物学的可解释性。

评估显示，其模型能有效识别出在扰动中真正发生关键变化的基因（差异表达基因），并且预测的细胞状态在整体结构上与真实生物学图谱保持一致。通路富集分析也证实，模型捕捉到的信号与已知的生物学通路（例如 NF-κB、p53 信号通路）相符。

未来与挑战：迈向自主科学发现

CellForge 代表了一种科研范式的转变：从人类指导 AI 执行单一任务，转向 AI 自主管理从问题分析到方法实现的全流程。它为计算生物学，乃至更广泛的科学领域，提供了一条自动化方法开发的新路径。

当然，这条路并非一片坦途。论文也诚实地指出了当前局限：

结果可变性：由于自动设计过程的随机性，不同次运行产生的模型性能会有波动，需要多次运行以确保获得稳健的好模型。
计算成本：多智能体的讨论、代码生成与调试、模型训练会消耗可观的算力和 API 调用成本。但相比耗费顶尖科学家数月的人工设计时间，这种成本或许是可以接受的效率交换。

研究团队在论文中分享了一个鼓舞人心的试点案例：两位完全不了解该框架的湿实验室研究人员，仅凭入门教程，就在大约一小时内，成功使用 CellForge 为他们的实际研究问题（免疫治疗和心血管疾病建模）自动设计并训练出了有效的预测模型。

这预示着，此类工具有望极大地降低先进计算建模的门槛，让更多生物学家能将精力聚焦于科学问题本身，而非复杂的编程与算法设计。

CellForge 就像一座刚刚点燃炉火的“锻造厂”，只是，它锻造的不是钢铁，而是探索生命奥秘的智能工具。它的出现告诉我们，AI 在科研中的角色，正从得力的“助手”，向富有创造力的“合作者”悄然演进。

论文链接：

https://arxiv.org/pdf/2508.02276

设置星标，不错过精彩推文

开放转载

欢迎转发到朋友圈和微信群

微信加群

为促进前沿研究的传播和交流，我们组建了多个专业交流群，长按下方二维码，即可添加小编微信进群，由于申请人数较多，添加微信时请备注：学校/专业/姓名，如果是PI/教授，还请注明。

点在看，传递你的品味

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。