虚拟细胞研究进入Next Level：中国学者推出“细胞锻造厂”，让AI智能体自主设计优化虚拟细胞模型

撰文丨王聪

编辑丨王多鱼

排版丨水成文

在计算生物学这一融合了生命科学与数据科学的前沿领域，科学家们长期面临一个巨大挑战：如何设计出能精准预测细胞在药物、基因编辑等干预下如何反应的数学模型（即虚拟细胞模型）。这个过程需要同时精通机器学习、统计学和深厚的生物学知识，以同时解决生物学复杂性、多模态数据异质性以及跨学科专业知识，堪称“跨学科炼金术”。

近日，耶鲁大学博士生唐相儒等人联合宾夕法尼亚大学、亥姆霍兹慕尼黑中心、斯坦福大学、谷歌 DeepMind 及哈佛大学等机构的研究人员，在预印本平台 arXiv 上发表了题为：CellForge: Agentic Design of Virtual Cell Models 的研究论文。

该研究推出了 CellForge（细胞锻造厂），这是一个多智能体框架，其作为 AI 科研总指挥，能够根据不同的生物医学研究任务，自主设计、优化并实现一套完整的虚拟细胞模型，其表现甚至能与人类专家设计的顶尖虚拟细胞模型一较高下。

CellForge 突显了多智能体框架的科学价值：多个专业智能体之间的协作能够实现真正的方法创新以及单个智能体或人类专家无法实现的可执行解决方案。这标志着计算生物学中自主科学方法开发范式的转变。

虚拟细胞：数字世界里的生命模拟

要理解 CellForge 做了什么，首先要了解“虚拟细胞建模”（Virtual Cell Modeling）这个领域。简单来说，它的目标是在计算机中模拟一个细胞，并预测当这个细胞遭遇“扰动”时会发生什么。

这些“扰动”可以是一次基因敲除、一种新药的刺激，或是细胞因子的作用。通过单细胞 RNA 测序（scRNA-seq）等技术，科学家能获取细胞在扰动前后数万个基因的表达数据，海量而复杂。

传统上，针对每一个新数据集、新扰动类型，研究人员都需要结合领域知识，手动设计或挑选合适的机器学习模型架构，过程繁琐且高度依赖专家经验。这就像为每一位病人量身定制一套完全不同的诊断算法，效率低下且难以推广。

从“单打独斗”到“团队作战”：AI 智能体的科研革命

CellForge 的核心创新，在于它采用了“多智能体”（Multi-Agent）协作框架。可以理解为这是一个高度专业化的 AI 科研团队，而不是一个单一的、试图解决所有问题的“超级 AI”。

这个团队分工明确，配合默契——

1、任务分析模块：相当于团队的“情报官”和“文献调研员”。它首先自动解析用户给的单细胞数据集，理解其中包含的细胞类型、扰动信息、数据特征等。接着，它会自动检索相关的科学文献，从中汲取设计模型的灵感和原则。

2、设计模块：这是团队的“智囊团”和“辩论会”。系统会动态组建一个专家小组，成员可能包括“数据专家”、“单细胞生物学专家”、“深度学习架构师”等。它们以“角色扮演”的方式，围绕任务展开基于图结构的讨论。

每位专家提出自己的模型设计方案。
一位“评审专家”负责点评每个方案的优缺点并打分。
专家们也会互相评价同行的方案。
通过多轮辩论，方案不断融合、改进，直到所有专家对某个设计达成高度共识。这个过程能催生出人类专家可能想不到的创新架构，例如论文中提到的、用于处理时间动态数据的“轨迹感知编码器”。

3、实验执行模块：这是团队的“工程师”和“实验员”。一旦设计方案确定，该模块会自动将其转化为可运行的代码，并管理整个训练过程。它具备“自我调试”能力，遇到代码错误时会分析问题、自动修补并重新尝试。训练中还能进行轻量的超参数调优，并在完成后自动验证模型性能。

这个框架的魅力在于，它不是从一堆预设的模板中做选择，而是通过智能体之间基于知识的辩论与协作，真正从零开始“创造”出一个新的、针对特定任务优化的模型。这超越了简单的超参数调优，实现了方法论层面的创新。

实战检验：媲美顶尖专家，探索未知领域

研究团队在六个公开的单细胞扰动数据集上对 CellForge 进行了全面测试，任务涵盖基因敲除、药物处理、细胞因子刺激等多种类型，数据模态也包括了 scRNA-seq（用于检测基因表达情况）、scATAC-seq（用于分析染色质可及性）、CITE-seq（同时检测 RNA 和蛋白质）等。

在已知方法较多的领域（例如基因敲除的 scRNA-seq 数据），CellForge 自动设计的模型表现出了强大的竞争力。在 Adamson 和 Norman 这两个经典数据集上，其模型在预测扰动后基因表达的关键指标（例如 MSE、PCC、R²）上，与 CPA、scGPT、Biolord 等人类设计的顶尖模型不相上下，甚至在部分指标上实现超越。

在缺乏成熟方法的“无人区”，CellForge 的价值更加凸显。例如，在预测染色质可及性变化（scATAC-seq 数据）或蛋白质表达变化（CITE-seq 数据）的任务上，由于没有现成的专用模型，传统的基线方法（例如线性回归、随机森林）表现平平。而 CellForge 能够自主设计出适应这些独特数据模态的定制化架构，取得了显著的性能提升。这证明了其方法具备强大的泛化能力和探索性。