张锋最新论文:细胞命运工程平台,筛选出全新转录因子组合,让胚胎干细胞高效重编程为造血干/祖细胞


撰文丨王聪
编辑丨王多鱼
排版丨水成文
哺乳动物细胞的身份由转录因子(Transcription Factor,TF)调控。从胚胎干细胞定向变成造血干细胞,一直是再生医学领域的“圣杯”——如果能实现这一过程的高效诱导,不仅能解决造血干细胞移植供体短缺的问题,还能为白血病、地中海贫血等血液疾病带来根治希望。
然而,尽管研究人员在重编程领域已取得了许多重大突破,但理性调控细胞命运仍面临重大挑战——首要难题在于发现,次要难题在于优化。
近日,张锋团队在 Cell 子刊 Cell Systems 上发表了题为:Pooled combinatorial screening identifies transcription factor sets that drive hematopoietic progenitor-like cell fate 的研究论文。
该研究开发了一套可规模化筛选转录因子组合的“细胞命运工程平台”,一口气测试了数百万种转录因子组合,最终找到了两个此前从未被报道过的“六因子组合”——P1 组合(TAL1、RPA3、ZFP90、RNF138、LMO2 和 KLF2);P2 组合(DDIT3、MZF1、HOXB3、MIER1、SIRT6 和 ZNF85),能让人类胚胎干细胞高效分化为具有多向分化潜能的造血祖细胞,性能直接碾压现有“金标准”方案。
为什么要给细胞“试配方”?
细胞的身份由转录因子(TF)“说了算”。这些蛋白质能结合 DNA 调控基因开关,就像细胞的“总指挥”:胚胎发育时,不同阶段的转录因子依次表达,把干细胞一步步变成血细胞、神经细胞、肌肉细胞;在实验室中,我们也可以通过过表达特定转录因子,把一种细胞“重编程”成另一种细胞——例如大名鼎鼎的“山中因子”(OCT4、SOX2、KLF4 和 MYC,简称 OSKM)就能把已分化的成熟细胞变回多能干细胞。
但想找到正确的转录因子组合,难度堪比大海捞针——
组合空间太大:假设从 388 个候选转录因子中选 6 个组合,可能的组合配方就有超过 10¹² 种,传统方法根本测不过来;
现有方案效率低:哪怕是已经广泛使用的“金标准”造血重编程配方,诱导出的真正具有多向分化潜能的细胞比例依然很低,很多细胞会偏向某一谱系,无法形成功能完整的造血干细胞。
过去的研究大多是“单因子筛选”或者“两两组合筛选”,很难覆盖复杂的组合空间。张锋团队这次的目标,就是要做一个“高通量配方筛选机”,一次性找到最优解。
这套“筛选平台”到底强在哪?
为了搞定百万级组合筛选,研究团队做了三个关键创新——
1、高感染复数+数据增强,把筛选效率提了 100 倍
他们首先选了 388 个和造血发育相关的转录因子,构建了带条形码的慢病毒文库——每个转录因子都对应一段独特的 DNA 序列,相当于给每个转录因子贴了独一无二的标签,之后只要测标签,就知道细胞里表达了哪些转录因子。接下来优化了病毒感染流程,让每个细胞平均能同时接收 5 个不同的转录因子(也就是高 MOI,多重感染)。但就算这样,要覆盖所有可能的组合还是不够,于是他们开发了数据增强算法:
如果一个细胞里有 5 个转录因子{A,B,C,D,E},那么算法会自动把它拆成所有更小的子组合:{A},{B},…,{A,B},{A,C},…,{A,B,C}等等。只要假设转录因子之间的相互作用是稀疏的,这些子组合的信息就能帮我们推断更大组合的效果。这一招直接把组合检测效率提升了 100 倍以上。
2、两步富集,从千万细胞中精准捞出目标
就算诱导出了造血干细胞,其在培养体系里占比可能只有千分之一甚至万分之一,直接测序成本太高。团队设计了两步富集策略:
第一步:用磁激活细胞分选(MACS)富集表达 CD34 的细胞——CD34 是造血干/祖细胞的经典表面标志物,这一步能把目标细胞纯度从 1% 左右提升到 90%;
第二步:把富集到的 CD34+ 细胞放到甲基纤维素半固体培养基里做集落形成实验,只有真正具有多向分化潜能的造血祖细胞才能长出包含多种血细胞的集落,这又实现了 1000 倍的富集。
两步下来,目标细胞的富集倍数超过 10 万倍,只需要测少量细胞,就能得到足够多的有效数据。
研究团队对筛选过程中 14 万多个单细胞同时做了转录组测序和条形码检测,既能知道每个细胞的转录因子组合,又能知道它的基因表达状态。
他们还训练了一个基于半监督对抗神经网络的模型——scNym,把参考数据库里几十万个已知细胞类型的转录组数据作为“标准答案”,给每个筛选出来的细胞打一个“HSPC 相似分”——分数越高,说明这个细胞的转录组特征越接近真正的造血干/祖细胞(HSPC)。
这个分数可不是纸上谈兵:后续验证发现,相似分和细胞实际形成多向集落的能力高度相关,完全可以用来预测重编程效果。
筛到了什么?一个“造血重编程地形图”
有了这套平台,亚就团队相当于拿到了一张覆盖数百万种转录因子组合的“地形图”:X 轴和 Y 轴代表不同的转录因子组合,Z 轴就是对应的 HSPC 相似分,高分区域就是我们要找的“山峰”。
在这张地形图上,他们发现了两个最突出的“高峰”,分别命名为 P1 和 P2——
P1 组合:包含 TAL1、RPA3、ZFP90、RNF138、LMO2、KLF2 六个转录因子; P2 组合:包含DDIT3、MZF1、HOXB3、MIER1、SIRT6、ZNF85 六个转录因子。

这两个组合的组成差异很大,但都能高效诱导出造血祖细胞样细胞(Hematopoietic Progenitor-like Cell)。更有意思的是,除了 TAL1、LMO2、KLF2 这几个已知的造血调控因子,剩下的大多数转录因子都是首次被发现和造血重编程相关——这正是大规模筛选的价值:挖到之前被忽略的“潜力股”。
效果有多好?直接超越金标准
为了验证 P1 和 P2 的效果,研究团队把它们和两个领域内公认的“金标准”方案做了头对头比较——2017 年发表于 Nature 的七因子组合(ERG、HOXA5、HOXA9、HOXA10、LCOR、RUNX1 和 SPI1);2020 年发表于 Stem Cell Reports 的四因子组合(SCL、LMO2、GATA2 和 ETV2)。
结果非常亮眼:
CD34+ 细胞产率相当:P1 和 P2 诱导出的 CD34+ 细胞比例分别为 10.9% 和 8.4%,和七因子方案的 10.2% 没有显著差异,低于四因子方案的 35.5%——但 CD34 只是表面标记,不代表真正的功能。
多能祖细胞产率大幅领先:衡量造血祖细胞功能的金标准是 CFU-GEMM 集落(能同时分化出粒细胞、红细胞、巨噬细胞、巨核细胞的混合集落,代表真正的多向分化潜能)。P1 和 P2 诱导出的 CFU-GEMM 集落数量分别是七因子方案的 2.2 倍、四因子方案的 3.7 倍。
纯度碾压:P1 组的 CFU-GEMM 集落占所有集落的比例高达 34%,P2 组也有 19%,而七因子方案组只有 8%,四因子方案组更是低至 1%。也就是说,P1 和 P2 方案诱导出的细胞里,真正有用的多能祖细胞占比要高得多。
更重要的是,这两个组合在不同遗传背景的人胚胎干细胞系(H1 和 H7)中都表现稳定,具备很好的通用性。
这项研究的未来价值
这项工作不仅找到了更好的造血重编程配方,更重要的是提供了一个通用的“细胞命运工程设计框架”:
对于造血领域来说,P1 和 P2 组合为后续研究造血发育机制提供了新的工具,也为体外大规模制备造血干细胞用于移植、基因治疗打下了基础;
对于整个细胞工程领域来说,这套“高通量组合筛选+单细胞多组学+机器学习”的流程,完全可以推广到其他细胞类型,比如神经元、心肌细胞、胰岛细胞的定向分化,加速细胞治疗的研发进程。
最后,研究体表示,该研究开发的平台让复杂组合扰动下的细胞命运工程变得可规模化、可预测。未来随着扰动文库、富集策略、机器学习模型的进一步优化,有望更高效地设计出任意我们想要的细胞类型。
张锋团队《Cell Systems》:给细胞“试配方”,百万次筛选找到造血干细胞的“黄金组合” 不用碰运气!张锋团队开发AI筛选平台,让细胞重编程像“配鸡尾酒”一样精准 造血重编程大突破:张锋团队筛遍百万种转录因子组合,性能碾压现有金标准 造造血干细胞的“最优解”找到了?张锋团队新工具一次测遍百万种细胞“配方”
https://www.cell.com/cell-systems/fulltext/S2405-4712(26)00126-2





点在看,传递你的品味




