Cell:血脑屏障功能障碍是脑脊液蛋白组变异的首要来源
发布时间:2026-04-14来源:BioArt
多发性硬化
(multiple sclerosis,
MS
)
是一种中枢神经系统的慢性炎性脱髓鞘疾病,影响着全球近300万人。目前,
MS的诊断主要依赖于
McDonald
标准
(国际公认的多发性硬化诊断指南,由国际专家小组制定并定期更新。其核心逻辑是在排除其他疾病的前提下,通过证明病灶的“空间多发性”(中枢神经系统不同部位受损)和“时间多发性”(病情反复发作或MRI显示新旧病灶并存)来确立诊断)
,
其中脑脊液中的
寡克隆带
(oligoclonal bands,
OCBs
)
是最核心的生物学标志物
【1】
。然而,这一诊断体系存在显著的“灰色地带”:约10-20%的患者表现为OCB阴性,导致临床鉴别诊断极为困难——他们可能被误诊为其他炎性疾病或被漏诊
【2-4】
。而现有的替代标志物如
k
游离轻链
(kappa free light-chain,
kFLC
)
虽然在总体人群中表现尚可,但在OCB阴性个体中敏感度不足,无法解决这一临床困境
【5-6】
。另一方面,MS的疾病进程存在显著异质性,从复发缓解型
(RRMS)
向继发进展型
(SPMS)
的转化时机难以预测,而新兴的进展靶向治疗
(如tolebrutinib)
又需要早期识别可能获益的患者,但传统的临床指标
(复发史、MRI病灶负荷、残疾评分)
预测价值有限,往往需要长期随访才能做出判断。那么,能否通过脑脊液蛋白质组的深度解析,找到能够解决上述临床痛点的分子标志物呢?
近日,来自德国马普生化研究所的
Matthias Mann
团队联合慕尼黑工业大学的
Bernhard Hemmer
团队和
Christiane Gasperi
团队在
Cell
杂志发表了一篇题为
Large-scale proteomics across neurological disorders uncovers biomarker panel and targets in multiple sclerosis
的研究论文。作者通过先进的质谱技术,
对超过5000份脑脊液样本进行了深度蛋白质组学分析,首次阐明血脑屏障功能障碍是脑脊液蛋白组变异的首要来源
,其影响远超疾病本身;
在此基础上开发的22蛋白标志物组合,在OCB阴性的MS患者中诊断性能显著优于现有临床指标;更重要的是,通过蛋白质组“伪时间”分析,实现了对复发缓解型向继发进展型多发性硬化转化风险的预测,转化时间与蛋白组分期呈显著负相关
。本研究不仅为MS的精准诊断和进展预测提供了强有力的新工具,更建立了从大规模发现到临床转化研究的完整范式,为神经免疫疾病的精准医疗开辟了新路径。

构建了迄今最大规模的脑脊液蛋白质组数据库
(图1)
:
研究团队依托慕尼黑工业大学神经生物样本库,收集了超过5000份高质量
CSF
样本,涵盖了多发性硬化、感染性疾病、神经退行性疾病等广泛的神经系统疾病谱系。为实现这一大规模队列的深度分析,团队首先在实验流程上实现了关键突破:通过整合Agilent Bravo自动化液体处理工作站,将样品前处理通量从传统手工操作的12样本/天大幅提升至60样本/天;后期引入Orbitrap Astral质谱仪后,通量进一步达到100样本/天,为大规模队列分析提供了技术保障。在质谱检测层面,研究采用了双平台互补策略:
timsTOF Pro 2
平台采用优化后的dia-PASEF模式,在21分钟梯度内实现高效分离;Orbitrap Astral平台则结合FAIMS接口和150个隔离窗口,在11.5分钟内完成单样本检测,显著缩短了分析时间。为获得高覆盖率的鉴定结果,谱图库的构建采用了实验馏分与AlphaPeptDeep深度学习预测相结合的创新策略,并通过LOESS回归对两个平台的离子库进行合并优化,确保了数据的一致性和完整性。最终的数据产出显示了优异的技术性能:timsTOF平台平均每样本鉴定约1500种蛋白质,而Astral平台进一步提升至2100种,其中包含约150种蛋白亚型。在检测稳定性方面,超过1000种蛋白在80%以上的样本中可稳定检出;约800种蛋白的全流程变异系数低于20%,Astral平台更有1000种蛋白达到这一标准,表明数据的定量精度高、重复性好。主成分分析显示,生物学效应是驱动样本变异的第一主成分,证实数据质量足以支撑后续的生物学发现。

图1. 研究设计及蛋白质组学数据集特征
揭示了脑脊液蛋白组的主要变异来源是血脑屏障功能障碍:
研究团队通过多元线性回归模型系统评估了诊断组、年龄、性别、QAlb
(albumin ratio)
等协变量对脑脊液蛋白质组变异的影响,并在timsTOF、Astral及独立OLINK数据集中进行跨平台验证。结果显示,血脑屏障功能障碍解释的蛋白质组变异度是疾病本身的三倍,且这一趋势在所有平台中高度一致,确立QAlb为脑脊液蛋白质组学研究中必须校正的首要混杂因素。通过匹配的CSF与血浆蛋白质组数据对比,作者发现了其内在原因:CSF是血浆的超滤液,稀释倍数高达约100倍,约70%的CSF蛋白与血浆重叠,且总蛋白浓度与QAlb呈极强正相关。这意味着,CSF中多数蛋白的浓度波动,主要取决于血脑屏障的通透性。若不校正QAlb,直接比较两组患者的蛋白浓度,观测到的差异可能仅仅是屏障功能差异的反映,而非真实的疾病病理变化。研究还特别指出,对质谱数据进行全蛋白组归一化处理,会使非血浆来源的脑源性蛋白“显得”降低,若未校正QAlb,同样可能扭曲真实的生物学发现。针对这一混杂效应,研究团队提出了三种实用的校正策略:(1)回归校正:在统计模型中纳入QAlb作为协变量,是校正混杂因素的金标准;(2)替代指标:使用ITIH1和C5这两个蛋白作为QAlb的可靠替代指标,适用于QAlb数据缺失的情况;(3)选择性归一化:基于不受QAlb影响的特定蛋白子集进行归一化。此外,研究还厘清了其他协变量的影响:年龄调控数百至上千种蛋白,部分效应与QAlb相关;而性别、红细胞污染、白细胞计数则调控特定的蛋白集,且这些效应与疾病效应基本正交,在不同疾病中表现一致。
开发了22蛋白诊断组合:
为解决OCB阴性MS患者的鉴别诊断难题,研究团队从5000余份样本中选取约1600例分层子集
(包括MS、其他炎性疾病和对照)
,按年龄、性别、QAlb、IgG比值、OCB状态和白细胞计数进行匹配,并采用Orbitrap Astral平台重新检测获得每样本2100种蛋白的深度覆盖数据。在此基础上,通过XGBoost多分类模型结合嵌套交叉验证和特征递归消除算法,初步筛选出30个候选特征蛋白。为实现临床转化,团队进一步建立了靶向质谱检测方法:基于变异系数和信噪比,从每个候选蛋白中优选出1条特征肽段,最终锁定了一个包含22条肽段
(代表22种蛋白)
的精简诊断组合。在独立验证队列中,这一22蛋白组合展现出优异的诊断性能。在全样本分析中,其诊断准确率与包含OCB状态、IgG比值等指标的临床常规模型相当。而在最具挑战的OCB阴性患者亚组中,该蛋白组合的诊断效能显著超越临床常规模型。这一突破性结果为OCB阴性患者提供了客观、精准的分子诊断依据。从生物学功能看,该组合中的22种蛋白广泛覆盖了MS的核心病理通路:髓鞘/轴突损伤
(MBP、NEFM)
、小胶质细胞/先天免疫
(CHIT1、C1QB)
、B细胞相关
(JCHAIN、IGKC、TNFRSF17、FCRL5)
、T细胞相关
(CD7、CD27)
、基质重塑
(MMP9、SDC1)
,其中FCRL5和CTSW是既往研究中未受充分重视的蛋白,为理解MS免疫机制提供了新视角。此外,靶向方法的验证数据显示,该组合的生物效应差异是技术流程变异系数的5-15倍,且对样本加载量的变化具有稳健性,表明其已具备在临床实验室落地的可行性,有望为MS的个体化诊断与分层提供新一代工具。
建立了基于蛋白质组的MS疾病分期体系:
研究团队借鉴单细胞测序的“伪时间”概念,通过训练一个区分MS患者与健康对照的XGBoost二分类模型,利用模型输出的SHAP值,将所有样本
(包括患者和对照)
排列成一个从健康到疾病的连续分子谱系。在这个谱系中,健康对照集中在早期,而MS患者分布在晚期;该“伪时间”与患者采样时的残疾评分显著相关,且随着伪时间推进,免疫球蛋白负荷及神经损伤标志物
(如MBP、NEFM)
的检出率逐渐增加,证实了该分期体系捕捉到了疾病特异性病理变化。在针对不同疾病亚型的分析中,研究通过分层子集消除了年龄和白细胞计数的影响,发现:复发缓解型MS的标志物主要涉及适应性免疫,而进展型MS则更多富集先天免疫特征。值得注意的是,RRMS相关蛋白中检测到了
EB病毒
蛋白EBNA1的人源互作蛋白,进展型MS
(PMS)
相关蛋白则富集补体系统和HLA-DRB1/5。通过滑动窗口分析对蛋白轨迹进行排序,最强的MS关联蛋白包括MMP9、FCRL5和CTSW。其中,FCRL5作为非典型记忆B细胞标志物,提示B细胞耗竭治疗需平衡感染风险。在临床结局关联分析中,该伪时间体系展现出强大的预测能力:不仅与采样时及远期
(5-15年后)
的残疾评分显著相关,最关键的是,后期由RRMS转化为SPMS的患者,其在转化前数年的基线伪时间已显著高于未转化者。从采样到临床确诊转化的中位时间为3年,且转化时间与伪时间呈显著负相关。
本研究首次证明,利用横断面队列的蛋白质组数据,即可构建能预测数年后果疾病进展风险的分子分期工具。这为MS的个体化治疗决策,特别是针对新兴的“进展独立于复发活动”靶向治疗的患者分层,提供了全新思路。
综上所述,
本研究在MS生物标志物领域取得了多项突破性进展
,其核心优势包含以下五个方面:(1)
规模空前
:基于5000余份脑脊液样本、每样本1500-2100种蛋白的深度覆盖,为神经疾病蛋白质组学研究树立了新标杆;(2)
技术突破
:通过自动化样品前处理、高灵敏度质谱和深度学习谱图库预测,实现了高通量、深覆盖、高稳健性的检测流程;(3)
系统解析
:首次全面评估了血脑屏障功能障碍、年龄、性别等协变量对脑脊液蛋白组的影响,揭示了QAlb校正的必要性并提供替代方案;(4)
临床转化
:构建了从发现队列→分层特征选择→靶向方法开发→独立验证队列验证的完整链条,为其他标志物研究提供了可复制的范式;(5)
预后价值
:通过伪时间分析证实横断面队列蛋白质组可预测长期残疾进展和RRMS→SPMS转化风险,为新兴的进展靶向治疗提供了患者分层工具。
本研究依旧存在一定的局限性。首先,质谱蛋白质组学提供相对定量而非绝对浓度,部分蛋白因样本基质差异无法稳定检出,本研究策略聚焦于检出的关联而非缺失信号。其次,临床验证具有递进性,虽已转化为靶向检测方法并在独立队列中验证,但真正的临床认证仍需建立基于已知浓度标准品的绝对定量方法,并在多中心、前瞻性队列中验证临床获益,同时与MRI等影像学指标整合确定最佳应用场景。第三,诊断金标准存在局限性,依赖于长期临床随访和专家判断,难以获得尸检确认等终极金标准,研究团队通过严谨的队列设计、分层分析和多维度验证,最大限度地挖掘了现有队列价值。第四,OCB阴性MS样本的稀缺性,因其自然发生率低导致验证队列中此类样本有限,研究团队通过将部分发现队列样本转入验证队列的方式缓解了这一问题。
原文链接
:
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。
