破局X射线断层成像修复!KAUST、上智院等提出通用自监督基础模型HorusEye,登Nature子刊
将 ScienceAI 设为星标
第一时间掌握
新鲜的 AI for Science 资讯


X 射线断层成像(X-ray Tomography)是现代医学诊断与科学研究的核心工具,涵盖医学 CT、微 CT、纳米 CT、相衬断层成像和叠层衍射成像等多种模态。而图像退化问题(包括噪声增强、空间分辨率降低、信噪比下降等),是长期制约其分析可靠性的重大障碍,在低剂量或数据稀缺条件下更为突出。
现有的图像修复方法通常针对特定模态和预定义退化类型设计,泛化能力有限;同时往往依赖大规模配对数据集(含噪 / 干净图像对),而这类数据在 X 射线断层成像中因伦理、实验和实际条件的限制极难获取。
为此,来自沙特阿卜杜拉国王科技大学(KAUST)、上海科学智能研究院(下称上智院)、哈尔滨工业大学等多家机构的研究团队提出了 HorusEye—— 一种面向 X 射线断层成像通用修复的自监督基础模型。该模型摒弃了以往方法对退化过程的预设假设,转而从数据中直接学习真实的、非参数的退化过程。基于超过 1 亿张图像的大规模训练,HorusEye 在多种成像模态和修复任务上展现出卓越的泛化性能,甚至在从未见过的成像模态上也能稳定超越针对特定任务设计的方法。相关研究成果于 3 月 27 日发表在 Nature Computational Science。

论文题目:HorusEye: a self-supervised foundation model for generalizable X-ray tomography restoration
论文地址:https://www.nature.com/articles/s43588-026-00973-3
代码地址:https://github.com/Arturia-Pendragon-Iris/HorusEye_XRT_Restoration
现有方法面临的核心挑战
在 X 射线断层成像领域,图像修复长期面临三大核心难题:
一是模态与任务的高度异质性:从毫米级医学 CT 到纳米级叠层衍射成像,不同模态的退化机制差异巨大。现有方法通常为单一模态或特定任务量身定做,一旦超出训练条件就严重失效。
二是配对数据的获取困境:深度学习方法通常需要大量成对的噪声 / 干净图像进行监督训练,但在 X 射线断层成像中,获取真正干净的参考图像往往涉及高辐射剂量,受到伦理和实验条件的严格限制。
三是传统噪声建模的失效:传统方法通常假设噪声服从像素独立的对数泊松分布。但研究团队通过频谱分析发现,真实断层成像噪声具有信号依赖性、片间独立性和片内空间相关性等复杂特征,远非简单参数模型所能刻画。
HorusEye 的核心创新设计
HorusEye 从 X 射线断层成像的物理成像特性出发,提出了一种巧妙的自监督预训练框架,其核心洞察在于:三维断层扫描体中,相邻切片之间的结构信息具有高度连续性,而噪声由于独立采集过程表现出显著的片间不一致性。

图 1:HorusEye 整体架构、开发流程与数据集概览。a-b,模型适用于多种修复任务和成像模态;c,结构信息的片间连续性与噪声的片间不连续性;d,基于 SwinUNet 的模型架构;e-f,自监督训练策略;g,大规模多模态数据集组成
基于这一物理先验,HorusEye 采用两阶段自监督训练策略:
1. 真实噪声提取(片间对比预训练):利用中间切片预测任务,以两张相邻噪声切片作为输入预测中间切片。由于神经网络倾向于优先学习连续的结构信息而非随机噪声(受 Deep Image Prior 启发),预测结果与原始图像之间的残差即被视为自提取噪声。这一策略无需任何显式噪声模型,直接从数据中捕获真实退化模式。
2. 去噪自编码器预训练:将自提取噪声注入干净图像生成伪噪声训练数据,训练去噪网络恢复原始干净图像。
两阶段之间通过互正反馈协同精炼策略(Mutual Positive-Feedback Corefinement)紧密耦合:噪声提取网络不断为去噪网络提供更真实的噪声样本,而去噪网络的改进又反哺更干净的监督信号,形成良性循环。这种动态反馈机制使 HorusEye 能够渐进地缩小合成退化与真实退化之间的差距。
模型采用 SwinUNet 架构作为骨干网络,融合 Swin Transformer 编码器和轻量卷积解码器,包含约 1 亿参数。整个训练基于 50 个数据集、超过 12 万个扫描体、总计 1 亿张图像的大规模多中心数据集完成。
医学 CT 去噪:逼近超高剂量扫描质量
在医学 CT 领域,HorusEye 展现出卓越的低剂量 CT 修复能力。研究团队建立了专门的剂量对比数据集(含 10 头离体猪和两个标准体模),在三个剂量水平下进行定量评估。

图 2:HorusEye 在医学 CT 上的应用。a,体模和离体猪的剂量对比去噪可视化结果;b,PSNR 和 SSIM 定量对比;c,真实临床 CT 去噪结果及 FSC 曲线对比
与四种主流后处理方法(WGAN、RED、CT-Former、MAP-NN)和一种重建方法(ASIR)的对比表明:
HorusEye 能够将低剂量扫描图像修复至接近超高剂量(140kV/500mA)的视觉质量;
PSNR 提升约 2 dB,SSIM 提升 0.02-0.04,差异具有高度统计显著性(P < 0.0001);
在真实临床 CT 数据上,HorusEye 的背景噪声抑制(ΔBNP)相比原始图像降低 10-20 dB,优于其他方法 5-10 dB;
FSC 曲线在全频率范围内保持最高,表明高频细节信息得到最佳保留。
跨模态泛化:从毫米到纳米尺度的通用修复
HorusEye 可直接应用于多种 X 射线断层成像模态,包括微 CT、纳米 CT、相衬断层成像、动态断层成像、能谱断层成像和叠层衍射成像,分辨率跨越毫米到纳米尺度。值得注意的是,后三种模态在训练阶段完全未被包含,用以严格测试跨模态泛化能力。

图 3:HorusEye 在多种 X 射线断层成像模态上的应用。a-f,微 CT(鸡骨)、纳米 CT(电极)、相衬断层成像(肾脏)、能谱断层成像(人体胸部)、动态断层成像(合成岩浆)和叠层衍射成像(纳米多孔玻璃)的修复结果与现有最优方法对比
与 k-SVD、BM3D、DIP 和 ZS-N2N 等通用去噪方法相比,HorusEye 在所有模态上均展现出明显优势:
ΔBNP 改善约 10-15 dB(其他方法仅约 5 dB);
FSC 曲线全频段保持更高相关值;
在剂量对比鸡骨微 CT 数据集上,PSNR 优于其他方法约 2 dB,SSIM 优约 0.1。
通过在特定数据集上的自监督微调,HorusEye 还能进一步提升修复质量,体现了其出色的灵活性和可迁移性。
多任务迁移:冻结编码器即可适配新任务
除去噪外,HorusEye 还被成功迁移至四类常见 X 射线断层成像修复问题:4 倍超分辨率、5 倍层厚重建、金属伪影去除和运动校正。迁移过程仅需微调轻量级解码器,预训练编码器完全固定。

图 4:HorusEye 在其他修复任务上的应用。a,超分辨率、层厚重建、金属伪影去除和运动校正的可视化结果及与真实值的差异图;b,PSNR 和 SSIM 定量分析
在所有任务中,HorusEye 均能恢复精细结构、产生更清晰的边界和更少的残留伪影。与通用修复模型(SwinIR、Cycle-GAN)、相同架构但从零训练的基线模型,以及各任务专用方法的对比中,HorusEye 在 PSNR 和 SSIM 上均具优势。HorusEye 与基线模型之间的性能差距充分证明了大规模预训练的关键作用 —— 预训练编码器有效捕获了可迁移的结构与解剖特征表示。
临床评估:显著提升诊断准确率
为评估 HorusEye 的临床实用价值,研究团队开展了多中心临床评估,由 10 位具有 10 年以上经验的放射科医生以双盲方式独立评分。

图 5:HorusEye 临床评估。a,低剂量 CT 经不同方法处理后的噪声、对比度和病变可检测性评分对比;b,HorusEye 增强血管可视化效果;c,HorusEye 帮助检出最初被遗漏的病变案例
临床评估的核心发现:
HorusEye 使放射科医生评分平均提升 1-3 分(5 分制),达到接近高剂量参考扫描的水平;
在难以检测的低对比度病变回顾性研究中效果尤为显著:对于非增强 CT 上的肺栓塞,仅 3.3%(1/30)的放射科医生能在原始图像上识别,而经 HorusEye 处理后检出率跃升至 80.0%(24/30);
肝脏肿瘤检出率从 53.3% 提升至 93.3%,主动脉夹层破裂口检出率从 63.3% 提升至 93.3%;
在 17 项计算机辅助诊断(CAD)任务评估中,HorusEye 普遍提升了下游任务性能,例如低剂量肺动脉 / 静脉分割的 Dice 系数从约 70% 提升至约 88%。
退化分析:揭示断层成像噪声的真实面貌
借助 HorusEye 的噪声提取能力,研究团队对 103,725 个来自不同模态和扫描对象的噪声样本进行了系统分析。

图 6:利用 HorusEye 进行 X 射线断层成像退化分析。a,103,725 个噪声样本的 t-SNE 聚类可视化,不同数据集的噪声自然形成清晰簇;b,噪声功率谱和相位谱随频率的分布特征
t-SNE 聚类分析揭示了一个重要事实:来自相同扫描设置的噪声自然聚集成簇,不同设置之间存在明显分离。这证实噪声特征随成像模态和扫描对象而本质性变化,对针对特定场景训练的修复方法构成巨大挑战。值得关注的是,长期以来被广泛采用的对数泊松噪声模型,在聚类图中与真实噪声明显分离。这一现象表明,许多现有模型所依赖的噪声建模方式,在刻画真实系统退化时存在固有局限。
总结与展望
HorusEye 的创新源于对 X 射线断层成像物理特性的洞察 —— 利用结构的片间连续性与噪声的片间独立性这一关键对比,构建了无需配对监督或噪声模型假设的自监督学习框架。通过互正反馈协同精炼机制,模型能够渐进式地从合成退化过渡到真实退化学习,实现了从去噪到超分辨率、伪影去除等多任务的统一迁移能力。
实验与临床评估表明,HorusEye 不仅是一种通用的图像修复技术,更有望成为 X 射线断层成像的通用后处理工具 —— 通过提升低剂量扫描质量来降低辐射风险,通过增强老旧设备的成像效果来促进医疗资源可及性,为更安全、更高效、更精准的医学影像实践开辟了新路径。
展望未来,将 HorusEye 推向临床常规应用仍需大规模多中心验证。同时,从数据中直接学习真实退化的范式也为其他断层成像技术的图像质量优化提供了重要启示。
人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。
