CVPR2026 Highlight | STCast：自适应边界对齐，解锁全球-区域一体化精准天气预报

发布时间：2026-04-28来源：ScienceAI

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯

作者 | 论文团队

编辑丨ScienceAI

过去三年，数据驱动的气象预报实现了质的飞跃 ——Pangu-Weather、Graphcast 等模型将全球 10 天预报的速度提升了上千倍。但当我们试图将精度从 0.25° 提升到公里级时，一个致命的瓶颈出现了：全球与区域预报的耦合难题。

现有三种主流方案均存在根本性缺陷：

直接训练公里级全球模型：1km 分辨率对应 19980×39960 的网格，计算量呈指数级增长，现有硬件完全无法支撑
单独训练区域模型：忽略大气系统的跨区域关联性，西伯利亚寒潮、厄尔尼诺等远距离影响完全无法捕捉
静态邻域拼接：无论是传统 NWP 的海绵层边界，还是 OneForecast 等 AI 方法的固定邻域裁剪，都被局部且僵化的边界限制了性能

更反直觉的是，几乎所有方法都违背了最基本的地球系统科学原理：任何区域的大气状态都受整个地球系统的影响。青藏高原的加热可以同时改变东亚季风和北美急流，北极海冰融化会引发全球极端天气 —— 一个区域的「真实边界」从来不是它的地理邻居，而是整个地球。

针对这一核心挑战，香港科技大学 (HKUST) 郭嵩团队联合上海 AI Lab白磊团队提出了 STCast (Spatial-Temporal Weather Forecasting) 框架，首次实现了动态全球 - 区域边界对齐和月度级时间专家分配，用一个统一模型同时解决四大核心气象任务：低分辨率全球预报、高分辨率区域预报、台风路径预测和集合预报。

论文链接：https://arxiv.org/pdf/2509.25210v3

代码仓库：https://github.com/chenhao-zju/STCast

STCast 的核心突破在于两个创新模块：

1. 空间对齐注意力 (SAA)：用物理先验初始化全球 - 区域相关性分布，并在训练中动态优化边界权重

2. 时间混合专家 (TMoE)：基于离散高斯分布将不同月份的大气数据路由到专属专家，精准捕捉季节性变化

图 1：三种区域预报策略对比。(a) 传统 AI 方法从全球预报裁剪邻域；(b) 直接训练区域模型；(c) STCast 通过可学习分布密集连接全球 - 区域模型。右图定量结果显示 STCast 在 RMSE 和 ACC 上全面领先

核心设计详解

STCast 整体采用 Encoder-Processor-Decoder 架构，Processor 通过交替使用窗口注意力和自注意力，同时捕捉局部精细结构和全球长程依赖。在此基础上，STCast 创新性地引入了 SAA 和 TMoE 两个核心模块：

图 2：STCast 整体架构。(a) 全球低分辨率预报主结构；(b) 高分辨率区域预报的 SAA 模块；(c) 基于 MSL 的台风路径预测；(d) 注入 Perlin 噪声的长期和集合预报

1. Spatial-Aligned Attention (SAA)：让边界「跟着大气流动」

传统方法将区域边界视为固定的几何边界，而 SAA 将其定义为可学习的全球 - 区域相关性分布：

物理先验初始化：采用大圆距离 (Great Circle Distance) 计算全球任意点到目标区域的空间距离（比欧氏距离更符合地球球面特性），再通过指数距离衰减函数初始化相关性分布，保证远处区域的影响自然衰减
动态边界优化：将初始化的先验分布与注意力图做哈达玛积，在训练过程中不断调整权重，最终学习到最符合大气动力学规律的边界
高效计算：采用线性注意力机制，将计算复杂度从 O (n²) 降至 O (n)，确保全球 - 区域耦合的计算开销可控

图 3：Spatial-Aligned Attention 模块结构。以全球特征为 Query 和 Key，区域特征为 Value，通过可学习的全球 - 区域分布调制注意力权重

2. Temporal Mixture-of-Experts (TMoE)：每个季节都有专属预报专家

大气系统具有极强的季节性差异，1 月的寒潮和 7 月的台风遵循完全不同的动力学规律。TMoE 创新性地引入月度高斯先验，解决了传统 MoE 的专家同质化问题：

为 12 个月份各学习一个离散高斯分布，峰值对应该月份的专属专家
输入数据会根据月份激活对应的专家及其相邻专家，既保证了时间特异性，又保留了月份间的连续性
显式的月度引导替代了传统 MoE 的隐式路由，无需额外辅助损失即可实现高效的专家分工

图 4：Temporal Mixture-of-Experts 模块结构。通过月度嵌入和高斯分布引导专家路由，实现动态任务分配

实验结果：四大任务全面刷新 SOTA

该研究在 ERA5 数据集上进行了全面的实验验证，训练数据覆盖 1979-2019 年共 40 年，使用 16 张 A100 GPU 训练 100 个 epoch。

1. 全球低分辨率预报：长期预报优势显著

在 6 小时到 10 天的所有预报时效上，STCast 的 RMSE 和 ACC 均优于 Pangu-Weather、Graphcast、Fuxi 和 OneForecast 等主流模型，尤其在 7 天以上的长期预报中优势明显：

表 1：全球天气预报性能对比。RMSE 越小越好，ACC 越大越好，最佳结果加粗显示

2. 高分辨率区域预报：误差降低一个数量级

在东亚区域的高分辨率预报任务中，STCast 相比直接训练和 OneForecast 实现了质的飞跃：

RMSE 降低 0.05，ACC 提升 0.1
10m 风速 (U10) 误差仅 0.7%，海平面气压 (MSL) 误差仅 0.1%，几乎接近观测值
能够清晰捕捉锋面、低压系统等中小尺度天气现象

3. 台风路径预测：长期误差降低 40%

该研究评估了 2024 年两个典型台风事件：Ewiniar (5 月) 和 Yinxing (11 月)。结果显示，STCast 在短期预报中与其他模型相当，但在长期预报中优势显著：

台风 Yinxing 的 5 天平均路径误差仅 96.5km，比第二名 Pangu-Weather (160km) 低了近 40%
能够准确预测台风的转向和强度变化，为防灾减灾提供更可靠的决策支持

图 5：台风路径预测对比。(a) 台风 Ewiniar (2024.05)；(b) 台风 Yinxing (2024.11)；(c) Yinxing 的 5 天平均距离误差对比

4. 集合预报：提供更可靠的概率预报

通过在初始状态注入 Perlin 噪声并进行 50 次集合模拟，STCast 的集合预报版本在所有时效上都显著优于基线模型，10 天 RMSE 低至 0.5113，能够更准确地量化预报不确定性。

消融实验：每个模块都不可或缺

为了验证 SAA 和 TMoE 的有效性，该研究进行了全面的消融实验：

表 2：消融实验结果。移除任何模块都会导致性能显著下降，其中全球 - 区域分布初始化和月度嵌入的影响最大

局限性与未来展望

美中不足

1. 计算开销：12 个专家的 TMoE 参数达到 654.8M，虽然比训练 12 个单月模型高效，但仍高于单模型方法

2. 区域泛化性：目前仅在东亚区域进行了验证，未来需要在北美、欧洲等不同气候区测试

3. 极端事件覆盖：仅评估了台风，对暴雨、高温、暴雪等其他极端天气的表现还需进一步验证

领域启发

STCast 为 AI 气象预报的发展指明了三个重要方向：

1. 物理先验与数据驱动的深度融合：用地球系统科学原理引导模型设计，比纯数据驱动更高效、更可靠

2. 从「单任务」到「多任务统一」：一个模型解决多个气象任务，既能共享知识，又能降低部署成本

3. 从「静态建模」到「动态自适应」：让模型能够根据空间位置和时间动态调整自身结构，更符合大气系统的本质特性

当大多数 AI 气象模型还在比拼「谁能预报更久」时，STCast 已经开始解决「如何让预报更准」的核心问题。这种从「能用」到「好用」的跨越，正是 AI 气象预报真正走向业务化应用的关键一步。

参考文献

[1] Hao Chen, Tao Han, Jie Zhang, Song Guo, Lei Bai. STCast: Adaptive Boundary Alignment for Global and Regional Weather Forecasting. CVPR 2026 (Highlight).

人工智能 × [ 生物神经科学数学物理化学材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。

欢迎关注标星，并点击右下角点赞和在看。

点击阅读原文，加入专业从业者社区，以获得更多交流合作机会及服务。

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。