CVPR2026 Highlight | STCast:自适应边界对齐,解锁全球-区域一体化精准天气预报
将 ScienceAI 设为星标
第一时间掌握
新鲜的 AI for Science 资讯


过去三年,数据驱动的气象预报实现了质的飞跃 ——Pangu-Weather、Graphcast 等模型将全球 10 天预报的速度提升了上千倍。但当我们试图将精度从 0.25° 提升到公里级时,一个致命的瓶颈出现了:全球与区域预报的耦合难题。
现有三种主流方案均存在根本性缺陷:
直接训练公里级全球模型:1km 分辨率对应 19980×39960 的网格,计算量呈指数级增长,现有硬件完全无法支撑
单独训练区域模型:忽略大气系统的跨区域关联性,西伯利亚寒潮、厄尔尼诺等远距离影响完全无法捕捉
静态邻域拼接:无论是传统 NWP 的海绵层边界,还是 OneForecast 等 AI 方法的固定邻域裁剪,都被局部且僵化的边界限制了性能
更反直觉的是,几乎所有方法都违背了最基本的地球系统科学原理:任何区域的大气状态都受整个地球系统的影响。青藏高原的加热可以同时改变东亚季风和北美急流,北极海冰融化会引发全球极端天气 —— 一个区域的「真实边界」从来不是它的地理邻居,而是整个地球。
针对这一核心挑战,香港科技大学 (HKUST) 郭嵩团队联合上海 AI Lab白磊团队提出了 STCast (Spatial-Temporal Weather Forecasting) 框架,首次实现了动态全球 - 区域边界对齐和月度级时间专家分配,用一个统一模型同时解决四大核心气象任务:低分辨率全球预报、高分辨率区域预报、台风路径预测和集合预报。

论文链接:https://arxiv.org/pdf/2509.25210v3
代码仓库:https://github.com/chenhao-zju/STCast
STCast 的核心突破在于两个创新模块:
1. 空间对齐注意力 (SAA):用物理先验初始化全球 - 区域相关性分布,并在训练中动态优化边界权重
2. 时间混合专家 (TMoE):基于离散高斯分布将不同月份的大气数据路由到专属专家,精准捕捉季节性变化

图 1:三种区域预报策略对比。(a) 传统 AI 方法从全球预报裁剪邻域;(b) 直接训练区域模型;(c) STCast 通过可学习分布密集连接全球 - 区域模型。右图定量结果显示 STCast 在 RMSE 和 ACC 上全面领先
核心设计详解
STCast 整体采用 Encoder-Processor-Decoder 架构,Processor 通过交替使用窗口注意力和自注意力,同时捕捉局部精细结构和全球长程依赖。在此基础上,STCast 创新性地引入了 SAA 和 TMoE 两个核心模块:

图 2:STCast 整体架构。(a) 全球低分辨率预报主结构;(b) 高分辨率区域预报的 SAA 模块;(c) 基于 MSL 的台风路径预测;(d) 注入 Perlin 噪声的长期和集合预报
1. Spatial-Aligned Attention (SAA):让边界「跟着大气流动」
传统方法将区域边界视为固定的几何边界,而 SAA 将其定义为可学习的全球 - 区域相关性分布:
物理先验初始化:采用大圆距离 (Great Circle Distance) 计算全球任意点到目标区域的空间距离(比欧氏距离更符合地球球面特性),再通过指数距离衰减函数初始化相关性分布,保证远处区域的影响自然衰减
动态边界优化:将初始化的先验分布与注意力图做哈达玛积,在训练过程中不断调整权重,最终学习到最符合大气动力学规律的边界
高效计算:采用线性注意力机制,将计算复杂度从 O (n²) 降至 O (n),确保全球 - 区域耦合的计算开销可控

图 3:Spatial-Aligned Attention 模块结构。以全球特征为 Query 和 Key,区域特征为 Value,通过可学习的全球 - 区域分布调制注意力权重
2. Temporal Mixture-of-Experts (TMoE):每个季节都有专属预报专家
大气系统具有极强的季节性差异,1 月的寒潮和 7 月的台风遵循完全不同的动力学规律。TMoE 创新性地引入月度高斯先验,解决了传统 MoE 的专家同质化问题:
为 12 个月份各学习一个离散高斯分布,峰值对应该月份的专属专家
输入数据会根据月份激活对应的专家及其相邻专家,既保证了时间特异性,又保留了月份间的连续性
显式的月度引导替代了传统 MoE 的隐式路由,无需额外辅助损失即可实现高效的专家分工

图 4:Temporal Mixture-of-Experts 模块结构。通过月度嵌入和高斯分布引导专家路由,实现动态任务分配
实验结果:四大任务全面刷新 SOTA
该研究在 ERA5 数据集上进行了全面的实验验证,训练数据覆盖 1979-2019 年共 40 年,使用 16 张 A100 GPU 训练 100 个 epoch。
1. 全球低分辨率预报:长期预报优势显著
在 6 小时到 10 天的所有预报时效上,STCast 的 RMSE 和 ACC 均优于 Pangu-Weather、Graphcast、Fuxi 和 OneForecast 等主流模型,尤其在 7 天以上的长期预报中优势明显:

表 1:全球天气预报性能对比。RMSE 越小越好,ACC 越大越好,最佳结果加粗显示
2. 高分辨率区域预报:误差降低一个数量级
在东亚区域的高分辨率预报任务中,STCast 相比直接训练和 OneForecast 实现了质的飞跃:
RMSE 降低 0.05,ACC 提升 0.1
10m 风速 (U10) 误差仅 0.7%,海平面气压 (MSL) 误差仅 0.1%,几乎接近观测值
能够清晰捕捉锋面、低压系统等中小尺度天气现象
3. 台风路径预测:长期误差降低 40%
该研究评估了 2024 年两个典型台风事件:Ewiniar (5 月) 和 Yinxing (11 月)。结果显示,STCast 在短期预报中与其他模型相当,但在长期预报中优势显著:
台风 Yinxing 的 5 天平均路径误差仅 96.5km,比第二名 Pangu-Weather (160km) 低了近 40%
能够准确预测台风的转向和强度变化,为防灾减灾提供更可靠的决策支持

图 5:台风路径预测对比。(a) 台风 Ewiniar (2024.05);(b) 台风 Yinxing (2024.11);(c) Yinxing 的 5 天平均距离误差对比
4. 集合预报:提供更可靠的概率预报
通过在初始状态注入 Perlin 噪声并进行 50 次集合模拟,STCast 的集合预报版本在所有时效上都显著优于基线模型,10 天 RMSE 低至 0.5113,能够更准确地量化预报不确定性。
消融实验:每个模块都不可或缺
为了验证 SAA 和 TMoE 的有效性,该研究进行了全面的消融实验:

表 2:消融实验结果。移除任何模块都会导致性能显著下降,其中全球 - 区域分布初始化和月度嵌入的影响最大
局限性与未来展望
美中不足
1. 计算开销:12 个专家的 TMoE 参数达到 654.8M,虽然比训练 12 个单月模型高效,但仍高于单模型方法
2. 区域泛化性:目前仅在东亚区域进行了验证,未来需要在北美、欧洲等不同气候区测试
3. 极端事件覆盖:仅评估了台风,对暴雨、高温、暴雪等其他极端天气的表现还需进一步验证
领域启发
STCast 为 AI 气象预报的发展指明了三个重要方向:
1. 物理先验与数据驱动的深度融合:用地球系统科学原理引导模型设计,比纯数据驱动更高效、更可靠
2. 从「单任务」到「多任务统一」:一个模型解决多个气象任务,既能共享知识,又能降低部署成本
3. 从「静态建模」到「动态自适应」:让模型能够根据空间位置和时间动态调整自身结构,更符合大气系统的本质特性
当大多数 AI 气象模型还在比拼「谁能预报更久」时,STCast 已经开始解决「如何让预报更准」的核心问题。这种从「能用」到「好用」的跨越,正是 AI 气象预报真正走向业务化应用的关键一步。
参考文献
[1] Hao Chen, Tao Han, Jie Zhang, Song Guo, Lei Bai. STCast: Adaptive Boundary Alignment for Global and Regional Weather Forecasting. CVPR 2026 (Highlight).
人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。
