CVPR 2026 精准天气预报!STCast:自适应边界对齐,解锁全球-区域一体化精准天气预报!

Updated on 

April 24, 2026

论文:https://arxiv.org/pdf/2509.25210v3          
代码:github.com/chenhao-zju/STCast          
作者团队:香港科技大学(HKUST) 郭嵩院士 (IEEE Fellow) + Shanghai AIlab 白磊团队

核心矛盾:AI气象预报的"边界困局"

过去三年,数据驱动的气象预报实现了质的飞跃——Pangu-Weather、Graphcast等模型将全球10天预报的速度提升了上千倍。但当我们试图将精度从0.25°提升到公里级时,一个致命的瓶颈出现了:全球与区域预报的耦合难题。

现有三种主流方案均存在根本性缺陷:

•❌ 直接训练公里级全球模型:1km分辨率对应19980×39960的网格,计算量呈指数级增长,现有硬件完全无法支撑

•❌ 单独训练区域模型:忽略大气系统的跨区域关联性,西伯利亚寒潮、厄尔尼诺等远距离影响完全无法捕捉

•❌ 静态邻域拼接:无论是传统NWP的海绵层边界,还是OneForecast等AI方法的固定邻域裁剪,都被局部且僵化的边界限制了性能

更反直觉的是,几乎所有方法都违背了最基本的地球系统科学原理:任何区域的大气状态都受整个地球系统的影响。青藏高原的加热可以同时改变东亚季风和北美急流,北极海冰融化会引发全球极端天气——一个区域的"真实边界"从来不是它的地理邻居,而是整个地球。

新思路:STCast——让边界自适应,让时间专业化

针对这一核心挑战,我们提出了STCast(Spatial-Temporal Weather Forecasting) 框架,首次实现了动态全球-区域边界对齐和月度级时间专家分配,用一个统一模型同时解决四大核心气象任务:低分辨率全球预报、高分辨率区域预报、台风路径预测和集合预报。

STCast的核心突破在于两个创新模块:

1. 空间对齐注意力(SAA):用物理先验初始化全球-区域相关性分布,并在训练中动态优化边界权重

2. 时间混合专家(TMoE):基于离散高斯分布将不同月份的大气数据路由到专属专家,精准捕捉季节性变化

图1:三种区域预报策略对比。(a)传统AI方法从全球预报裁剪邻域;(b)直接训练区域模型;(c)STCast通过可学习分布密集连接全球-区域模型。右图定量结果显示STCast在RMSE和ACC上全面领先

核心设计详解

STCast整体采用Encoder-Processor-Decoder架构,Processor通过交替使用窗口注意力和自注意力,同时捕捉局部精细结构和全球长程依赖。在此基础上,我们创新性地引入了SAA和TMoE两个核心模块:

图2:STCast整体架构。(a)全球低分辨率预报主结构;(b)高分辨率区域预报的SAA模块;(c)基于MSL的台风路径预测;(d)注入Perlin噪声的长期和集合预报

1. Spatial-Aligned Attention (SAA):让边界"跟着大气流动"

传统方法将区域边界视为固定的几何边界,而SAA将其定义为可学习的全球-区域相关性分布:

•物理先验初始化:采用大圆距离(Great Circle Distance)计算全球任意点到目标区域的空间距离(比欧氏距离更符合地球球面特性),再通过指数距离衰减函数初始化相关性分布,保证远处区域的影响自然衰减

•动态边界优化:将初始化的先验分布与注意力图做哈达玛积,在训练过程中不断调整权重,最终学习到最符合大气动力学规律的边界

•高效计算:采用线性注意力机制,将计算复杂度从O(n²)降至O(n),确保全球-区域耦合的计算开销可控

图3:Spatial-Aligned Attention模块结构。以全球特征为Query和Key,区域特征为Value,通过可学习的全球-区域分布调制注意力权重

大气系统具有极强的季节性差异,1月的寒潮和7月的台风遵循完全不同的动力学规律。TMoE创新性地引入月度高斯先验,解决了传统MoE的专家同质化问题:

•为12个月份各学习一个离散高斯分布,峰值对应该月份的专属专家

•输入数据会根据月份激活对应的专家及其相邻专家,既保证了时间特异性,又保留了月份间的连续性

•显式的月度引导替代了传统MoE的隐式路由,无需额外辅助损失即可实现高效的专家分工

图4:Temporal Mixture-of-Experts模块结构。通过月度嵌入和高斯分布引导专家路由,实现动态任务分配

实验结果:四大任务全面刷新SOTA

我们在ERA5数据集上进行了全面的实验验证,训练数据覆盖1979-2019年共40年,使用16张A100 GPU训练100个epoch。

表1:全球天气预报性能对比。RMSE越小越好,ACC越大越好,最佳结果加粗显示

1. 全球低分辨率预报:长期预报优势显著

在6小时到10天的所有预报时效上,STCast的RMSE和ACC均优于Pangu-Weather、Graphcast、Fuxi和OneForecast等主流模型,尤其在7天以上的长期预报中优势明显:

2. 高分辨率区域预报:误差降低一个数量级

在东亚区域的高分辨率预报任务中,STCast相比直接训练和OneForecast实现了质的飞跃:

•RMSE降低0.05,ACC提升0.1

•10m风速(U10)误差仅0.7%,海平面气压(MSL)误差仅0.1%,几乎接近观测值

•能够清晰捕捉锋面、低压系统等中小尺度天气现象

3. 台风路径预测:长期误差降低40%

我们评估了2024年两个典型台风事件:Ewiniar(5月)和Yinxing(11月)。结果显示,STCast在短期预报中与其他模型相当,但在长期预报中优势显著:

•台风Yinxing的5天平均路径误差仅96.5km,比第二名Pangu-Weather(160km)低了近40%

•能够准确预测台风的转向和强度变化,为防灾减灾提供更可靠的决策支持

图5:台风路径预测对比。(a)台风Ewiniar(2024.05);(b)台风Yinxing(2024.11);(c)Yinxing的5天平均距离误差对比

4. 集合预报:提供更可靠的概率预报

通过在初始状态注入Perlin噪声并进行50次集合模拟,STCast的集合预报版本在所有时效上都显著优于基线模型,10天RMSE低至0.5113,能够更准确地量化预报不确定性。

消融实验:每个模块都不可或缺

为了验证SAA和TMoE的有效性,我们进行了全面的消融实验:

表2:消融实验结果。移除任何模块都会导致性能显著下降,其中全球-区域分布初始化和月度嵌入的影响最大

美中不足

1. 计算开销:12个专家的TMoE参数达到654.8M,虽然比训练12个单月模型高效,但仍高于单模型方法

2. 区域泛化性:目前仅在东亚区域进行了验证,未来需要在北美、欧洲等不同气候区测试

3. 极端事件覆盖:仅评估了台风,对暴雨、高温、暴雪等其他极端天气的表现还需进一步验证

领域启发

STCast为AI气象预报的发展指明了三个重要方向:

1. 物理先验与数据驱动的深度融合:用地球系统科学原理引导模型设计,比纯数据驱动更高效、更可靠

2. 从"单任务"到"多任务统一":一个模型解决多个气象任务,既能共享知识,又能降低部署成本

3. 从"静态建模"到"动态自适应":让模型能够根据空间位置和时间动态调整自身结构,更符合大气系统的本质特性

当大多数AI气象模型还在比拼"谁能预报更久"时,STCast已经开始解决"如何让预报更准"的核心问题。这种从"能用"到"好用"的跨越,正是AI气象预报真正走向业务化应用的关键一步。

📚 参考文献
[1] Hao Chen, Tao Han, Jie Zhang, Song Guo, Lei Bai. STCast: Adaptive Boundary Alignment for Global and Regional Weather Forecasting. CVPR 2026 (Highlight).

转载自:公众号CVer

原地址:https://mp.weixin.qq.com/s/UQtOnar4uDGq-5DJsEQADA