Updated on
April 24, 2026

论文:https://arxiv.org/pdf/2509.25210v3
代码:github.com/chenhao-zju/STCast
作者团队:香港科技大学(HKUST) 郭嵩院士 (IEEE Fellow) + Shanghai AIlab 白磊团队
核心矛盾:AI气象预报的"边界困局"
过去三年,数据驱动的气象预报实现了质的飞跃——Pangu-Weather、Graphcast等模型将全球10天预报的速度提升了上千倍。但当我们试图将精度从0.25°提升到公里级时,一个致命的瓶颈出现了:全球与区域预报的耦合难题。
现有三种主流方案均存在根本性缺陷:
•❌ 直接训练公里级全球模型:1km分辨率对应19980×39960的网格,计算量呈指数级增长,现有硬件完全无法支撑
•❌ 单独训练区域模型:忽略大气系统的跨区域关联性,西伯利亚寒潮、厄尔尼诺等远距离影响完全无法捕捉
•❌ 静态邻域拼接:无论是传统NWP的海绵层边界,还是OneForecast等AI方法的固定邻域裁剪,都被局部且僵化的边界限制了性能
更反直觉的是,几乎所有方法都违背了最基本的地球系统科学原理:任何区域的大气状态都受整个地球系统的影响。青藏高原的加热可以同时改变东亚季风和北美急流,北极海冰融化会引发全球极端天气——一个区域的"真实边界"从来不是它的地理邻居,而是整个地球。
新思路:STCast——让边界自适应,让时间专业化
针对这一核心挑战,我们提出了STCast(Spatial-Temporal Weather Forecasting) 框架,首次实现了动态全球-区域边界对齐和月度级时间专家分配,用一个统一模型同时解决四大核心气象任务:低分辨率全球预报、高分辨率区域预报、台风路径预测和集合预报。
STCast的核心突破在于两个创新模块:
1. 空间对齐注意力(SAA):用物理先验初始化全球-区域相关性分布,并在训练中动态优化边界权重
2. 时间混合专家(TMoE):基于离散高斯分布将不同月份的大气数据路由到专属专家,精准捕捉季节性变化

核心设计详解
STCast整体采用Encoder-Processor-Decoder架构,Processor通过交替使用窗口注意力和自注意力,同时捕捉局部精细结构和全球长程依赖。在此基础上,我们创新性地引入了SAA和TMoE两个核心模块:

1. Spatial-Aligned Attention (SAA):让边界"跟着大气流动"
传统方法将区域边界视为固定的几何边界,而SAA将其定义为可学习的全球-区域相关性分布:
•物理先验初始化:采用大圆距离(Great Circle Distance)计算全球任意点到目标区域的空间距离(比欧氏距离更符合地球球面特性),再通过指数距离衰减函数初始化相关性分布,保证远处区域的影响自然衰减
•动态边界优化:将初始化的先验分布与注意力图做哈达玛积,在训练过程中不断调整权重,最终学习到最符合大气动力学规律的边界
•高效计算:采用线性注意力机制,将计算复杂度从O(n²)降至O(n),确保全球-区域耦合的计算开销可控

大气系统具有极强的季节性差异,1月的寒潮和7月的台风遵循完全不同的动力学规律。TMoE创新性地引入月度高斯先验,解决了传统MoE的专家同质化问题:
•为12个月份各学习一个离散高斯分布,峰值对应该月份的专属专家
•输入数据会根据月份激活对应的专家及其相邻专家,既保证了时间特异性,又保留了月份间的连续性
•显式的月度引导替代了传统MoE的隐式路由,无需额外辅助损失即可实现高效的专家分工

实验结果:四大任务全面刷新SOTA
我们在ERA5数据集上进行了全面的实验验证,训练数据覆盖1979-2019年共40年,使用16张A100 GPU训练100个epoch。

1. 全球低分辨率预报:长期预报优势显著
在6小时到10天的所有预报时效上,STCast的RMSE和ACC均优于Pangu-Weather、Graphcast、Fuxi和OneForecast等主流模型,尤其在7天以上的长期预报中优势明显:
2. 高分辨率区域预报:误差降低一个数量级
在东亚区域的高分辨率预报任务中,STCast相比直接训练和OneForecast实现了质的飞跃:
•RMSE降低0.05,ACC提升0.1
•10m风速(U10)误差仅0.7%,海平面气压(MSL)误差仅0.1%,几乎接近观测值
•能够清晰捕捉锋面、低压系统等中小尺度天气现象
3. 台风路径预测:长期误差降低40%
我们评估了2024年两个典型台风事件:Ewiniar(5月)和Yinxing(11月)。结果显示,STCast在短期预报中与其他模型相当,但在长期预报中优势显著:
•台风Yinxing的5天平均路径误差仅96.5km,比第二名Pangu-Weather(160km)低了近40%
•能够准确预测台风的转向和强度变化,为防灾减灾提供更可靠的决策支持

4. 集合预报:提供更可靠的概率预报
通过在初始状态注入Perlin噪声并进行50次集合模拟,STCast的集合预报版本在所有时效上都显著优于基线模型,10天RMSE低至0.5113,能够更准确地量化预报不确定性。
消融实验:每个模块都不可或缺
为了验证SAA和TMoE的有效性,我们进行了全面的消融实验:

美中不足
1. 计算开销:12个专家的TMoE参数达到654.8M,虽然比训练12个单月模型高效,但仍高于单模型方法
2. 区域泛化性:目前仅在东亚区域进行了验证,未来需要在北美、欧洲等不同气候区测试
3. 极端事件覆盖:仅评估了台风,对暴雨、高温、暴雪等其他极端天气的表现还需进一步验证
领域启发
STCast为AI气象预报的发展指明了三个重要方向:
1. 物理先验与数据驱动的深度融合:用地球系统科学原理引导模型设计,比纯数据驱动更高效、更可靠
2. 从"单任务"到"多任务统一":一个模型解决多个气象任务,既能共享知识,又能降低部署成本
3. 从"静态建模"到"动态自适应":让模型能够根据空间位置和时间动态调整自身结构,更符合大气系统的本质特性
当大多数AI气象模型还在比拼"谁能预报更久"时,STCast已经开始解决"如何让预报更准"的核心问题。这种从"能用"到"好用"的跨越,正是AI气象预报真正走向业务化应用的关键一步。
📚 参考文献
[1] Hao Chen, Tao Han, Jie Zhang, Song Guo, Lei Bai. STCast: Adaptive Boundary Alignment for Global and Regional Weather Forecasting. CVPR 2026 (Highlight).
转载自:公众号CVer
原地址:https://mp.weixin.qq.com/s/UQtOnar4uDGq-5DJsEQADA