PEI-Lab

论文：https://arxiv.org/pdf/2509.25210v3
代码：github.com/chenhao-zju/STCast
作者团队：香港科技大学(HKUST) 郭嵩院士 (IEEE Fellow) + Shanghai AIlab 白磊团队

核心矛盾：AI气象预报的"边界困局"

过去三年，数据驱动的气象预报实现了质的飞跃——Pangu-Weather、Graphcast等模型将全球10天预报的速度提升了上千倍。但当我们试图将精度从0.25°提升到公里级时，一个致命的瓶颈出现了：全球与区域预报的耦合难题。

现有三种主流方案均存在根本性缺陷：

•❌ 直接训练公里级全球模型：1km分辨率对应19980×39960的网格，计算量呈指数级增长，现有硬件完全无法支撑

•❌ 单独训练区域模型：忽略大气系统的跨区域关联性，西伯利亚寒潮、厄尔尼诺等远距离影响完全无法捕捉

•❌ 静态邻域拼接：无论是传统NWP的海绵层边界，还是OneForecast等AI方法的固定邻域裁剪，都被局部且僵化的边界限制了性能

更反直觉的是，几乎所有方法都违背了最基本的地球系统科学原理：任何区域的大气状态都受整个地球系统的影响。青藏高原的加热可以同时改变东亚季风和北美急流，北极海冰融化会引发全球极端天气——一个区域的"真实边界"从来不是它的地理邻居，而是整个地球。

新思路：STCast——让边界自适应，让时间专业化

针对这一核心挑战，我们提出了STCast(Spatial-Temporal Weather Forecasting) 框架，首次实现了动态全球-区域边界对齐和月度级时间专家分配，用一个统一模型同时解决四大核心气象任务：低分辨率全球预报、高分辨率区域预报、台风路径预测和集合预报。

STCast的核心突破在于两个创新模块：

1. 空间对齐注意力(SAA)：用物理先验初始化全球-区域相关性分布，并在训练中动态优化边界权重

2. 时间混合专家(TMoE)：基于离散高斯分布将不同月份的大气数据路由到专属专家，精准捕捉季节性变化

图1：三种区域预报策略对比。(a)传统AI方法从全球预报裁剪邻域；(b)直接训练区域模型；(c)STCast通过可学习分布密集连接全球-区域模型。右图定量结果显示STCast在RMSE和ACC上全面领先

核心设计详解

STCast整体采用Encoder-Processor-Decoder架构，Processor通过交替使用窗口注意力和自注意力，同时捕捉局部精细结构和全球长程依赖。在此基础上，我们创新性地引入了SAA和TMoE两个核心模块：

图2：STCast整体架构。(a)全球低分辨率预报主结构；(b)高分辨率区域预报的SAA模块；(c)基于MSL的台风路径预测；(d)注入Perlin噪声的长期和集合预报

1. Spatial-Aligned Attention (SAA)：让边界"跟着大气流动"

传统方法将区域边界视为固定的几何边界，而SAA将其定义为可学习的全球-区域相关性分布：

•物理先验初始化：采用大圆距离(Great Circle Distance)计算全球任意点到目标区域的空间距离（比欧氏距离更符合地球球面特性），再通过指数距离衰减函数初始化相关性分布，保证远处区域的影响自然衰减

•动态边界优化：将初始化的先验分布与注意力图做哈达玛积，在训练过程中不断调整权重，最终学习到最符合大气动力学规律的边界

•高效计算：采用线性注意力机制，将计算复杂度从O(n²)降至O(n)，确保全球-区域耦合的计算开销可控

图3：Spatial-Aligned Attention模块结构。以全球特征为Query和Key，区域特征为Value，通过可学习的全球-区域分布调制注意力权重

大气系统具有极强的季节性差异，1月的寒潮和7月的台风遵循完全不同的动力学规律。TMoE创新性地引入月度高斯先验，解决了传统MoE的专家同质化问题：

•为12个月份各学习一个离散高斯分布，峰值对应该月份的专属专家

•输入数据会根据月份激活对应的专家及其相邻专家，既保证了时间特异性，又保留了月份间的连续性

•显式的月度引导替代了传统MoE的隐式路由，无需额外辅助损失即可实现高效的专家分工

图4：Temporal Mixture-of-Experts模块结构。通过月度嵌入和高斯分布引导专家路由，实现动态任务分配

实验结果：四大任务全面刷新SOTA

我们在ERA5数据集上进行了全面的实验验证，训练数据覆盖1979-2019年共40年，使用16张A100 GPU训练100个epoch。

1. 全球低分辨率预报：长期预报优势显著

在6小时到10天的所有预报时效上，STCast的RMSE和ACC均优于Pangu-Weather、Graphcast、Fuxi和OneForecast等主流模型，尤其在7天以上的长期预报中优势明显：

2. 高分辨率区域预报：误差降低一个数量级

在东亚区域的高分辨率预报任务中，STCast相比直接训练和OneForecast实现了质的飞跃：

•RMSE降低0.05，ACC提升0.1

•10m风速(U10)误差仅0.7%，海平面气压(MSL)误差仅0.1%，几乎接近观测值

•能够清晰捕捉锋面、低压系统等中小尺度天气现象

3. 台风路径预测：长期误差降低40%

我们评估了2024年两个典型台风事件：Ewiniar(5月)和Yinxing(11月)。结果显示，STCast在短期预报中与其他模型相当，但在长期预报中优势显著：

•台风Yinxing的5天平均路径误差仅96.5km，比第二名Pangu-Weather(160km)低了近40%

•能够准确预测台风的转向和强度变化，为防灾减灾提供更可靠的决策支持

图5：台风路径预测对比。(a)台风Ewiniar(2024.05)；(b)台风Yinxing(2024.11)；(c)Yinxing的5天平均距离误差对比

4. 集合预报：提供更可靠的概率预报

通过在初始状态注入Perlin噪声并进行50次集合模拟，STCast的集合预报版本在所有时效上都显著优于基线模型，10天RMSE低至0.5113，能够更准确地量化预报不确定性。

消融实验：每个模块都不可或缺

为了验证SAA和TMoE的有效性，我们进行了全面的消融实验：

表2：消融实验结果。移除任何模块都会导致性能显著下降，其中全球-区域分布初始化和月度嵌入的影响最大

美中不足

1. 计算开销：12个专家的TMoE参数达到654.8M，虽然比训练12个单月模型高效，但仍高于单模型方法

2. 区域泛化性：目前仅在东亚区域进行了验证，未来需要在北美、欧洲等不同气候区测试

3. 极端事件覆盖：仅评估了台风，对暴雨、高温、暴雪等其他极端天气的表现还需进一步验证

领域启发

STCast为AI气象预报的发展指明了三个重要方向：

1. 物理先验与数据驱动的深度融合：用地球系统科学原理引导模型设计，比纯数据驱动更高效、更可靠

2. 从"单任务"到"多任务统一"：一个模型解决多个气象任务，既能共享知识，又能降低部署成本

3. 从"静态建模"到"动态自适应"：让模型能够根据空间位置和时间动态调整自身结构，更符合大气系统的本质特性

当大多数AI气象模型还在比拼"谁能预报更久"时，STCast已经开始解决"如何让预报更准"的核心问题。这种从"能用"到"好用"的跨越，正是AI气象预报真正走向业务化应用的关键一步。

📚 参考文献
[1] Hao Chen, Tao Han, Jie Zhang, Song Guo, Lei Bai. STCast: Adaptive Boundary Alignment for Global and Regional Weather Forecasting. CVPR 2026 (Highlight).

转载自：公众号CVer

原地址：https://mp.weixin.qq.com/s/UQtOnar4uDGq-5DJsEQADA

CVPR 2026 精准天气预报！STCast：自适应边界对齐，解锁全球-区域一体化精准天气预报！