HuggingFace镜像/aifs-ens-2.0
模型介绍文件和版本分析
下载使用量0

AIFS ENS v2

许可证 框架 任务 模型

AIFS 是欧洲中期天气预报中心(ECMWF)的人工智能预报系统。 该系统包含两个数据驱动的中期预报模型:

  • AIFS Single v2(详见下一页)
  • AIFS ENS v2(本文档介绍)

AIFS ENS v2 于2026年5月12日投入使用,取代了版本1。 该模型由ECMWF进行业务化运行,每日四次生成包含51个成员、时长15天(每6小时一次)的全球预报。

目录

  • v2版本新增功能
  • 快速入门
  • 模型概述
  • 数据详情
  • 训练详情
  • 评估
  • 已知局限性
  • 技术规格
  • 引用

What's new in v2

AIFS v2版本的发布带来了以下更新:

  • 新增波浪组件,包含11个波浪变量,标志着ECMWF首个业务化数据驱动波浪预报的实现。
  • 在现有陆面组件中新增一个雪变量。
  • 新增热带气旋路径预报功能。
  • 纳入AIFS Single模型中已有的两个变量(vsw和cp),以实现两个模型的协调统一。
  • 通过将参数W从预报量改为诊断量,改进了垂直速度的预报效果。
  • 新增10hPa等压面层资料,提升了平流层的表征能力。

架构方面的改进包括:

  • 用多尺度损失函数替代AIFS ENS v1中使用的afCRPS损失函数。
  • 采用与AIFS Single模型相同的变量边界处理方法,提高了物理一致性。
  • 优化了图特征,在解码器中使用更多边连接。
  • 改进了训练方案,与AIFS ENS v1相比,增加了1年的训练数据。

有关此次升级所引入变化的完整详情,请参见实施页面。


快速入门

访问 AIFS Single v2 模式数据

ECMWF 每天(世界协调时 00、06、12 和 18 时)四次生成 AIFS ENS v2 的业务预报。 用户可通过各种开放数据平台免费访问预报数据。

使用 AIFS Single v2 生成预报

要使用 AIFS ENS v2 模式生成预报,请参考示例笔记本。

该笔记本展示了:

  • 安装软件包并导入
  • 从 ECMWF 开放数据获取初始条件
  • 加载预训练检查点
  • 使用 anemoi-inference 进行推理
  • 可视化预报

anemoi-inference 还提供命令行界面:

anemoi-inference run inference.yaml

或者,如果使用此仓库中的 uv:

uv run --extra inference anemoi-inference run inference.yaml

模型概述

模型描述

AIFS ENS v2 基于图神经网络(GNN)编码器和解码器,以及滑动窗口Transformer处理器构建。

Encoder graph Decoder graph

该模型采用灵活的模块化设计,支持多种级别的并行处理,能够对高分辨率输入数据进行训练。AIFS的预报技能通过将其预报结果与数值天气预报(NWP)分析数据及直接观测数据进行对比来评估。

  • 开发机构: ECMWF
  • 模型类型: 编码器-处理器-解码器模型
  • 许可证: 推理模型权重发布遵循知识共享署名4.0国际许可协议(CC BY 4.0)。如需查看本许可证副本,请访问 https://creativecommons.org/licenses/by/4.0/。 演示笔记本及其他脚本文件发布遵循Apache 2.0许可协议。如需查看本许可证副本,请访问 https://www.apache.org/licenses/LICENSE-2.0.txt。

模型分辨率

AIFS ENS v2 为平流层部分引入了新的气压层。

模型垂直分辨率[气压层](hPa)
AIFS ENS v210(新增)、50、100、150、200、250、300、400、500、600、700、850、925、1000

与先前版本AIFS ENS v2相比,水平分辨率没有变化。

组件水平分辨率[公里]垂直分辨率[层数]
大气~ 3114

模型来源

  • 代码库: Anemoi 是一个用于创建数据驱动天气预报系统的开源框架。Anemoi由ECMWF和欧洲各国气象服务机构联合开发。
  • 相关论文:
    • AIFS-CRPS:使用基于连续排序概率评分的损失函数训练的集合预报模型(2024)
    • 用于通过适当评分优化学习概率模型的多尺度损失公式(2025)

数据详情

训练数据

预训练 AIFS ENS v2 所使用的数据与先前模型版本(v1)保持一致:

  • 预训练基于 1979–2022 年的 ERA5 数据,共进行了 300,000 个训练步骤。

微调 AIFS Single v2 所使用的数据已更新:

  • 与 AIFS ENS v1 相比,微调增加了 1 年的数据。
  • 具体而言,微调使用了 ECMWF 业务分析数据和 IFS 50r1 esuite 分析数据,覆盖 2018-2024 年,共进行了 7,900 个训练步骤。
AIFS ENS v2 fine-tuning

注:用于微调的 IFS 50r1 esuite 分析数据不对用户开放。它包含来自 IFS Cycle 50r1 早期版本的原型数据。

与先前版本的 AIFS ENS 一样,IFS 字段从其原生 O1280 分辨率(约 0.1°)使用 MARS 默认插值工具插值到 N320(约 0.25°),以用于模型在推理期间的微调和初始化。

数据参数

新增参数

AIFS Single v2 引入了 14 个新参数,这些参数用于模型训练,并在预报期间由模型输出。

短名称名称单位
h1012周期在 10 至 12 秒(含)范围内的所有波浪的有效波高mmm
h1214周期在 12 至 14 秒(含)范围内的所有波浪的有效波高mmm
h1417周期在 14 至 17 秒(含)范围内的所有波浪的有效波高mmm
h1721周期在 17 至 21 秒(含)范围内的所有波浪的有效波高mmm
h2125周期在 21 至 25 秒(含)范围内的所有波浪的有效波高mmm
h2530周期在 25 至 30 秒(含)范围内的所有波浪的有效波高mmm
wmb模型水深mmm
swh有效波高mmm
mwd平均波向Degree trueDegree\ trueDegree true
mwp平均波周期sss
cdww波浪拖曳系数dimensionlessdimensionlessdimensionless
fscov积雪覆盖率ProportionProportionProportion
cp对流性降水kgm−2kg m-2kgm−2
vsw体积土壤湿度m3m−3m3 m-3m3m−3

此外,AIFS ENS v2.0 现在以 BUFR 格式生成热带气旋路径预报。有关更多详细信息,请参见 https://confluence.ecmwf.int/display/FCST/Implementation+of+AIFS+ENS+v2#ImplementationofAIFSENSv2-Newparameters。


训练详情

训练数据

AIFS ENS v2 基于 ECMWF 的 ERA5 再分析数据和 ECMWF 的业务数值天气预报(NWP)分析数据进行训练,具体描述见训练数据部分。

AIFS ENS v2 旨在生成 6 小时预报。它接收 $t_{−6h}$、$t_{0}$ 时刻的大气状态表征作为输入,然后预报 $t_{+6h}$ 时刻的状态。

AIFS 2m Temperature

下表列出了 AIFS ENS v2 使用的所有输入参数和输出参数。新增参数和层次以粗体标记。

要素层次类型输入/输出
位势高度(Z)、水平和垂直风分量(U、V)、温度(T)气压层:10、50、100、150、200、250、300、400、500、600、700、850、925、1000两者皆是(“预报量”)
比湿(Q)气压层:100、150、200、250、300、400、500、600、700、850、925、1000两者皆是(“预报量”)
垂直速度(W)气压层:10、50、100、150、200、250、300、400、500、600、700、850、925、1000输出(“诊断量”)
比湿(Q)气压层:50输出(“诊断量”)
地面气压(SP)、海平面气压(MSL)、海表温度(SST)、地表温度(SKT)、2米温度(2T)、2米露点温度(2D)、10米水平风分量(10U、10V)、整层水汽含量(TCW)、平均波周期(MWP)、平均波向(MWD)、波浪拖曳系数(CDWW)、有效波高(SWH)、周期在以下含括范围内的所有波浪的有效波高:

- 10 至 12 秒(H1012)
- 12 至 14 秒(H1214)
- 14 至 17 秒(H1417)
- 17 至 21 秒(H1721)
- 21 至 25 秒(H2125)
- 25 至 30 秒(H2530)
地面两者皆是(“预报量”)
体积土壤湿度(VSW) 和土壤温度(SOT),均位于土壤深度 1 和 2土壤层两者皆是(“预报量”)
100米水平风分量(100U、100V)、地表向下短波(太阳)辐射(SSRD)、地表向下长波(热)辐射(STRD)、云变量(TCC、HCC、MCC、LCC)、径流水当量(ROWE)和降雪量(SF)、总降水量(TP)、对流性降水(CP)、积雪覆盖率(FSCOV)地面输出(“诊断量”)
次网格地形标准偏差(SDOR)、次网格地形坡度(SLOR)、陆面掩码(LSM)、位势高度(Z)、日照、经纬度、一天中的时间/一年中的日期地面输入(“强迫场”)

训练流程

AIFS ENS v2训练机制的主要变化包括:

  • 引入多尺度损失函数
  • 移除参考场截断,采用与AIFS Single模型相同的变量边界以提升物理一致性
  • 修订图特征,在解码器中使用更多边并结合新的边特征

有关模型架构的完整细节,请参见arXiv预印本此处和此处。

速度、大小与时间

训练采用数据并行方式,批大小为1。单个模型实例分布在两块120GB GH200 GPU上,集合实例分布在4块GPU上。训练使用混合精度(Micikevicius等人[2018]),整个过程在32块GPU上进行,耗时约一周。检查点大小为2.55GB,如前所述,不包含优化器状态。


评估

现可获取2026年1月至3月期间AIFS ENS v2性能的交互式评分卡。这些评分卡对比了从49r1和50r1 IFS初始条件初始化时的性能:

  • AIFS ENS v2(从50r1初始化)与AIFS ENS v1(从49r1初始化)的对比
  • AIFS ENS v2与AIFS ENS v1的对比(均从50r1初始化)

已知局限性

请参考https://confluence.ecmwf.int/display/FCST/Known+AIFS+Forecasting+Issues。


技术规格

硬件

AIFS ENS v2的训练使用了32块GH200 GPU(120GB)。

软件

该模型是使用 Anemoi 框架 开发和训练的。 Anemoi 框架提供了一套完整的工具包,用于开发数据驱动的天气模型——从数据准备到推理。其开发工作主要由多个欧洲气象组织推动,但也欢迎任何组织或个人贡献力量。 该框架由多个软件包组成,这些软件包针对构建数据驱动天气模型所需的不同组件。为了助力开发和部署,每个软件包都会收集元数据,供后续软件包使用。该框架建立在成熟的 Python 工具之上,包括 PyTorch、Lightning、Hydra、Zarr、Xarray 和 earthkit。


引用

如果您在工作中使用此模型,请按以下方式引用:

BibTeX:

@misc{lang2025multiscale,
      title={A multi-scale loss formulation for learning a probabilistic model with proper score optimisation},
      author={Simon Lang and Martin Leutbecher and Pedro Maciel},
      year={2025},
      eprint={2506.10868},
      archivePrefix={arXiv},
      primaryClass={physics.ao-ph},
      url={https://arxiv.org/abs/2506.10868},
}

@misc{lang2024aifscrps,
      title={AIFS-CRPS: Ensemble forecasting using a model trained with a loss function based on the Continuous Ranked Probability Score}, 
      author={Simon Lang and Mihai Alexe and Mariana C. A. Clare and Christopher Roberts and Rilwan Adewoyin and Zied Ben Bouallègue and Matthew Chantry and Jesper Dramsch and Peter D. Dueben and Sara Hahner and Pedro Maciel and Ana Prieto-Nemesio and Cathal O'Brien and Florian Pinault and Jan Polster and Baudouin Raoult and Steffen Tietsche and Martin Leutbecher},
      year={2024},
      eprint={2412.15832},
      archivePrefix={arXiv},
      primaryClass={physics.ao-ph},
      url={https://arxiv.org/abs/2412.15832}, 
}

美国心理学会格式:

Lang, S., Leutbecher, M., & Maciel, P. (2025). A multi-scale loss formulation for learning a probabilistic model with proper score optimisation. arXiv preprint arXiv:2506.10868.
Lang, S., Alexe, M., Clare, M. C., Roberts, C., Adewoyin, R., Bouallègue, Z. B., ... & Leutbecher, M. (2024). AIFS-CRPS: Ensemble forecasting using a model trained with a loss function based on the Continuous Ranked Probability Score. arXiv preprint arXiv:2412.15832.

更多信息

所有论文:

  • AIFS-CRPS:基于连续排序概率得分损失函数训练模型的集合预报(2024)
  • 基于适当得分优化学习概率模型的多尺度损失公式(2025)