数值预报AI气象大模型国际发展动态研究

2024-04-25 11:05黄小猛林岩銮熊巍李佳皓潘建成周勇
大气科学学报 2024年1期
关键词:天气预报分辨率气象

黄小猛 林岩銮 熊巍 李佳皓 潘建成 周勇

摘要 数值预报是研究地球系统的重要工具,有助于加深科学家对大气、海洋、气候和环境等复杂系统之间相互作用和变化过程的理解,在防灾减灾、气候变化和环境治理等方面发挥着不可或缺的作用。随着模式复杂度和分辨率的提高,传统数值模式在气候变化研究和气候预测方面取得了迅速的进展,但也面临一些挑战,需要得到数据同化、集合耦合、高性能计算和不确定性分析等多方面的支持。而近年来,“AI+气象”的交叉研究在气象领域引起了广泛关注。基于多种深度学习架构的人工智能大模型,依托强大的计算资源和海量的数据进行训练,能够以新的科学范式进行高效数值预报。气象大模型不断涌现,一些科技公司如华为、英伟达、DeepMind、谷歌、微软等,以及国内外高校如清华大学、复旦大学、密歇根大学、莱斯大学等发布了多个涵盖临近预报、短时预报、中期预报和延伸期预报等不同领域的气象大模型。这标志着人工智能与气象领域的交叉融合已经达到新的高度。尽管气象大模型在现阶段取得了较大突破,但其发展仍然面临弱可解释性、泛化能力不足、极端事件预报强度偏低、智能预报结果过平滑、深度学习框架能力需要拓展等诸多挑战。

关键词数值预报;地球系统模式;深度学习;气象大模型

作为国家防灾减灾的重要保障,数值预报技术正在迅速发展。一方面,传统的物理天气气候模式正在快速发展,并逐步过渡到地球系统模式。另一方面,人工智能大模型在天气预报领域取得了突飞猛进的进展,呈现出一种互相追赶的态势。本文将总结国际和国内在传统数值预报模式和气象大模型两方面的最新进展,并展望未来的发展。

1 地球系统模式

地球系统数值预报是当今世界公认最为重要的地球系统研究工具,是开展防灾减灾、气候变化和环境治理等科学研究不可缺少的手段。基于地球系统框架下的无缝隙多尺度天气气候一体化预报技术是数值预报的核心攻关任务(Brunet et al.,2015;Ruti et al.,2020;Ren et al.,2023)。地球系统模式由气候系统模式发展而来,是气候系统模式在深度和广度上的拓展。传统的气候系统模式主要包含大气、陆面、海洋、冰冻圈(海冰和冰盖)等分量模式,主要用于模拟和理解过去、现在和未来气候背景下气候系统各个圈层相互作用的物理规律,包括重大天气和气候灾害的预测和机理研究,全球能量和水分循环、海洋环流和海冰演变等(王斌等,2008;王会军等,2014)。气候系统模式构成了地球系统模式的基本框架,后者在氣候系统模式基础上扩展了大气化学、生物地球化学和人类活动影响等过程以及以上过程之间的相互作用(Randall et al.,2019)。欧美发达国家已开启以地球系统模式为目标的下一代数值模式研发。随着科学技术的发展,对大气、海洋、地质和生态等各个分系统的研究不断深入,越来越倾向于将地球系统作为一个有机整体进行研究。

全球各模式中心的气候系统模式和地球系统模式基本都参与了最近一次的CMIP6(Eyring et al.,2016)。参与CMIP6的模式有两个特点:一是大气和海洋模式的分辨率明显提高,大气模式的最高水平分辨率达到了全球25 km,海洋模式达到10 km。二是更多的、更复杂的地球系统模式参与其中,考虑的过程更为复杂,以包含碳氮循环过程的地球系统模式为主,许多模式实现了大气化学过程的双向耦合,包含了与冰盖和多年冻土的耦合作用。参与CMIP6的近60个模式中,命名为地球系统模式(Earth System Model,ESM)的模式超过40个。这些模式包含了气溶胶、大气化学、陆冰、陆面和海洋生化过程的一个或多个分量。

1.1 发展现状

这里简要总结IPCC AR6 报告(IPCC,2021)之后全球天气气候及地球系统模式的发展现状和趋势。整体来看,传统的天气气候模型正在快速发展,向包含海洋、海冰、生物地球化学和大气化学过程在内的地球系统模式迈进(Zhou et al.,2020)。同时,越来越多的应用开始采用地球系统模式进行天气、气候及生态预测。在这个过程中,出现了以下几个趋势:

1)模式的复杂度和包含的分量模式和过程越来越多

针对不同的社会和科学需求,地球系统模式包含的分量模式和过程越来越多,同时复杂度也在不断增加(Bonan and Doney,2018)。具体包括冰盖模型的开发以促进海平面变化的预测,陆面生态的模拟(如粮食产量预测),大气污染的预测、碳氮循环,以及古气候模拟(研究气候敏感度、非线性和转折点等气候突变事件)。另外,水和食物安全、生态脆弱性、土地利用变化,以及野火、沙尘暴等重要的气候事件的预测也需要模型不断加入新的过程和分量来满足和提高相关方面的能力。

2)天气气候一体化融合发展

目前数值模式发展的国际主流趋势是通过构建一体化模式实现无缝隙模拟预报功能,以同时满足不同时间和空间尺度的天气-气候预报预测的需求,可适用于数值天气预报、季节预报和气候模拟,预报时间从几天到几百年不等。同一个模式可应用于不同尺度的预测,其中物理参数化采用尺度自适应的方式,实现不同尺度适配的物理过程。未来5~10 a,涵盖天气和气候的无缝隙预测有望得到蓬勃发展,这要求模式的研发打破天气和气候之间的壁垒。另外一个趋势是利用ESM开展天气预报和气候预测的计划开始进入各大模式中心(Delworth et al.,2020)。目前,利用ESM开展天气预报仍处于研发阶段。例如,欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)计划研制用于天气预报的地球系统模式,考虑到陆面生态、大气化学等过程和气候模式的耦合。这要求所需的ESM须具备必要的复杂程度,以体现尽可能多的地球系统圈层之间的相互作用,同时在计算效率上保持可控性。

基于地球系统模式的预测系统研发包括多个方面,例如构建相应的数据同化系统以获得对地球系统当前状态的最佳估计;对地球系统的综合观测,包括卫星观测,这有助于对地球系统过程的认识并改善其模拟性能。此外,在次季节-季节预报方面的相关研究也正在蓬勃发展,具体包括对平流层、土壤水分、植被、积雪、海冰和气溶胶等模式分量的研发,以不断提高预报水平。

3)模式分辨率得以快速提高

地球系统模式的水平和垂直分辨率正在快速提高。除了全球整体分辨率的提升,采用变分辨率非结构网格的方法使得区域高分辨率模拟成为可能。垂直方向分辨率的增加有助于中层大气的模拟,包括对平流层极涡、准两年震荡等现象的模拟(Wu et al.,2019)。同时,提高边界层垂直分辨率可以改善对边界层水汽、温度和云的模拟。高分辨率是中期天气预报应用的发展趋势,它将显著提高模式对云和降水等过程的解析度,并减少对参数化方案的依赖。简化物理过程也能够显著减少模式的计算量,从而实现高分辨率和较低参数化程度的结合,这将成为未来中期预报领域的主要模式配置形式。

许多模式中心计划开展3~5 km甚至更高分辨率的全球大气模式,海洋模式的分辨率也将达到中尺度涡或次中尺度涡的分辨率(1 km),例如欧盟的Destination Earth计划(https://destination-earth.eu/)。DYAMOND计划(Stevens et al.,2019)吸引了全球多个高分辨率大气模式的参与。提高分辨率对传统的物理参数化方案提出了挑战,例如,传统的积云对流参数化方案通常适用于100 km以上的气候模式,随着分辨率的提高,这些方案的尺度自适应问题需要得到妥善的考虑(Li et al.,2022;Wang,2022)。

4)数值模式和人工智能相互结合和促进

人工智能的快速发展给地球系统模式的发展提供了新的机会,例如人工智能已经在模式参数化研发(边界层、对流、云;海洋里的垂直混合、中尺度涡和次中尺度涡参数化、海气通量参数化、气冰通量计算)、过程理解、参数估计、模式优化、模式模拟后处理和误差订正、空气质量预测、可预报性研究等方面得到广泛应用(Rasp et al.,2018;Reichstein et al.,2019;Han et al.,2020;Mooers et al.,2021;Wang et al.,2022)。加州理工学院牵头的CliMA计划利用人工智能结合海量的观测和高分辨率模拟数据建立新的气候系统模式,已经在多方面取得进展(https://clima.caltech.edu)。

5)社会经济模型的发展和耦合

社会经济模型主要指综合评估模型(IAM),主要描述人类社会活动通过温室气体排放对地球系统,特别是全球气候变化的影响(Sokolov et al.,2018)。传统上综合评估模型更多的是一个经济模型和气候政策模型。由于各种假定和参数,综合评估模型具有很大的不确定性,如何量化和减小其不确定性是一个重要的发展方向。另外,由于气候和环境变化也会对社会经济活动和人类福祉产生巨大影响,但这部分由于缺乏综合评估模型和地球系统模式的耦合而无法进行模拟。当前的一个趋势就是综合评估模型和地球系统模式的有机耦合,但这存在大量的困难和挑战(Yang et al.,2015)。其中一个原因是一个是物理模型,而另外一个是社会经济模型,之间要沟通耦合的变量不一样。另外,这两类模型的构建形式差异巨大,包括计算机语言和框架,当然最主要的还是我们对他们之间的紧密联系和影响的认识和量化都存在不足。当前主要的还是综合评估模型提供未来温室气体和污染物的排放预估,作为地球系统模式的输入,因此是單向的一种联系。未来要把地球系统模式预估的天气气候变化影响反馈给综合评估模型,确定气候变化对社会经济的影响,形成一个闭环(Calvin and Bond-Lamberty,2018)。

1.2 传统数值模式展望

传统数值模式在气候变化研究和气候预测方面发展迅速,并面临一些挑战。这些模式主要关注系统对外部强迫的响应和长期变化,与数值预报的重点有所不同。数值预报更专注于系统在给定初始状态下的短期演变,因此需要考虑同化问题,即将观测数据与模型结果相结合以提高预测准确性。在次季节-季节到年际和年代际预测中,需要考虑地球系统不同组分之间的相互作用和耦合同化。例如,次季节-季节预测需要考虑陆地表面和上层海洋的同化,而年际和年代际预测需要考虑海洋、海冰和大气、陆地的耦合同化(Zhou et al.,2023)。

随着模式复杂度和分辨率的提高,地球系统模式的发展面临着新的挑战,需要得到数据同化、集合耦合、高性能计算和不确定性分析等多方面的支持,高效的并行计算技术、强大的在线分析系统和标准化分析评估软件的不断发展将为模式发展提供重要的技术支撑。

人工智能大模型在天气预报领域已经取得了显著进展,并在未来有望为气候预测和气候变化研究带来新的思路和进展。将数据驱动的智能模型与物理模型有机结合,发挥各自的优势,有助于推动数值预报取得突破性进展(Reichstein et al.,2019)。这是一个值得关注和探索的问题,可以为气候预测和气候变化研究带来更多的创新和进步。

2 气象大模型

近年来,“AI+气象”的交叉研究在气象领域引起了广泛关注。人工智能大模型基于多种深度学习架构,并依托强大的计算资源和海量的数据(Rasp et al.,2020)进行训练,能够以新的科学范式进行独立于传统数值预报模式的气象预测(Nguyen et al.,2023)。目前,基于深度学习的气象大模型(Large Weather Model,LWM)取得了显著进步,例如FourCastNet(Pathak et al.,2022)、GraphCast(Lam et al.,2023)、NowcastNet(Zhang et al.,2023)、盘古天气(Bi et al.,2023)、风乌(Chen K et al.,2023)、伏羲(Chen L et al.,2023)等,在提高预报精度和加速预测推理过程等方面展现出显著优势和巨大潜力。

2.1 发展现状

1)临近预报(NowcastNet)

2023年7月,清华大学软件学院与国家气象中心、国家气象信息中心联合提出了名为NowcastNet的极端降水临近预报大模型。该模型的提出填补了气象大模型在强降水、暴风雨、暴雪、冰雹等极端降水天气预报领域的不足(Ravuri et al.,2021)。NowcastNet能够将降水临近预报的时效从现有的几十分钟延长至3 h(Ashesh et al.,2022),空间分辨率为20 km,时间分辨率为10 min,为解决3 h内降水临近预报科学难题提供了新方法新工具。

NowcastNet在数据驱动的基础上引入了物理约束,通过神经演变算子实现了降水物理过程的端到端建模。模型以中尺度演变网格预测结果为条件,通过概率生成模型对公里尺度降水过程进行精细捕捉。NowcastNet采用近六年的观测资料作为训练基础,探索了一种融合数据驱动与物理驱动的“科学学习”新范式。经过62位气象预报专家的检验评估,NowcastNet在国际同类方法中处于领先地位,具有重要的学术意义和实际应用价值。其相关研究成果已在《Nature》正式发表,并已在国家气象中心短临预报平台(SWAN 3.0)部署上线。

2)短时预报(MetNet系列)

MetNet(Snderby et al.,2020)、MetNet-2(Espeholt et al.,2022)、MetNet-3(Andrychowicz et al.,2023)是谷歌分别于2020、2021、2023年相继推出的深度学习天气预报模型,是谷歌公司针对人工智能在气象领域应用的重要探索。

MetNet基于深度神经网络架构,通过学习大量气象观测数据来捕捉天气系统的复杂演变过程(Agrawal et al.,2019;Ravuri et al.,2021)。MetNet能够以1 km的空间分辨率和2 min的时间分辨率生成准确的8 h降水预报。MetNet-2是MetNet的升级版,在MetNet的基础上进一步改进和扩展了模型的功能,采用了更大规模的数据集进行训练(Ko et al.,2022),能够以1 km的空间分辨率和2 min的时间分辨率进行12 h的降水预测,提高了模型的性能和准确性,预报结果优于集合数值天气预报模型(High-Resolution Ensemble Forecast,HREF)。MetNet-3在前面的基础上进一步提高,可以从密集和稀疏的数据站点数据中学习,提前24 h预测降水、风、温度和露点。因其强大的预报性能,目前已在google天气等方面业务运行。然而,MetNet系列作为深度学习与气象领域融合应用的一次尝试,采用的是纯数据驱动的训练策略和推理方式,在物理约束和可解释性方面仍然具有较大的探索空间。

3)中期预报(FourCastNet、盘古天气)

2022年2月,英伟达联合劳伦斯伯克利国家实验室、密歇根大学安娜堡分校、莱斯大学等机构提出了一种名为FourCastNet的预测模型(Pathak et al.,2022),该模型基于自适应傅立叶神经网络(Adaptive Fourier Neural Operators,AFNO)(Guibas et al.,2021)。FourCastNet能够在2 s内实现一周时间尺度的高分辨率(0.25°)天气预报,预报内容包括温度、濕度、大气水蒸气、降水和风速等。值得关注的是,FourCastNet的预报速度相比ECMWF的高分辨率综合预报系统(Integrated Forecast Systems,IFS)提升了45 000倍。

FourCastNet结合了傅里叶神经算子(Fourier Neural Operator,FNO)(Wen et al.,2022)在Navier-Stokes方程上的分辨率无关性表现,将算子学习(Kovachki et al.,2021)从理论研究推向了大规模业务天气预报应用。该模型通过降低计算复杂度,使得在大尺度变量上的预测结果与欧洲中期天气预报中心的IFS相当,在小尺度变量上则优于IFS。FourCastNet采用了“预训练+微调”的范式,只需要少量参数就可以实现端到端的下游任务预报。

FourCastNet在AI天气预报领域实现了前所未有的准确性,成为深度学习在气象预测领域应用的先驱代表,弥补了传统数值天气预报模式计算复杂和推理速度慢等不足之处。

2022年11月,华为云计算团队提出了一种名为盘古天气大模型(Bi et al.,2023)的预测模型,它基于3D Earth-specific Transformer结构,能够进行预报时效为1 h到7 d的高精度(0.25°)天气预报。该模型通过纯数据驱动的深度学习方法替代了传统数值模式中的动力核心和参数化方案,在预报精度上超过了传统数值模式,并且计算速度提升了10 000倍。

盘古天气大模型采用了3D Swin Transformer(Liu et al.,2021)作为骨干网络,以初始大气状态作为输入,并输出与初始状态结构相同的未来大气状态,并支持极端天气预报和成员集合预报等各种下游任务。同时使用层次化时域聚合策略来减少预报的迭代次数,从而减少迭代误差。2023年7月,盘古天气大模型在《Nature》杂志上正式发表,标志着气象大模型在预报性能方面取得了重要突破,为未来的天气预报研究和应用提供了有益的参考。

4)延伸期预报(GraphCast、风乌、伏羲、AI-GOMS)

2022年12月,DeepMind和谷歌研究团队联合推出基于图神经网络的自回归天气预报模型GraphCast(Lam et al.,2023),将原始经纬度网格的输入数据映射到多网格上的学习特征中(Keisler,2022)。它可以在空间分辨率为0.25°的经纬度网格上,每隔6 h对5个地表变量和6个大气变量进行10 d的预报,每个变量在37个垂直压力水平上,大致相当于赤道25 km×25 km的分辨率。

GraphCast可以在60 s内预测未来10 d内的天气,而且准确率很高,在252个变量中,有99.2%超过了现有最准确的深度学习天气预报模型;在2 760个变量中,有90%超过了欧洲中期天气预报中心的高精度预报结果。GraphCast是首个能够产生高保真度、预报时效为10 d的深度学习天气预报模型,与业界领先的数值天气预报模式相比,具有更高的预报精度和计算速度。2023年11月,GraphCast在权威科学期刊《Science》上发表,进一步揭示了人工智能在气象领域的应用价值。

2023年4月,上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所和上海市气象局提出风乌气象预报大模型(Chen K et al.,2023),在30 s内即可生成未来10 d全球高精度(0.25°)预报结果。

风乌将大气变量之间的相互影响看作是多任务学习问题,采用多模态神经网络和多任务自动均衡权重来解决多种大气变量表征和相互影响的问题。为了优化多步预测结果,风乌使用缓存回放策略,在训练阶段通过收集和重用中间预测结果来计算多时间步的自回归累积误差。相比于GraphCast通过添加自回归阶段的方式,缓存回放策略节省计算成本和提升长期自回归训练效率。风烏使用多模态、多任务方法和缓存回放策略来解决天气预报问题,首次将全球天气预报的有效性提高到10.75 d,具有较高的业务应用价值。

2023年6月,复旦大学人工智能创新与产业研究院联合大气与海洋科学系推出了45亿参数量的伏羲气象大模型(Chen L et al.,2023),进行未来15 d的全球高精度(0.25°)预报。

伏羲基于U-Transformer(Li et al.,2023)结构,并通过构建级联模型,对多个模式进行微调,同时伏羲使用多时间步损失函数使得多个迭代时间步的误差最小化,从而减少预测误差的累积,提高长期预测的性能。伏羲首次将深度学习天气预报时效提升到15 d,在时间分辨率为6 h、空间分辨率为0.25°的10 d预报中表现优于欧洲中期天气预报中心的确定性预报(High-resolution Forecast,HRES),在15 d的预报中表现与欧洲中期天气预报中心集合预报的集合平均(Ensemble Mean,EM)相当。

2023年8月,清华大学地球系统科学系提出了一个人工智能驱动的全球海洋建模系统AI-GOMS,在0.25°空间分辨率和1 d时间分辨率下对15个深度层的全球海洋基本变量进行了30 d的最佳预测,能够用于准确和高效的全球海洋日常预测。

AI-GOMS(Xiong et al.,2023)由一个基于傅立叶的编码自回归模型(Masked Autoencoder,MAE)结构(He et al.,2022)的预训练模型和一个轻量的微调模型组成,使用人工智能方法实现端到端的替代模型,可以脱离数值模式独立运行。其中微调模型分为区域降尺度、(波浪)解码和(生物化学)耦合三种不同结构,适用于解决全球海洋模拟中的各种类型的科学任务。AI-GOMS解决了当前的数值海洋建模非线性不稳定性、计算量大、重用效率低、耦合成本高等问题,是全球首个数据驱动的全球海洋建模系统。

2.2 气象大模型展望

现阶段,气象大模型取得了较大突破,但其发展仍然面临较多挑战,尚有一系列核心问题需要重点关注。

1)可解释性问题

气象大模型的可解释性是未来研究的重点。深度学习模型通常是“黑盒”模型,难以解释其物理意义及决策过程,难以对预报结果提供气象领域所需的可解释依据。现阶段,气象大模型缺乏足够的数学理论分析,针对可解释性的神经网络架构和相应的数学分析工具仍然具有较大的探索空间。需要探索通过核方法等一系列数学方法,进一步揭示气象大模型神经网络求解偏微分方程组的误差和训练动力学。探索理论驱动和数据驱动融合的新科学范式,通过物理模式与深度学习的结合,在气象大模型中引入物理约束,研究模型的可解释性和物理原理,是未来气象大模型发展需要重点关注的科学问题。

2)泛化与迁移挑战

训练完成的气象大模型能够以较低的成本实现迁移外推,例如FourCastNet模型比传统数值预报系统IFS快45 000倍,计算能耗可降低近万倍。然而,大规模气象大模型的训练过程需要庞大的计算资源,FourCastNet模型需要使用海量的再分析资料ERA5驱动训练,计算成本方面相较于传统数值模式并无明显优势,气象大模型的业务化应用应当进一步考虑泛化能力和迁移成本的问题。普遍近似原理表明,神经网络具备准确逼近任意非线性连续算子和非线性连续泛函的能力,因此,气象大模型将朝着泛化能力更强的算子学习领域发展,在Banach空间对参数空间和解算子进行逼近。

3)过平滑问题

现阶段,气象大模型对极端事件的预测能力仍有待提高,以FourCastNet、盘古天气等为代表的气象大模型已经在多种下游任务中实现了较好的预报效果,但普遍缺乏对极端降水事件的预报能力。气象大模型虽然擅长对非线性系统进行建模,但统计模型存在固有的小样本过平滑问题,预报结果对数据的依赖较大,在极端事件的预测领域仍然存在较大不足。因此,从优化训练数据集和改进深度学习网络架构等层面探索过平滑问题的解决思路,通过数据增强、集成学习、超参数调优等方法对气象大模型进行优化,是填补气象大模型极端事件预报空白的重要研究领域。

4)深度学习框架问题

大气和海洋模式通常是基于Fortran语言编写的,如给区域气象预报提供支持的天气预报模式(Weather Research and Forecasting Model,WRF)(Skamarock et al.,2008)、使用混合网格的海洋模式(Hybrid Coordinate Ocean Model,HYCOM)和被广泛使用的地球系统模式(Community Earth System Model,CESM)(Hurrell et al.,2013)等。然而,这种科学计算越来越多地结合了深度学习的进步和处理大量数据的能力(Innes et al.,2019),构成气象大模型底层的主流机器学习库,如Tensorflow和Pytorch以Python语言为基础。因此,气象大模型与传统数值模式的融合需要解决Fortran语言和Python语言的双向耦合问题(Curcic,2019;Ott et al.,2020;Mu et al.,2023),同时也要保证神经网络架构能够在气象预报过程中保持稳定性。

现今的主流计算框架通常只考虑并优化了一阶导数的计算,然而,海洋大气问题常常需要计算高阶导数,例如涉及Navier-Stokes方程中的对流项等情况。现阶段的深度学习框架为了获得二阶甚至更高阶导数,只能通过嵌套多次一阶导数的计算方式来实现,导致了计算资源和时间的显著增加。如果在现有的自动微分框架的基础上实现类似于Hessian矩阵等方法的二阶或高阶导数计算,将大幅提高气象大模型的计算效率,远超过嵌套实现多次自动微分的方式。此外,自然界中的规律有时候也需要被建模成分数阶偏微分方程或者涉及微分-积分方程等形式,例如大气辐射传输方程中存在包含积分项的方程。然而,现有的深度学习框架对于分数阶导数和积分的支持相对较低,限制了其在涉及这些问题时的应用。

5)与其他新兴信息技术融合

现阶段,气象大模型的推广应用及与其他前沿信息技术的融合尚有待提升。推动人工智能与云计算、分布式数据库、数据挖掘等前沿信息技术的全面融合,综合运用各项信息技术提高气象大模型的业务化水平,是推动气象大模型实际推广应用的重要基础。同时,推动气象大模型与数字孪生、量子计算等新兴前沿技术的交叉融合,探索更广泛的应用領域,是进一步拓展气象大模型应用空间的值得探索的研究方向。

6)人工智能驱动的数值预报科研新范式

至今,数值预报科技仍沿着“从物理原理和基本公式出发,进行天气气候变化机理分析,选取并收集所需数据,经加工处理得出预报结果”的传统路径发展。人工智能驱动的科学研究(AI for Science,AI4S)新范式的出现(王飞跃和缪青海,2023),为数值预报科技发展开辟了新路径,即:从自然环境和社会经济大数据出发,经人工智能算法处理得到预报结果,然后反向分析输入输出数据因果关系,寻找隐藏于数据背后的天气气候变化机理。

3 总结和讨论

新兴信息技术的快速发展一定程度上补充和颠覆了传统数值模式的技术路线,使得地球系统模式的应用场景不断拓展。数值预报与人工智能的交叉融合是地球系统模式研究的前沿热点和重要方向。气象大模型能够发挥海量数据优势,通过挖掘数据中的潜在物理规律来建立预测模型输入和输出的映射关系,在预测准确性、时效性和计算速度等方面已经初步呈现出巨大潜力。在准确性上,除极端天气等个别领域外,气象大模型的预报准确性已经媲美或超越了传统数值模式,同时,随着人工智能大模型架构的不断改进和训练策略的发展,其预报精度正稳步提升;在时效性上,人工智能大模型凭借深度神经网络的强大泛化能力,在同分辨率条件下的预测能力远超传统数值模式;在计算速度方面,人工智能大模型相比传统数值模式极大提高了推理运算速度,逐渐摆脱了传统数值模式计算时间较长的限制。人工智能大模型的快速涌现和业务化应用具有划时代的意义,一定程度上解决了传统数值预报领域面临的难题,标志着“AI+预报”时代一次新的飞跃,为未来的地球系统预测范式提供了新思路。

数值预报的发展与计算技术、存储技术、观测技术等息息相关,其应用领域需要与多学科交叉融合。未来,推动数值预报与人工智能、量子计算、数字孪生等新兴信息技术的进一步融通,基于不同的学科需求和社会需要探索更为复杂精细的分量模式,在地球系统整体研究视角下推进数值预报与多学科的交叉协同,是数值预报研究的重要科学问题。

参考文献(References)

Agrawal S,Barrington L,Bromberg C,et al.,2019.Machine learning for precipitation nowcasting from radar images[EB/OL].[2023-11-27].http://arxiv.org/abs/1912.12132.pdf.

Andrychowicz M,Espeholt L,Li D,et al.,2023.Deep learning for day forecasts from sparse observations[EB/OL].[2023-11-27].http://arxiv.org/abs/2306.06079.pdf.

Ashesh A,Chang C T,Chen B F,et al.,2022.Accurate and clear quantitative precipitation nowcasting based on a deep learning model with consecutive attention and rain-map discrimination[J].Artif Intell Earth Syst,1(3):e210005.doi:10.1175/AIES-D-21-0005.1.

Bi K F,Xie L X,Zhang H H,et al.,2023.Accurate medium-range global weather forecasting with 3D neural networks[J].Nature,619(7970):533-538.doi:10.1038/s41586-023-06185-3.

Bonan G B,Doney S C,2018.Climate,ecosystems,and planetary futures:the challenge to predict life in Earth system models[J].Science,359(6375):eaam8328.doi:10.1126/science.aam8328.

Brunet G,Jones S,Ruti P M,2015.Seamless prediction of the earth system:from minutes to months[M].Geneva,Switzerland:World Meteorological Organization:483.

Calvin K,Bond-Lamberty B,2018.Integrated human-earth system modeling:state of the science and future directions[J].Environ Res Lett,13(6):063006.doi:10.1088/1748-9326/aac642.

Chen K,Han T,Gong J C,et al.,2023.FengWu:pushing the skillful global medium-range weather forecast beyond 10 days lead[EB/OL].[2023-11-27].http://arxiv.org/abs/2304.02948.pdf.

Chen L,Zhong X H,Zhang F,et al.,2023.FuXi:a cascade machine learning forecasting system for 15-day global weather forecast[EB/OL].[2023-11-27].http://arxiv.org/abs/2306.12873.pdf.

Curcic M,2019.A parallel Fortran framework for neural networks and deep learning[J].SIGPLAN Fortran Forum,38(1):4-21.doi:10.1145/3323057.3323059.

Delworth T L,Cooke W F,Adcroft A,et al.,2020.SPEAR:the next generation GFDL modeling system for seasonal to multidecadal prediction and projection[J].J Adv Model Earth Syst,12(3):e2019MS001895.doi:10.1029/2019ms001895.

Espeholt L,Agrawal S,Snderby C,et al.,2022.Deep learning for twelve hour precipitation forecasts[J].Nat Commun,13(1):5145.doi:10.1038/s41467-022-32483-x.

Eyring V,Bony S,Meehl G A,et al.,2016.Overview of the Coupled Model Intercomparison Project Phase 6 (CMIP6) experimental design and organization[J].Geosci Model Dev,9(5):1937-1958.doi:10.5194/gmd-9-1937-2016.

Guibas J,Mardani M,Li Z Y,et al.,2021.Adaptive Fourier neural operators:efficient token mixers for transformers[EB/OL].[2023-11-27].http://arxiv.org/abs/2111.13587.pdf.

Han Y L,Zhang G J,Huang X M,et al.,2020.A moist physics parameterization based on deep learning[J].J Adv Model Earth Syst,12(9):e2020MS002076.doi:10.1029/2020ms002076.

He K M,Chen X L,Xie S N,et al.,2022.Masked autoencoders are scalable vision learners[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).New Orleans,LA,USA,IEEE:15979-15988.doi:10.1109/CVPR52688.2022.01553.

Hurrell J W,Holland M M,Gent P R,et al.,2013.The community earth system model:a framework for collaborative research[J].Bull Amer Meteor Soc,94(9):1339-1360.doi:10.1175/bams-d-12-00121.1.

Innes M,Edelman A,Fischer K,et al.,2019.A differentiable programming system to bridge machine learning and scientific computing[EB/OL].[2023-11-27].http://arxiv.org/abs/1907.07587.pdf.

IPCC,2021.Climate change 2021:the physical science basis[R].Cambridge,United Kingdom and New York,NY,USA:Cambridge University Press:2087-2138.doi:10.1017/9781009157896.

Keisler R,2022.Forecasting global weather with graph neural networks[EB/OL].[2023-11-27].http://arxiv.org/abs/2202.07575.pdf.

Ko J,Lee K,Hwang H,et al.,2022.Effective training strategies for deep-learning-based precipitation nowcasting and estimation[J].Comput Geosci,161:105072.doi:10.1016/j.cageo.2022.105072.

Kovachki N,Li Z Y,Liu B,et al.,2021.Neural operator:learning maps between function spaces[EB/OL].[2023-11-27].http://arxiv.org/abs/2108.08481.pdf.

Lam R,Sanchez-Gonzalez A,Willson M,et al.,2023.Learning skillful medium-range global weather forecasting[J].Science:eadi2336.doi:10.1126/science.adi2336.

Li X H,Zhang Y,Peng X D,et al.,2022.Improved climate simulation by using a double-plume convection scheme in a global model[J].JGR Atmospheres,127(11):e2021JD036069.doi:10.1029/2021jd036069.

Li Y,Sun Y,Wang W W,et al.,2023.U-shaped transformer with frequency-band aware attention for speech enhancement[J].IEEE/ACM Trans Audio Speech Lang Process,31:1511-1521.doi:10.1109/TASLP.2023.3265839.

Liu Z,Lin Y,Cao Y,et al.,2021.Swin Transformer:hierarchical Vision Transformer using Shifted Windows[C/OL]//IEEE/CVF International Conference on Computer Vision (ICCV).Montreal,QC,Canada:IEEE:9992-10002.[2023-12-05].https://ieeexplore.ieee.org/document/9710580/.

Mu B,Chen L,Yuan S J,et al.,2023.A radiative transfer deep learning model coupled into WRF with a generic fortran torch adaptor[J].Front Earth Sci,11:1149566.doi:10.3389/feart.2023.1149566.

Mooers G,Pritchard M,Beucler T,et al.,2021.Assessing the potential of deep learning for emulating cloud superparameterization in climate models with real geography boundary conditions[J].J Adv Model Earth Syst,13(5):e2020MS002385.doi:10.1029/2020MS002385.

Nguyen T,Brandstetter J,Kapoor A,et al.,2023.ClimaX:a foundation model for weather and climate[EB/OL].[2023-11-27].http://arxiv.org/abs/2301.10343.pdf.

Ott J,Pritchard M,Best N,et al.,2020.A fortran-keras deep learning bridge for scientific computing[J].Sci Program,2020:8888811.doi:10.1155/2020/8888811.

Pathak J,Subramanian S,Harrington P,et al.,2022.FourCastNet:a global data-driven high-resolution weather model using adaptive fourier neural operators[EB/OL].[2023-11-27].http://arxiv.org/abs/2202.11214.pdf.

Randall D A,Bitz C M,Danabasoglu G,et al.,2019.100 years of earth system model development[J].Meteorol Monogr,59:12.1-12.66.doi:10.1175/amsmonographs-d-18-0018.1.

Rasp S,Dueben P D,Scher S,et al.,2020.WeatherBench:a benchmark data set for data-driven weather forecasting[J].J Adv Model Earth Syst,12(11):e2020MS002203.doi:10.1029/2020ms002203.

Rasp S,Pritchard M S,Gentine P,2018.Deep learning to represent subgrid processes in climate models[J].Proc Natl Acad Sci USA,115(39):9684-9689.doi:10.1073/pnas.1810286115.

Ravuri S,Lenc K,Willson M,et al.,2021.Skilful precipitation nowcasting using deep generative models of radar[J].Nature,597(7878):672-677.doi:10.1038/s41586-021-03854-z.

Reichstein M,Camps-Valls G,Stevens B,et al.,2019.Deep learning and process understanding for data-driven Earth system science[J].Nature,566(7743):195-204.doi:10.1038/s41586-019-0912-1.

Ren H L,Bao Q,Zhou C G,et al.,2023.Seamless prediction in China:a review[J].Adv Atmos Sci,40(8):1501-1520.doi:10.1007/s00376-023-2335-z.

Ruti P M,Tarasova O,Keller J H,et al.,2020.Advancing research for seamless earth system prediction[J].Bull Amer Meteor Soc,101(1):E23-E35.doi:10.1175/bams-d-17-0302.1.

Skamarock W C,Klemp J B,Dudhia J,et al.,2008.A description of the advanced research WRF version 3[J].NCAR technical note,475:113.doi:10.5065/D68S4MVH.

Sokolov A,Kicklighter D,Schlosser A,et al.,2018.Description and evaluation of the MIT Earth System Model (MESM)[J].J Adv Model Earth Syst,10(8):1759-1789.doi:10.1029/2018ms001277.

Snderby C K,Espeholt L,Heek J,et al.,2020.MetNet:a neural weather model for precipitation forecasting[EB/OL].[2023-11-27].http://arxiv.org/abs/2003.12140.pdf.

Stevens B,Satoh M,Auger L,et al.,2019.DYAMOND:the dynamics of the atmospheric general circulation modeled on non-hydrostatic domains[J].Prog Earth Planet Sci,6(1):61.doi:10.1186/s40645-019-0304-z.[LinkOut]

王斌,周天军,俞永强,等,2008.地球系統模式发展展望[J].气象学报,66(6):857-869. Wang B,Zhou T J,Yu Y Q,et al.,2008.A perspective on earth system model development[J].Acta Meteorol Sin,66(6):857-869.doi:10.3321/j.issn:0577-6619.2008.06.002.(in Chinese).

王会军,朱江,浦一芬,2014.地球系统科学模拟有关重大问题[J].中国科学:物理学 力学 天文学,44(10):1116-1126. Wang H J,Zhu J,Pu Y F,2014.The earth system simulation[J].Sci Sin Phys Mech Astron,44(10):1116-1126.doi:10.1360/SSPMA2014-00155.(in Chinese).

王飞跃,缪青海,2023.人工智能驱动的科学研究新范式:从AI4S到智能科学[J].中国科学院院刊,38(4):536-540. Wang F Y,Miao Q H,2023.Novel paradigm for AI-driven scientific research:from AI4S to intelligent science[J].Bull Chin Acad Sci,38(4):536-540.doi:10.16418/j.issn.1000-3045.20230406002.(in Chinese).

Wang W,2022.Forecasting convection with a “scale-aware” tiedtke cumulus parameterization scheme at kilometer scales[J].Wea Forecasting,37(8):1491-1507.doi:10.1175/waf-d-21-0179.1.

Wang X,Han Y L,Xue W,et al.,2022.Stable climate simulations using a realistic general circulation model with neural network parameterizations for atmospheric moist physics and radiation processes[J].Geosci Model Dev,15(9):3923-3940.doi:10.5194/gmd-15-3923-2022.

Wen G G,Li Z Y,Azizzadenesheli K,et al.,2022.U-FNO:an enhanced Fourier neural operator-based deep-learning model for multiphase flow[J].Adv Water Resour,163:104180.doi:10.1016/j.advwatres.2022.104180.

Wu T W,Lu Y X,Fang Y J,et al.,2019.The Beijing Climate Center Climate System Model (BCC-CSM):the main progress from CMIP5 to CMIP6[J].Geosci Model Dev,12(4):1573-1600.doi:10.5194/gmd-12-1573-2019.

Xiong W,Xiang Y F,Wu H,et al.,2023.AI-GOMS:large AI-driven global ocean modeling system[EB/OL].[2023-11-27].http://arxiv.org/abs/2308.03152.pdf.

Yang S L,Dong W J,Chou J M,et al.,2015.A brief introduction to BNU-HESM1.0 and its earth surface temperature simulations[J].Adv Atmos Sci,32(12):1683-1688.doi:10.1007/s00376-015-5050-6.

Zhang Y C,Long M S,Chen K Y,et al.,2023.Skilful nowcasting of extreme precipitation with NowcastNet[J].Nature,619(7970):526-532.doi:10.1038/s41586-023-06184-4.

Zhou T J,Chen Z M,Zou L W,et al.,2020.Development of climate and earth system models in China:past achievements and new CMIP6 results[J].J Meteor Res,34(1):1-19.doi:10.1007/s13351-020-9164-0.

Zhou W,Li J X,Yan Z X,et al.,2023.Progress and future prospects of decadal prediction and data assimilation:a review[J].Atmos Ocean Sci Lett:100441.doi:10.1016/j.aosl.2023.100441.

·ARTICLE·

Research on international developments of AI large meteorological models in numerical forecasting

HUANG Xiaomeng1,LIN Yanluan1,XIONG Wei1,LI Jiahao1,PAN Jiancheng2,ZHOU Yong3

1Department of Earth System Science,Tsinghua University,Beijing 100084,China;

2School of Computer Science and Technology,Zhejiang University of Technology,Hangzhou 310023,China;

3Meteorological Development and Planning Institute,China Meteorological Administration,Beijing 100081,China

Abstract Earth System Models (ESM) are powerful tools for studying the earth system and play an indispensable role in conducting scientific research on disaster prevention and mitigation,climate change,and environmental governance.Traditional weather and climate models rapidly evolve towards ESM,including ocean,sea ice,biogeochemical,and atmospheric chemical processes.At the same time,an increasing number of applications are adopting ESM for weather,climate,and ecological prediction.The current international mainstream trend in developing numerical models is to achieve seamless simulation and prediction by constructing integrated models,simultaneously meeting the needs of weather-climate forecasts and predictions at varying temporal and spatial scales.With improved model complexity and resolution,traditional numerical weather models have rapidly progressed in climate change research and climate prediction.However,challenges remain regarding data assimilation,ensemble coupling,high-performance computing,and uncertainty analysis and evaluation.The combination of artificial intelligence (AI) and meteorology has recently attracted tremendous attention.Based on various deep learning architectures,deep learning models can be trained using powerful computing resources and massive data for weather forecasts in a new scientific paradigm independent of traditional numerical weather models.Some technology companies,such as Huawei,NVIDIA,DeepMind,Google,Microsoft,etc.,as well as domestic and international universities such as Tsinghua University,Fudan University,the University of Michigan,Rice University,etc.,have released several Large Weather Models (LWMs) covering from nowcasting,short-term forecast to medium-term forecast,and even extended-period forecast.For instance,FourCastNet,GraphCast,NowcastNet,Pangu Weather,Fengwu,Fuxi,etc.,show significant advantages and great potential in improving forecast accuracy and accelerating the forecast inference process.For accuracy,except in areas like extreme weather,LWMs have matched or even surpassed that of traditional numerical models.Moreover,with continuous development of deep learning methods,their forecasting precision is steadily increasing.For timeliness,LWMs,leveraging deep neural networks' powerful generalization capabilities,far exceed traditional numerical models' predictive abilities under the same resolution conditions.For computational speed,LWMs have significantly increased inference computation speed compared to traditional numerical models,gradually reduced the enormous computation times required by traditional numerical models.The emergence of LWMs signifies that the cross-fertilization between AI and meteorological fields has reached a new horizon.Although these LWMs have made significant breakthroughs at this stage,their development still faces many challenges,such as the interpretability problem,the generalization and migration challenge,and the over-smoothing problem.The advancement of numerical weather prediction is closely tied to developments in computational and data storage technology,as well as observational techniques.Its application requires interdisciplinary integration,combining insights from various scientific fields.A critical scientific challenge in this field is to foster a more profound integration of numerical weather prediction with emerging information technologies such as artificial intelligence,quantum computing,and digital twins.This challenge also involves tailoring complex and refined component models to meet diverse disciplinary demands and societal needs.Advancing numerical weather prediction within the broader context of earth system science requires a concerted effort to promote cross-disciplinary collaboration,addressing vital scientific questions at the intersection of multiple fields.

Keywords numerical forecasting;Earth System Models;deep learning;large weather models

doi:10.13878/j.cnki.dqkxxb.20231201001

(責任编辑:张福颖)

猜你喜欢
天气预报分辨率气象
气象树
《内蒙古气象》征稿简则
EM算法的参数分辨率
原生VS最大那些混淆视听的“分辨率”概念
测不准的天气预报
天气预报的前世今生
大国气象
美丽的气象奇观
基于深度特征学习的图像超分辨率重建
一种改进的基于边缘加强超分辨率算法