ORNL:Frontier用户百亿亿级气候仿真器入围戈登·贝尔气候奖
“2024年10月31日 —— 由沙特阿拉伯阿卜杜拉国王科技大学(KAUST)领导的多机构研究团队,因其在气候建模领域的卓越贡献,被提名为2024年计算机协会戈登·贝尔气候奖。该团队开发了一款极量级气候仿真器,该仿真器具有显著提高的分辨率,但无需承担最先进的气候模型所需的计算成本和数据存储需求。
”
美国能源部(DOE)位于橡树岭国家实验室(ORNL)的Frontier超级计算机系统已被列为世界上最快的计算机,同时也成为第一个突破exascale性能障碍的计算机,即每秒五百万次计算的门槛。
这是自2022年以来KAUST研究人员第四次被提名戈登·贝尔奖。团队成员还包括来自国家大气研究中心、圣母大学、NVIDIA、圣路易斯大学和拉合尔管理科学大学的研究人员。
获奖者将在11月17日至22日于乔治亚州亚特兰大举行的年度超级计算会议上宣布。
“气候模型极其复杂,即使在最快的超级计算机上运行也需要数周或数月。它们产生的数据量巨大,几乎无法存储,随着气候科学家不断追求更高的分辨率,这成为了一个越来越大的问题,” KAUST的统计学Al-Khwarizmi杰出教授Marc Genton说。Genton近十年来一直在设计仿真器的算法。
“气候仿真器解决了两个问题:加快计算速度和减少存储需求,” Genton补充道。“它旨在按需模拟模型输出,而无需存储PB级数据。我们不需要保存每一个结果,只需要存储仿真器代码和必要的参数,原则上,这使我们能够在需要时生成无限数量的仿真。”
地球系统模型(ESM)是用于计算大气、海洋、陆地和冰盖变化的超级计算机程序。这些模拟基于可量化的物理定律,是就复杂性、功耗和处理时间而言,执行起来计算要求最高的计算之一。尽管如此,ESM是预测气候变化影响的基本工具。
“如今,典型的全球气候模型的分辨率可达25公里,这很好,但如果你想了解一个小城市的风况和风暴观测,例如,你需要更大的空间和时间分辨率,” Genton说。“因此,我们所做的是拟合一个统计模型,该模型在没有物理定律的情况下复制信息,以基本模仿ESM的输出。”
少即是多
通过利用最新的图形处理单元(GPU)硬件和混合精度算术的最新进展,该团队的气候仿真器提供了3.5公里(约2.2英里)的显著分辨率,并能够复制从天到小时的时间尺度上的局部条件。
混合精度是一种计算技术,使用双精度、单精度和半精度。这种技术涉及计算双精度15到17位小数,单精度6到9位小数,半精度3到4位小数。双精度是最准确的,但也是三种精度中计算要求最高的。
“使用混合精度来提高性能是该领域的一项创新,也有助于我们保持仿真器的准确性,” KAUST的高性能计算研究科学家Sameh Abdulah说,他也是该团队最新研究的第一作者。
“并非模拟中的每个元素都需要用双精度计算。例如,如果外面的温度是75度,就没有必要计算15到17位小数点后的温度来告诉你是否需要带夹克,” Abdulah补充道。“混合精度允许我们根据最重要的元素优先考虑准确性,这反过来加快了整体计算。”
仿真器使用球谐变换方法,将温度、风和压力等元素转换为简单的频率或波形模式,以更容易地描述它们在全球超过5400万地点随时间的变化。
该团队在过去四年中一直在研究气候仿真器。这项工作集中在开发算法和优化代码,以在具有各种架构的超级计算机上高效运行。
仿真器具有高度的可扩展性,并在包括橡树岭领导计算设施的前沿和顶峰超级计算机在内的世界前10大最强大的超级计算机中的四台上展示了卓越的性能。OLCF是美国能源部科学办公室的用户设施,位于能源部橡树岭国家实验室(ORNL)。
目前排名第一的HPE Cray Frontier超级计算机是极量级HPE Cray Frontier超级计算机,其时钟速度为每秒0.976 exaflops,同时利用超过9025个前沿节点和超过36,000个AMD Instinct GPU。
在IBM Summit超级计算机上进行的模拟,目前排名第9,在TOP500超级计算机列表上,使用了3072个节点——大约是机器的67%——和18,432个NVIDIA V100 GPU,以降低精度实现了每秒0.375 exaflops的速度。一exaflop等于一千万亿次,或每秒十亿亿次计算。
仿真器在瑞士卢加诺的瑞士国家超级计算中心排名第6的Alps超级计算机上,以及在意大利博洛尼亚的CINECA数据中心排名第7的Leonardo超级计算机上也表现良好。该团队还广泛使用了KAUST的Shaheen III,排名第23,是中东最大和最强大的超级计算机。
“可持续计算是另一个优势。更快地得到答案意味着更少的存储,这也意味着节省能源,” Genton说。“超级计算需要大量的能源。通过混合精度,我们减少了运行所需的时间,通过从机器中获得更多,使气候研究更具可持续性。”
据Abdula说,团队下一步想要做的是直接的:“赢得奖项。”
除了Genton和Abdula,被提名者名单还包括David Keyes、Hatem Ltaief、Yan Song、Gera Stenchikov和Ying Sun(KAUST);Zubair Khalid(KAUST和拉合尔管理科学大学);Allison Baker(NCAR);George Bosilca(NVIDIA);Qinglei Cao(圣路易斯大学);和Stefano Castruccio(圣母大学)。
UT-Battelle为美国能源部科学办公室管理ORNL,该办公室是美国物理科学基础研究的最大支持者。科学办公室正在努力解决我们时代一些最紧迫的挑战。
参考来源:Jeremy Rumsey, ORNL
扩展
今年入围决赛选手:
Boosting Earth System Model Outputs and Saving PetaBytes in Their Storage Using Exascale Climate Emulators
ORBIT: Oak Ridge Base Foundation Model for Earth System Predictability
A Performance-Portable Kilometer-Scale Global Ocean Model on ORISE and New Sunway Heterogeneous Supercomputers
声明:本公众号分享的资源均来自于互联网的公开资源,仅供个人学习和研究使用,不代表本人对其版权、真实性、合法性、准确性等方面做出任何保证。任何使用本号分享的资源的个人或组织,需自行承担相应的法律责任和后果;本号不承担任何法律责任和连带责任。使用本号分享的资源即代表您已完全了解并同意本免责声明的所有内容。