专门支持科学计算等领域研究的超级计算机Perlmutter

科技   2024-09-23 09:45   北京  

本篇为《全球领先超级计算机品牌介绍系列》的第11篇。通过本文,您可看到该超算品牌的发展历史、技术架构、所获奖项、应用案例、研发机构背景等全面信息。


《全球领先超级计算机品牌介绍系列》以往文章

  1. 世界最快的超级计算机:美国前沿(Frontier)

  2. 全球第一台性能超过十亿亿次的计算机:神威·太湖之光

  3. 生物计算界算的最快:安腾超级计算机(Anton)

  4. 曾六次蝉联世界最快的超级计算机:天河二号

  5. 为超越神威·太湖之光而生:美国超级计算机顶点(Summit)

  6. 欧洲第一台百万兆级计算机:莱昂纳多(Leonardo)

  7. 日本算得最快的超级计算机:富岳(Fugaku)

  8. 欧洲最快的超级计算机:LUMI

  9. 英伟达用3周构建的、世界第九快的超级计算机Selene

  10. 旨在为美国政府安全领域服务的超级计算机:山脊(Sierra)



特别支持物理学领域研究的

超级计算机Perlmutter



01

发展历程

Development History


第一阶段:在2021年初开始安装,会有12个GPU加速机柜,可容纳1536个节点,35PB全闪存存储,具有5TB/s的数据传输速度。每个节点都有一个AMD EPYC 7763处理器,以及256GB内存和四个通过NVLink连接的Nvidia A100 40GB GPU。在这个时期,Perlmutter可以提供60 PetaFLOPS的FP64性能,或3.823 ExaFLOPS的FP16性能。这样的性能足够让Perlmutter进入世界超算系统排名前十的位置。


第二阶段:在2021年稍晚的时候开始,将增加12个CPU机柜,采用纯CPU节点,总共有3072个节点,都使用AMD EPYC 7763处理器。每个节点拥有512GB内存,其FP64性能达到了120 PetaFLOPS左右。



02

技术架构

Technical Architecture


硬件层面


计算节点


  • CPU:每个计算节点配备了AMD EPYC处理器,这些处理器基于Zen 3架构,具有高性能核心和高带宽内存接口。


  • GPU:每个节点还包含多个NVIDIA A100 Tensor Core GPU加速器,这些GPU基于Ampere架构,提供卓越的浮点运算和AI加速能力。


内存与存储


  • 内存配置:每个节点配备256GB DDR内存。,在某些配置中,每个节点拥有512GB内存。


  • 存储:Perlmutter采用了多层存储架构,包括高速NVMe固态硬盘和大规模并行文件系统,如Lustre,以支持大数据集的高效读写操作。


网络与能耗


  • 互联技术:使用Cray Slingshot互连技术,这是一种低延迟、高带宽的网络架构,专门设计用于超级计算环境,以确保计算节点间的数据传输速度和效率。


  • 液冷技术:Perlmutter采用了高效的液体冷却解决方案,以保持系统的稳定运行和降低能耗。


软件层面


编译器与开发工具


Perlmutter提供了多种编译器,包括CCE、GNU和LLVM编译器。


用户可以通过“programming environment”模块选择所需的编译器,并使用CC(针对C++)或cc命令进行编译,这些命令会自动调用编译器并启用一些特定的优化标志,如-march=native。



03

所获奖项

Awards


2021年11月,Perlmutter获得TOP500排行榜第5名。


2022年6月,Perlmutter获得TOP500排行榜第7名。


2022年11月,Perlmutter获得TOP500排行榜第8名。


2023年6月,Perlmutter获得TOP500排行榜第8名。



04

应用案例

Scenarios


拼接宇宙 3D 地图


Perlmutter 系统通过处理来自 DESI 的数据,协助研究人员绘制跨越 110 亿光年的可见宇宙图。在过去,研究人员的工作流程需要几周甚至是几个月的时间,但 Perlmutter 将能够在短短几天内完成任务。在早期的基准测试中,NERSC 研究人员也曾报告说,使用 GPU 的性能加速提高了 20 倍,这将使他们的工作流程缩短到几个小时。



05

研究机构介绍

Introduction to  Institutions


历史背景


成立于1931年,最初名为“劳伦斯辐射实验室”(Lawrence Radiation Laboratory),由诺贝尔物理学奖得主欧内斯特·奥兰多·劳伦斯(Ernest Orlando Lawrence)创建。


实验室的创建初衷是为了进行基础物理学研究,尤其是与粒子加速器相关的研究,劳伦斯发明的回旋加速器就是在这里得到发展和应用的。在第二次世界大战期间,实验室参与了曼哈顿计划,对原子弹的研制做出了重大贡献。


1971年,实验室正式更名为劳伦斯伯克利实验室(Lawrence Berkeley Laboratory)。


1994年,再次改名为劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)。


组织架构与管理


LBNL隶属于美国能源部(DOE),由美国能源部直接资助和支持。


实验室的具体运行由加州大学(UC)系统管理,主要是在加州大学伯克利分校(UC Berkeley)的监督下运作。


研究领域


LBNL的研究覆盖了广泛的学科,包括基础物理学、化学、材料科学、生物学、环境科学、地球科学、能源科学和技术、计算科学等。


实验室拥有多个研究中心和设施,比如先进光源(Advanced Light Source, ALS)、分子铸造厂(Molecular Foundry)、国家能源研究科学计算中心(NERSC)等。


NERSC与Perlmutter


NERSC是LBNL的一部分,专注于为美国能源部和科学界提供高性能计算资源。


Perlmutter超级计算机是NERSC的旗舰系统,专门为支持科学计算、大数据分析和人工智能应用而设计。


Perlmutter的建造和运行代表了LBNL在推动计算科学前沿方面的重要角色。


社会贡献与影响


LBNL及其研究人员对科学界有着深远的影响,实验室的科学家们已经获得了13项诺贝尔奖。


实验室致力于将基础研究转化为实际应用,推动科技创新和经济发展。



06

更多阅读

Learn More


关于超级计算机Perlmutter的相关论文、资讯以及更多参考资料,可前往超算百科官网查看:https://www.chaosuanwiki.com/addons/cms/archives/index2/diyname/te-bie-zhi-chi-wu-li-xue-ling-yu-yan-jiu-de-chao-ji-ji-suan-ji-Perlmutter



THE END


扫码关注我们

超算百科

一站式超级计算机知识分享平台

www.chaosuanwiki.com

超算百科
超算百科,致力于打造一站式超级计算机知识分享平台,为学术研究者、行业专业人士、科技爱好者以及广大公众提供关于超级计算机的前沿资讯、技术发展、领先品牌介绍、应用案例等丰富内容。
 最新文章