2024年11月8日,2024中国数据与存储峰会即将在北京新云南皇冠假日酒店举办,届时,焱融科技将介绍如何用分布式全闪存储加速企业AI转型的话题。
不久前,焱融科技凭借F9000X,在权威测试中证明了自己作为AI存储的出众优势,也非常期待焱融科技能介绍关于此次测试的更多细节。
9月25日,在MLCommons公布的MLPerf v1.0 存储性能基准测试中,焱融科技全闪分布式一体机F9000X 有出色表现,在3D-Unet、ResNet50和CosmoFlow三种 AI 深度学习模型的评估中均有出众的表现。
测试结果显示,在带宽、模拟 GPU 数量以及 GPU 利用率等关键性能指标上,焱融科技F9000X 获得了多项世界第一,这表明焱融高性能存储具备支持各种 AI 模型训练和高性能计算场景的能力。
MLPerf 是国际权威 AI 性能基准测试,被誉为全球 AI 领域的“奥运会”。MLCommons 组织在 2023 年首次推出了 MLPerf 存储基准测试,是首个也是目前唯一一个开源、公开透明的 AI/ML 基准测试,可以评估存储系统在 ML/AI 工作负载中的表现。
作为国内唯一全面参与所有模型测试的厂商,焱融科技拿出了最新发布的 F9000X 全闪分布式一体机产品,节点搭载英特尔至强第 5 代可扩展处理器,SSD采用 10 块 Memblaze的盘,配备了英伟达ConnectX-7 400Gb NDR 网卡。
这些测试包括 3D-Unet、CosmoFlow 和 ResNet 50。在本次测试环节,焱融追光全闪存储一体机 F9000X 不仅能够处理大规模的数据集,还可以根据 AI 集群规模弹性扩展,完美匹配 GPU 算力性能。
测试中,单个计算节点可运行多个ACC(模拟的GPU 加速器),支持的ACC 数越多,则代表计算能力越强,对存储性能的要求也更高。测试显示,焱融在所有三个模型的测试中,能够支撑的每节点平均 ACC 数量和存储带宽性能均排第一。
测试中,焱融全闪存储一体机 F9000X可随着ACC数量的增加,让带宽性能保持明显的线性增长。此外,存储的可用性(AU加速器利用率)也始终保持在测试基准要求的范围内,确保了训练过程的高效和稳定。
在3D-Unet模型应用的测试中,使用了3个计算节点,共60个ACC,最后达到了 160GB/s的带宽性能。然而,F9000X 3 节点存储集群实测最大可以达到 260GB/s 以上,这表明它并没有发挥全部实力,还能带更多的GPU计算节点。
可以说,焱融科技全闪分布式一体机F9000X凭借超强的性能表现,可以充分满足AI对于存储提出的苛刻要求,可以作为AI场景的理想选择。
想要在MLCommons公布的MLPerf v1.0 存储性能基准测试取得优异表现并不容易,想要了解关于F9000X 这款产品,以及这次基准测试里的更多细节,欢迎关注我们于11月8日举办的2024中国数据与存储峰会——高端存储与分布式全闪创新论坛。
END
查看活动详情