Western Digital Ultrastar® DC SN861 SSD旨在满足超大规模数据中心和企业环境的高性能需求,SN861支持PCIe Gen5接口,并提供各种外形尺寸,包括U.2和E1.S,使其能够适应多种部署环境。不过,SN861不只是有不同的外形尺寸那么简单,Western Digital明智地设计了SN861功能,以符合其目标市场。
与上一代 SN655 相比,Gen5接口使SN861的性能立即得到提升,新SSD的优势更加明显,具有灵活数据放置(FDP)等功能和E1.S外形尺寸,FDP减少了写入放大并优化了数据放置。SN861包括高级安全功能,例如端到端数据保护、AES-XTS加密和TCG OPAL 2.01。SN861控制器还有助于降低SSD的功耗,空闲时平均功耗低于5瓦。此外,该SSD还支持NVMe 2.0和OCP Cloud Spec 2.0 等多种标准。
Western Digital每一代SSD更新都包括一次重大的性能提升,SN861也不例外。SN861提供高达13,700MB/s的顺序读取速度和高达330万的随机读取IOPS,这对于AI/ML和大数据分析等应用程序至关重要。SN861的两个版本在运行期间平均功耗20瓦,空闲时平均功耗不到5瓦。功率是可调的,因此调整SSD的功率配置文件以匹配预期的工作负载很容易,例如,超大规模企业经常使E1.S SSD在低得多的功率状态下运行。
虽然SN861的两种外形尺寸在设计上非常相似,但Western Digital已针对特定工作负载调整了每个SSD。E1.S 版本意味着支持FDP等功能,并针对云工作负载进行了性能调整。U.2 SSD将进入高性能企业工作负载,毫无疑问,这些工作负载(如AI)可以从SSD性能的大幅提升中受益。
1. EDSFF和FDP
FDP通过优化CacheLib等工作负载中的SSD性能和可靠性,为Meta等互联网厂商提供了显著的好处。FDP降低了写入放大因子(WAF),从而提高了写入速度并延长了SSD的使用寿命,这对于处理海量数据处理任务至关重要。
FDP通过智能地对相似数据进行分组来增强数据组织,最大限度地减少过度配置,并减少对密集垃圾收集的需求。FDP还支持多个命名空间,确保在不同工作负载中保持一致的性能,这种优化提高了应用程序的性能和耐用性,并显著降低了大规模存储基础设施的总拥有成本(TCO)。
在E1.S中支持FDP,SN861的E1. S版本已准备好满足超大规模用户的需求,E1.S版本的SSD需要满足超大规模数据中心的性能要求,特别是读取性能的QoS。
2. U.2
U.2 SN861是大多数企业会采用的SSD,我们对SSD进行了一系列测试,以衡量我们标准测试套件的整体性能。
Western Digital Ultrastar DC SN861 SSD规格
1.60T | 1.92T | 3.20T | 3.84T | 6.40T | 7.68T | |
寿命 | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD |
安全 | SE、ISE、TCG OPAL 2.01 | |||||
外形尺寸 | U.2 | |||||
接口 | PCIe Gen5x4 | |||||
NVMe规格 | NVMe v2.0 | |||||
性能(预计) | 1.60T | 1.92T | 3.20T | 3.84T | 6.40T | 7.68T |
读取吞吐量(最大MB/s,序列 128KiB) | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 |
写入吞吐量(最大GB/s,序列 256KiB) | 3,600 | 3,600 | 7,200 | 7,200 | 7,500 | 7,500 |
读取IOPS(最大,Rnd 4KiB) | 2,100K | 2,100K | 3,300K | 3,300K | 3,300K | 3,300K |
写入IOPS(最大,Rnd 4KiB) | 350K | 165K | 665K | 330K | 800K | 430K |
读取延迟(μS) | 65 | 65 | 65 | 65 | 65 | 65 |
写入延迟(μS) | 8 | 8 | 8 | 8 | 8 | 8 |
可靠性 | ||||||
MTTF(小时,预计) | 2.5M | |||||
不可纠正误码率(UBER) | 1/1017 | |||||
年化故障率(AFR,预计值) | 0.35% | |||||
有限保修(年) | 5年 | |||||
电源管理 | ||||||
DC,+/- 10% | +12V | |||||
操作模式(平均、最大) | <20W | |||||
空闲(平均) | <5W | |||||
物理尺寸 | ||||||
Z高度(mm) | 15毫米 | |||||
尺寸(宽x长,mm) | 69.85毫米x 100.45毫米 | |||||
环境 | ||||||
工作温度(环境温度) | 0°C至70°C | |||||
非工作温度 | -40°C至85°C |
为了测试此次使用的企业级NVMe Gen5 SSD的性能,我们利用fio测试套件用于四角性能工作负载,利用Vdbench测试混合工作负载。我们利用的fio脚本包是一个自动化脚本,我们使用它来执行峰值带宽的256K顺序读写测试和峰值吞吐量的4K随机读写测试。
峰值吞吐量和带宽 | 西部数据SN861 7.68TB | 铠侠CM7-R 7.68TB | 三星PM1743 7.68TB | 三星PM9A3 7.68TB |
256K顺序读取(1T/64Q) | 13,283MB/s | 12,092MB/s | 14,495MB/s | 6,751MB/s |
256K顺序写入(1T/64Q) | 7,696MB/s | 5,796MB/s | 6,052MB/s | 4,055MB/s |
4K随机读取(8T/32Q) | 2,108,065IOPS | 1,963,066IOPS | 1,900,838IOPS | 1,068,508IOPS |
4K随机写入(8T/32Q) | 473,658IOPS | 301,061IOPS | 319,758IOPS | 206,660IOPS |
当我们查看Western Digital SN861的顶级性能数据时,它充分利用了Gen5接口。在顺序读取中,它的测量值为13.3GB/s,与三星PM1743的14.5GB/s相比排在第二位。在顺序写入中,SN861排在第一位,横扫其他两款Gen5型号,速度为7.7GB/s,三星PM1743的速度为6.1GB/s,紧随其后。
随机4K读取性能明显强劲,为2.11M IOPS,铠侠CM7-R为1.96M IOPS。随机4K写入性能, SN861以474K IOPS的速度排名第一,三星PM1743的320K IOPS是最接近的型号。在我们的四角性能工作负载中,SN861在四项测试的三项中获得了最高数字。
为了测试SN861 Gen5 SSD,我们在测试实验室中使用了Dell PowerEdge R760。它是一款高度通用的 2U机架式服务器,支持两个第4代Intel Xeon处理器,并具有支持多达24个NVMe SSD的配置。此服务器适用于混合工作负载、数据库和VDI。应该注意的是,我们在本次评测中测试的CM7-R版本来自具有戴尔固件构建的戴尔服务器,此驱动器在使用铠侠的固件时性能可能有所不同。
双Intel® Xeon® Gold 6430(32 核/64 线程,1.9GHz 基础) 1TB DDR5内存
Ubuntu 22.04
为了获得最大的灵活性,我们还与Serial Cables合作,他们为我们提供了用于U.2/U.3、M.2和EDSFF SSD测试的8插槽PCIe Gen5 JBOF。这使我们能够在同一测试硬件上测试所有当前和新的SSD型号。此外,还利用VDbench来比较我们在不同工作负载类型下的SSD的扩展性能。我们对这些基准测试的测试过程将数据填充整个SSD,然后对等于SSD容量的25%的部分进行分区,以模拟SSD如何响应应用程序工作负载。
16K顺序读取:100%读取,32线程,0-120% iorate 16K顺序写入:100%写入,16线程,0-120% iorate
4K、8K和16K 70R/30W随机混合,64线程,0-120% iorate
合成数据库:SQL和Oracle
VDI完整克隆
我们的第一个Vdbench测试测量了32线程负载下的顺序16K读取性能。在这里,SN861在98μs时的峰值吞吐量为325K IOPS和5.1GB/s,与铠侠CM7-R并驾齐驱,其测量值为329K IOPS。三星PM1743测得289K IOPS,作为参考,三星PM9A3 Gen4 SSD测得227K IOPS。
在16K顺序写工作负载下的性能上,SN861与其他U.2 PCIe Gen5 SSD相比具有强大的领先优势。SN861在78μs时测得的峰值为200K IOPS和3.1GB/s,领先于铠侠CM7-R和三星PM1743。与Gen4 SSD相比,所有SSD都大大领先于三星PM9A3,后者的IOPS为131K。
在70/30 R/W混合的随机传输测试中,第一个测试是4K块大小。在这里,我们发现SN861和铠侠CM7-R的性能非常相似,SN861在70μs时的测量值为903K IOPS,而CM7-R为881K IOPS。三星PM1743以521K IOPS的峰值速度落后,Gen4 PM9A3的峰值速度为396K IOPS。
在70/30 R/W 8K块大小随机测试中,SN861领先于KIOXA CM7-R,在93μs时峰值为682K IOPS,而CM7-R为599K IOPS。三星PM1743以414K IOPS落后,而Gen4 PM9A3为301K IOPS。
在70/30 R/W 16K块大小随机测试中。SN861继续保持其领先地位,在143μs时测得434K IOPS的峰值,CM7-R为337K IOPS,三星PM1743继续落后,为231K IOPS,而Gen4 PM9A3测得183K IOPS。
3. Western Digital SN861和AI
与本报告中的SN861类似,我们还一直在Western Digital系统团队提供的OpenFlex™ Data24平台中使用上一代 Western Digital Ultrastar DC SN655。在FMS'24的演示中,我们展示了使用GPU服务器、Data24 NVMe-oF™平台和Gen4 SN655 SSD的AI演示。
我们对NVIDIA® IndeX®的测试侧重于利用其先进的可视化功能来处理高保真度的海量数据集。IndeX利用GPU加速提供3D数据的实时交互式可视化,这对于石油和天然气勘探、医学成像和科学研究等行业至关重要。
为了实现最佳性能,尤其是在GPU密集型环境中,必须确保GPU和存储之间的高速数据交换。例如,为了彻底饱和NVIDIA H100 GPU的带宽,我们需要实现大约64GB/s的吞吐量,这涉及使用高性能NVMe存储解决方案和NVIDIA GPUDirect™等技术。这种集成减少了延迟并最大限度地提高了数据吞吐量,确保了高效的GPU利用率,从而更快、更有效地处理大规模数据集。
当我们看到Gen4 SN655在6.8GB/s峰值速率下与SN861在13.7GB/s时可以执行的带宽差异时,很明显可以看到迁移到Gen5 SSD的优势。要使用上一代型号达到64GB/s,您需要10个SSD,而SN861只需 5个即可达到该目标。这种差异可能允许您增加SSD数量以获得额外的带宽或容量。
性能和容量对于存储根据AI和其他高级应用程序的需求进行扩展至关重要。在这方面,SN861提供的Gen5接口和相对于Gen4接口的整体性能提升非常引人注目,这意味着这些SSD可以在单个存储系统中支持更多GPU,并确保这些GPU以足够快的速率馈送,以确保GPU被充分利用。
4. 结论
SN861标志着Western Digital的重大飞跃,该SSD的尺寸规格可支持超大规模互联网厂商和企业客户,并具有E1.S中的 FDP等功能。不过,Gen5接口SSD最明显的好处,它提供了令人印象深刻的全方位性能。
SN861从一开始就提供了强大的性能,在我们最初的四角工作负载中占据了三个第一名,亮点包括 2.11M IOPS的随机4K读取性能和474K IOPS的随机4K写入性能。顺序读取性能13.3GB/s,仅次于三星PM1743,顺序写入7.7GB/s再次领先。
在VDbench工作负载中,主要关注混合工作负载或较小块大小的传输,SN861继续表现出色。我们在涵盖4K、8K和16K传输大小的70/30 R/W混合测试中测量了200K IOPS的强大的16K顺序写入速度和领先优势。
很明显,最新的Western Digital SN861 Gen5 SSD,正在影响业务结果,如果你需要证据,只需看看它对人工智能革命的影响,我们已经在测试中看到了这一点。AI系统需要快速存储来保持GPU满负荷运行,无论是在缓存中,如上面的NVIDIA IndeX示例,还是在共享存储阵列或GPU服务器中。Western Digital在将SN861定位为这些高级工作负载方面做得非常出色,同时还为超大规模互联网厂商提供支持 FDP的SKU。
来源:Western Digital SN861 Gen5 SSD: Versatile Solutions for Modern Hyperscale and Enterprise Needs - StorageReview.com