在评估 SSD 时,传统指标(例如顺序读写吞吐量以及随机读写 IOPS)通常是许多客户和系统供应商的首选基准。虽然这些指标对于某些比较案例很有用,但如今我们运行的工作负载相比过去更为重要,因此需要从不同的角度来看待存储设备。在这篇博客文章中,我们将会探讨其他指标,从而更全面地了解 SSD 性能,尤其是特定工作负载的性能。
每瓦 IOPS:效率非常重要
每瓦 IOPS 是经常被忽视的一个关键指标。该指标用来衡量 SSD 每消耗一瓦特功率可执行的每秒输入/输出操作数 (IOPS)。在能效至上的数据中心中,每瓦 IOPS 是一个关键因素。每瓦 IOPS 的值较高意味着 SSD 可以实现低功耗、高性能,从而显著节省电力费用和冷却成本。例如,在图形神经网络 (GNN) 训练工作负载中,美光 9550 SSD 的每瓦 IOPS 能效几乎可达到竞品的两倍。1
每太字节 IOPS:显著提升存储效率
另一个重要指标是“每太字节 IOPS”(IOPS/TB)。该指标非常适合用于比较固态硬盘 (SSD) 与近线硬盘的性能,后者虽然提供大容量存储,但往往性能不足。通过评估每太字节 IOPS,我们可以确定 SSD 处理 IOPS 时相对于其存储容量的效率。如果客户希望将多个机械硬盘整合到数量更少的 SSD 中,则这一点至关重要,可显著节省空间和运营成本。例如,美光 6500 ION SSD 的容量比 24TB HDD2 大 28%,而每太字节随机读取 IOPS 性能提升可达到惊人的 4,650 倍。
延迟和服务质量 (QoS):一致性和速度
延迟和服务质量 (QoS) 是会显著影响 SSD 性能的关键指标。延迟指标用来衡量处理和返回数据请求所需的时间,而 QoS 则用于描述 SSD 性能的一致性。对于需要实时数据处理的应用,例如在线事务处理 (OLTP) 和高频交易,低延迟非常重要。对于以“性能一致性”为关键的数据库和视频流等应用,高 QoS 至关重要,有助于确保 SSD 提供可预测的性能。例如,美光 7500 SSD 在混合随机工作负载下的延迟低于 1 毫秒,延迟水平的可靠性达到 6 个 9 (99.9999%),确保了可靠、及时的数据传输。在 RocksDB 等 QoS 敏感型应用中,美光 7500 可实现同类产品中出类拔萃的性能和 QoS。3
写入的太字节数:随时间变化的数据容量
每日驱动器写入次数 (DWPD) 衡量的是 SSD 在硬盘保修期内每天可以整盘写入的次数。DWPD 基于完全随机的工作负载进行衡量,代表了硬盘由于写放大 (WAF) 而导致的最糟糕情况。4 DWPD 针对临时数据不断更新的计算工作负载而制定,意味着硬盘在其终身寿命内始终以相同的速率进行工作。
然而,存储设备中的工作负载通常会随时间而变化。硬盘在其寿命早期会很快填满,但访问和写入量通常会随着时间而下降。在这些情况下,基于一致使用的 DWPD 与不规则使用模式不太匹配。DWPD 不适合用于高容量硬盘,因为特定工作负载会极大地影响硬盘可以支持的写入次数。
以美光 6500 ION 为例。在 30.72 TB 容量,0.3 DWPD 的额定值下,该硬盘可支持 5 年总写入量达到 16,819 TB。但是,由于许多客户是在顺序填充工作负载中使用这些硬盘,因此实际上该硬盘可以支持近 56,064 TB 的写入数据,是额定 DWPD 的三倍之多。
在需要高随机写入硬盘(例如,用于存储具有大量日志写入的 MySQL TempDB)时,有的客户会将大容量解决方案与高耐久性解决方案(例如美光 XTR)搭配使用。相比之下,高耐久性硬盘的容量较小(例如总容量为 1 或 2TB),但可以持续 5 年承受每天最多 35 次 100% 4K 随机硬盘写入。5
此外,我们发觉有些客户希望使用少量的大容量 SSD 来取代多个机械硬盘,以便集中于每年每 TB 的写入太字节数,这样可在针对不同总容量进行标准化的同时衡量硬盘的写入压力。
填充率:重建时间很重要
在职业生涯初期,我曾多年担任大型数据库的系统管理员。在此期间,我得到的一个教训是:硬盘会出现故障。问题不在于是否会发生故障,而在于何时发生,所以要为此做好计划。一个硬盘出现故障并不可怕,多个硬盘同时出现故障才让人头疼。管理员会设计冗余和故障转移机制,但每个硬盘故障都意味着可靠性降低。我们能否承受两个硬盘故障? 三个呢? 这就是填充率的作用所在。该指标可以比较固态硬盘 (SSD) 和机械硬盘的重建时间。在数据恢复和重建时间十分关键的场景中(例如 RAID 配置),这一点尤为重要。与机械硬盘相比,SSD 通常具有更快的填充率,能够在发生故障时更快地重建冗余。这样可以减少停机时间,确保系统迅速恢复运行。例如 30.72TB 的美光 6500 ION SSD,凭借 5GB/s 的连续写入速度,仅需 1.7 小时即可填充整个硬盘。相比之下,28TB HDD 6 的持续传输速率为 265MB/s,需要 29.4 小时才能充满。也就是说,美光 6500 ION SSD 能以 17.2 倍速填充更大的容量。
结论
顺序读写吞吐量和随机读写 IOPS 等传统指标固然重要,但它们并不能全面反映 SSD 的性能。通过结合考虑其他指标,如每瓦 IOPS、每太字节 IOPS、延迟和服务质量、写入太字节数和填充率等,我们可以更透彻地了解 SSD 的功能。在为特定工作负载选择合适的 SSD 时,这些指标非常重要,有助于确保理想的性能、效率和使用寿命。
1 美光 9550 NVMe™ SSD 和 BaM 技术简介
3 美光 7500 NVMe™ SSD RocksDB 性能
4 有关 WAF 的详细介绍,请参阅 Jonmichael Hands 的精彩博客文章,其中解释了 SSD 上的这种现象,网址为 https://ssdcentral.net/waf/