设计工具
存储

重要的 SSD 指标:超越传统基准

Alvaro Toledo | 2024 年 10 月

在评估 SSD 时,传统指标(例如顺序读写吞吐量以及随机读写 IOPS)通常是许多客户和系统供应商的首选基准。虽然这些指标对于某些比较案例很有用,但如今我们运行的工作负载相比过去更为重要,因此需要从不同的角度来看待存储设备。在这篇博客文章中,我们将会探讨其他指标,从而更全面地了解 SSD 性能,尤其是特定工作负载的性能。
 

每瓦 IOPS:效率非常重要


每瓦 IOPS 是经常被忽视的一个关键指标。该指标用来衡量 SSD 每消耗一瓦特功率可执行的每秒输入/输出操作数 (IOPS)。在能效至上的数据中心中,每瓦 IOPS 是一个关键因素。每瓦 IOPS 的值较高意味着 SSD 可以实现低功耗、高性能,从而显著节省电力费用和冷却成本。例如,在图形神经网络 (GNN) 训练工作负载中,美光 9550 SSD 的每瓦 IOPS 能效几乎可达到竞品的两倍。1

大型加速器内存
每瓦 IOPS

每太字节 IOPS:显著提升存储效率
 

另一个重要指标是“每太字节 IOPS”(IOPS/TB)。该指标非常适合用于比较固态硬盘 (SSD) 与近线硬盘的性能,后者虽然提供大容量存储,但往往性能不足。通过评估每太字节 IOPS,我们可以确定 SSD 处理 IOPS 时相对于其存储容量的效率。如果客户希望将多个机械硬盘整合到数量更少的 SSD 中,则这一点至关重要,可显著节省空间和运营成本。例如,美光 6500 ION SSD 的容量比 24TB HDD2 大 28%,而每太字节随机读取 IOPS 性能提升可达到惊人的 4,650 倍。

每太字节 IOPS

延迟和服务质量 (QoS):一致性和速度
 

延迟和服务质量 (QoS) 是会显著影响 SSD 性能的关键指标。延迟指标用来衡量处理和返回数据请求所需的时间,而 QoS 则用于描述 SSD 性能的一致性。对于需要实时数据处理的应用,例如在线事务处理 (OLTP) 和高频交易,低延迟非常重要。对于以“性能一致性”为关键的数据库和视频流等应用,高 QoS 至关重要,有助于确保 SSD 提供可预测的性能。例如,美光 7500 SSD 在混合随机工作负载下的延迟低于 1 毫秒,延迟水平的可靠性达到 6 个 9 (99.9999%),确保了可靠、及时的数据传输。在 RocksDB 等 QoS 敏感型应用中,美光 7500 可实现同类产品中出类拔萃的性能和 QoS。3

RocksDB 基准测试


写入的太字节数:随时间变化的数据容量
 

每日驱动器写入次数 (DWPD) 衡量的是 SSD 在硬盘保修期内每天可以整盘写入的次数。DWPD 基于完全随机的工作负载进行衡量,代表了硬盘由于写放大 (WAF) 而导致的最糟糕情况。4 DWPD 针对临时数据不断更新的计算工作负载而制定,意味着硬盘在其终身寿命内始终以相同的速率进行工作。

然而,存储设备中的工作负载通常会随时间而变化。硬盘在其寿命早期会很快填满,但访问和写入量通常会随着时间而下降。在这些情况下,基于一致使用的 DWPD 与不规则使用模式不太匹配。DWPD 不适合用于高容量硬盘,因为特定工作负载会极大地影响硬盘可以支持的写入次数。

美光 6500 ION 为例。在 30.72 TB 容量,0.3 DWPD 的额定值下,该硬盘可支持 5 年总写入量达到 16,819 TB。但是,由于许多客户是在顺序填充工作负载中使用这些硬盘,因此实际上该硬盘可以支持近 56,064 TB 的写入数据,是额定 DWPD 的三倍之多。

在需要高随机写入硬盘(例如,用于存储具有大量日志写入的 MySQL TempDB)时,有的客户会将大容量解决方案与高耐久性解决方案(例如美光 XTR)搭配使用。相比之下,高耐久性硬盘的容量较小(例如总容量为 1 或 2TB),但可以持续 5 年承受每天最多 35 次 100% 4K 随机硬盘写入。5

此外,我们发觉有些客户希望使用少量的大容量 SSD 来取代多个机械硬盘,以便集中于每年每 TB 的写入太字节数,这样可在针对不同总容量进行标准化的同时衡量硬盘的写入压力。
 

填充率:重建时间很重要


在职业生涯初期,我曾多年担任大型数据库的系统管理员。在此期间,我得到的一个教训是:硬盘会出现故障。问题不在于是否会发生故障,而在于何时发生,所以要为此做好计划。一个硬盘出现故障并不可怕,多个硬盘同时出现故障才让人头疼。管理员会设计冗余和故障转移机制,但每个硬盘故障都意味着可靠性降低。我们能否承受两个硬盘故障? 三个呢? 这就是填充率的作用所在。该指标可以比较固态硬盘 (SSD) 和机械硬盘的重建时间。在数据恢复和重建时间十分关键的场景中(例如 RAID 配置),这一点尤为重要。与机械硬盘相比,SSD 通常具有更快的填充率,能够在发生故障时更快地重建冗余。这样可以减少停机时间,确保系统迅速恢复运行。例如 30.72TB 的美光 6500 ION SSD,凭借 5GB/s 的连续写入速度,仅需 1.7 小时即可填充整个硬盘。相比之下,28TB HDD 6 的持续传输速率为 265MB/s,需要 29.4 小时才能充满。也就是说,美光 6500 ION SSD 能以 17.2 倍速填充更大的容量。

填充率数据

结论
 

顺序读写吞吐量和随机读写 IOPS 等传统指标固然重要,但它们并不能全面反映 SSD 的性能。通过结合考虑其他指标,如每瓦 IOPS、每太字节 IOPS、延迟和服务质量、写入太字节数和填充率等,我们可以更透彻地了解 SSD 的功能。在为特定工作负载选择合适的 SSD 时,这些指标非常重要,有助于确保理想的性能、效率和使用寿命。

 

VP & GM, Data Center and Storage

Alvaro Toledo

Alvaro is Vice President and General Manager of Data Center Storage at Micron. He is responsible for strategy, product and technology roadmaps, technical customer engagement, and profit and loss (P&L) for data center storage.

Alvaro earned a bachelor’s degree in computer science from National University and an MBA from the Haas School of Business at the University of California, Berkeley.