设计工具
存储

从对象存储中丢弃 HDD:采用美光 6500 ION 的 Ceph

Ryan Meredith | 2023 年 7 月

Ceph 通常作为对象存储部署,使用 HDD 存储,并使用少量 NVMe 加速 Bluestore(元数据 + 写入前的日志)。美光最近完成了全 NVMe Ceph 配置的测试,其中使用美光 6500 ION 作为数据和 Bluestore 的存储。虽然美光 6500 ION 相较于 Solidigm P5316 的性能表现非常出色,但我们还希望了解使用 HDD + NVMe 的更常见 Ceph 部署与使用美光 6500 ION 的部署方案之间的性能差异。

一家大型 HDD 供应商发布了技术简报,详细介绍了 Ceph 在一个使用 12 个 12 TB 3.5 英寸 SATA HDD 和一个用于 Bluestore 的 NVMe 扩展卡固态硬盘的 4 节点集群中的性能。这两种解决方案都使用 RADOS Bench(Ceph 用于测量客户端或 S3 网关对象吞吐量的工具)进行测试。这份报告中详细介绍了一些架构差异,但即使考虑到这些差异,采用美光 6500 ION 的 Ceph 和采用 HDD + NVMe 的 Ceph 之间的差异依然非常显著。

性能

• 美光 6500 ION Ceph 配置展示出 11 倍的读取性能和 27 倍的写入性能。

• HDD + NVMe Ceph 的读取延迟高出 8 倍,写入延迟高出 37 倍。

• 采用美光 6500 ION 的 Ceph 集群每可用 TB 的性能更高,每 TB 的读取性能达 4 倍,每 TB 的写入性能达 10 倍。

功率效率

• 采用美光 6500 ION 的 Ceph 的存储功率效率(瓦特/TB 或瓦/TB)达 2 倍,而读取的功率/吞吐量达 16 倍,写入的功率/吞吐量达 46 倍。

成本

• 两种解决方案的每单位可用容量成本大致相当,因为 NVMe 存储的性能要高得多。在这种规模下,全 NVMe 集群可以使用 4+2 的纠删码,但不建议对 HDD 采用相同配置,HDD 需要使用 3 倍复制。

  • 要达到 6 节点美光 6500 ION Ceph 配置的可用容量,需要 16 个 HDD + NVMe Ceph 节点(可添加简化公式验证这一结论)。
  • 若要达到 6 节点美光 6500 ION Ceph 配置的读取性能,还需要 68 个 HDD 节点;而若要达到美光 6500 ION Ceph 配置的相同写入性能,则需要 161 个 HDD 节点(可添加简化公式验证这一结论)。

测试环境

硬件配置

美光 6500 ION Ceph

HDD + NVMe

OSD 节点数

6

4

服务器大小

1 RU

1RU/2RU

CPU

AMD 74F3(24 核)

未列出

DRAM

 

64 GB

NVMe

6 个美光 6500 ION 30 TB

1 个 NVMe AIC

HDD

12 个 3.5 英寸 HDD 12 TB

网络

200 GbE

10 GbE

 

软件配置

美光 6500 ION Ceph

HDD + NVMe

操作系统

Ubuntu 20.04 HWE(内核版本 5.15)

未提供

Ceph 版本

Quincy(17.2.5)

未提供

基准

RADOS Bench 4MB

RADOS Bench 4MB

Ceph 池配置*

4+2 纠删码

3 倍复制

 

*对于 NVMe 测试,使用 4+2 纠删码与 3 倍复制相比,读取性能降低 15%,写入性能提高了 27%。有关详细信息,请参阅以下美光技术简报:利用低延迟 NVMeTM 固态硬盘释放高性能、可容错 Ceph® 对象存储系统的潜力

详细结果

由于 HDD + NVMe 测试使用的节点更少,而且使用 3 倍复制而不是 4+2 纠删码,因此我们希望通过考虑这些差异来进行比较。

节点差异(节点性能乘数):

• 我们将 HDD + NVMe 带宽结果乘以 1.5,来模拟 6 节点配置(假设性能呈线性扩展)

• 我们保持与 HDD 技术简报中相同的平均延迟。

数据保护差异(数据保护性能乘数):

• 读取性能:4+2 纠删码对集群的读性能有 15% 的性能损失。我们没有改变美光 6500 ION 测试的结果(增加),也没有减少 HDD + NVMe 配置的性能数据。这种方法将有利于 HDD 配置。

• 写入性能:在全 NVMe 测试中,4+2 纠删码的性能比 3 倍复制提高了 27%。虽然我们不认为在 HDD 上可以实现相同水平的性能,但我们将 HDD 的结果乘以 1.27 以考虑到这种潜在的提升。这种方法也有利于 HDD 配置。

数据保护性能增量由美光测量,更多详细信息可在此处找到。

读写性能

美光 6500 ION Ceph 配置的读取性能是 11.5 倍,写入性能是 27 倍。

图表:Ceph 4 MB 对象吞吐量(MB/秒)

 

节点性能
乘数

数据保护
写入性能 乘数

测量
读取带宽(MB/秒)

读取带宽(MB/秒)

测量
写入带宽(MB/秒)

写入带宽(MB/秒)

HDD + NVMe Ceph

1.5

1.27

3055

4,583

506

964

美光 6500 ION Ceph

1

1

52,540

52,540

25,800

25,800

差异

 

 

 

11 倍

 

27 倍

 

延迟

HDD + NVMe Ceph 配置的读取延迟和写入延迟分别是 6500 ION Ceph 配置的 8 倍和 37 倍。

图表:Ceph 4 MB 对象延迟(毫秒)越低越好

 

读取延迟(毫秒)

写入延迟(毫秒)

HDD + NVMe Ceph

290

1,760

美光 6500 ION Ceph

35

48

差异

8 倍

37 倍

 

每 TB 的吞吐量

存储性能和效率的一个衡量标准是每 TB 可用的性能量。在这里,我们测量原始容量和可用容量的吞吐量,单位为 MB/秒。

图表:每 TB 的 Ceph 吞吐量(可用容量)

 

可用容量

读取带宽(MB/秒)/TB

写入带宽(MB/秒)/TB

HDD + NVMe Ceph

192 TB

16

3.3

美光 6500 ION Ceph

760TB

69

34

差异

 

4 倍

10 倍

 

在考虑可用磁盘容量时,美光 6500 ION 固态硬盘 Ceph 配置每 TB 的读取带宽高出 4 倍,每 TB 的写入带宽高出 13 倍。请注意,HDD + NVMe 配置中的 3 倍复制将原始容量减少至三分之一(576 TB/3 = 192 TB),而美光 6500 ION Ceph 配置中的 4+2 纠删码将原始容量减少至六分之四(1,152 TB * 0.66 = 760 TB)。

功耗

HDD 技术简报显示,12 TB的 HDD 每块驱动器的功耗为 7.25 瓦,因此 4 节点解决方案的存储组件总功耗为 348 瓦。我们测量了美光 6500 ION 在测试期间的平均磁盘吞吐量,读取速度为 1.5 GB/秒,写入速度为 1.2 GB/秒,并在这些性能水平下计算了每个驱动器的功耗。读取结果为 10.1 W,写入结果为 10.6 W。由于 HDD 只有一个功耗数字,因此我们选择了更高的 10.6 W 结果进行比较。

图表:能耗(瓦/GBps)越低越好

功率(瓦)

每硬盘

每节点
12 个 HDD
6 个美光 6500 ION

每集群:6 个节点
72 个 HDD
36 个美光 6500 ION

HDD 12TB

7.25

87

522

美光 6500 ION

10.6

64

382

差异

1.5 倍

0.7 倍

0.7 倍

 

30 TB 美光 6500 ION 每个驱动器的功率是 12 TB HDD 的 1.5 倍。由于容量差异的原因,美光 6500 ION Ceph 解决方案每节点使用的功耗仅为 HDD + NVMe 的 70%。

容量能效(瓦/TB)

功耗是衡量存储解决方案效率的一个良好指标。HDD 简报报告了 Ceph 解决方案中 HDD JBOD 部分的平均瞬时功耗,不考虑 Ceph 存储节点的 CPU、内存和网络功耗。

对于美光 6500 ION 配置,我们根据吞吐量,计算了每个驱动器的功耗:读取功耗为 10.1 瓦(1.2 GB/秒吞吐量下),写入功耗(1.5 GB/秒吞吐量下)为 10.6 瓦。

图表:平均瞬时功耗瓦/TB 越低越好

仅比较存储组件,美光 6500 ION Ceph 配置的每 TB 的能效只有一半多点,展示出了 NVMe 固态硬盘配置的能效优于 HDD 配置。

性能能效(瓦/GBps)

另一个要检查的功率指标是功率除以吞吐量,得出解决方案每 GBps 传输的能效。在这里,我们继续使用美光 6500 ION 每个驱动器 10.1 瓦的读取功率和每个驱动器 10.6 瓦的写入功率,以及 12 TB HDD 标示的 7.25 瓦功耗。

在考虑功耗和性能时,HDD + NVMe 配置在读取时使用 16 倍的功耗,在写入时使用 46 倍的功耗。

图表:平均瞬时功耗(W)

解决方案成本分析

使用全 NVMe Ceph 配置可在生产中使用纠删码。使用 HDD 时,仍强烈建议使用 3 倍复制。考虑到每个可用容量的成本,美光 6500 ION 配置的成本与 HDD + NVMe 配置相同。

每节点成本

HDD + NVMe Ceph
3 倍复制

美光 6500 ION Ceph
4+2 纠删码

服务器、CPU、NIC

1 倍

1.3 倍

DRAM

64 GB:1 倍

256 GB:4 倍

HDD

12 个 12 TB HDD(每个 200 美元):2,400 美元

无:0 美元

NVMe

1 个 NVMe 固态硬盘 AIC(1.6 TB):200 美元

6 个美光 6500 ION 32 TB(每个 2,000 美元):12,000 美元

系统总成本

1 倍

2.7 倍

容量(原始)

144 TB

192 TB

容量(可用)

48 TB

127 TB

成本/TB(原始)

1 倍/TB

2 倍/TB

成本/TB(可用)

1 倍/TB

1 倍/TB

 

要达到测试的 6 节点美光 6500 ION Ceph 配置的可用容量,需要 16 个 HDD + NVMe 节点;要达到同等读取性能,需要 68 个 HDD + NVMe 节点;要达到同等写入性能,需要 161 个 HDD + NVMe 节点。

每节点性能

读取带宽
每节点

写入带宽
每节点

HDD + NVMe Ceph

764 MB/秒

161 MB/秒

美光 6500 ION Ceph

8,757 MB/秒

4,300 MB/秒

达到美光 6500 ION 节点性能所需的 HDD 节点数

11

27

达到 6 节点 6500 ION Ceph 性能所需的 HDD 节点数

68

161

 

结论

美光 6500 ION 非常适合 NVMe 支持的 Ceph 对象存储。在 HDD 上使用纠删码而不是使用 3 倍复制时,实现了与 HDD 的成本持平。

在 Ceph 唵,美光 6500 ION 具有以下若干好处:

  • 性能优于 HDD
    • 写入速度提高 27 倍,读取性能提高 11 倍
    • 写入速度降低 37 倍,读取延迟降低 8 倍
    • 每可用容量的写入速度提高 10 倍,读取吞吐量提高 4 倍
  • 比 HDD 更高效
    • 每 TB 驱动功率减半
    • 存储系统功耗的 70%,未考虑美光 6500 ION 的更高性能
    • 每 GBps 写入速度降低 46 倍,读取功率降低 16 倍
  • 比 HDD 更具成本效益
    • 要达到 6 节点美光 6500 ION Ceph 配置测试的写入和读取性能,分别需要 161 个和 68 个 HDD + NVMe 节点

最后一点是:随着性能的大幅提高,美光 6500 ION Ceph 配置可以快速处理请求,从而更快地返回空闲状态。凭借更小的系统占用空间、“尽快进入空闲状态”的理念,以及像美光 6500 ION 这样具有成本效益的大容量 NVMe SDD,从对象存储中淘汰 HDD 最终变得有意义。

© 2023 Micron Technology, Inc. 保留所有权利。所有信息均“按原样”提供,不含任何类型的质保。产品仅保证符合美光的生产数据表规格。产品、计划和规格如有变更,恕不另行通知。若印刷或照片出现遗漏或错误,Micron Technology, Inc.(美光科技股份有限公司)恕不负责。Micron、Micron 徽标和所有其他 Micron 商标均为 Micron Technology Inc.(美光科技股份有限公司)的财产。所有其他商标分别为其各自所有者所有。修订版 A 01/2023 CCM004-676576390-11635

Director, Storage Solutions Architecture

Ryan Meredith

Ryan Meredith is director of Data Center Workload Engineering for Micron's Storage Business Unit, testing new technologies to help build Micron's thought leadership and awareness in fields like AI and NVMe-oF/TCP, along with all-flash software-defined storage technologies.