设计工具
存储

从对象存储中丢弃 HDD:采用美光 6500 ION 的 Ceph

Ryan Meredith | 2023 年 7 月

Ceph 通常作为对象存储部署,使用 HDD 存储,并使用少量 NVMe 加速 Bluestore(元数据 + 写入前的日志)。美光最近完成了全 NVMe Ceph 配置的测试,其中使用美光 6500 ION 作为数据和 Bluestore 的存储。虽然美光 6500 ION 相较于 Solidigm P5316 的性能表现非常出色,但我们还希望了解使用 HDD + NVMe 的更常见 Ceph 部署与使用美光 6500 ION 的部署方案之间的性能差异。

一家大型 HDD 供应商发布了技术简报,详细介绍了 Ceph 在一个使用 12 个 12 TB 3.5 英寸 SATA HDD 和一个用于 Bluestore 的 NVMe 扩展卡固态硬盘的 4 节点集群中的性能。这两种解决方案都使用 RADOS Bench(Ceph 用于测量客户端或 S3 网关对象吞吐量的工具)进行测试。这份报告中详细介绍了一些架构差异,但即使考虑到这些差异,采用美光 6500 ION 的 Ceph 和采用 HDD + NVMe 的 Ceph 之间的差异依然非常显著。

性能

• 美光 6500 ION Ceph 配置展示出 11 倍的读取性能和 27 倍的写入性能。

• HDD + NVMe Ceph 的读取延迟高出 8 倍,写入延迟高出 37 倍。

• 采用美光 6500 ION 的 Ceph 集群每可用 TB 的性能更高,每 TB 的读取性能达 4 倍,每 TB 的写入性能达 10 倍。

功率效率

• 采用美光 6500 ION 的 Ceph 的存储功率效率(瓦特/TB 或瓦/TB)达 2 倍,而读取的功率/吞吐量达 16 倍,写入的功率/吞吐量达 46 倍。

成本

• 两种解决方案的每单位可用容量成本大致相当,因为 NVMe 存储的性能要高得多。在这种规模下,全 NVMe 集群可以使用 4+2 的纠删码,但不建议对 HDD 采用相同配置,HDD 需要使用 3 倍复制。

  • 要达到 6 节点美光 6500 ION Ceph 配置的可用容量,需要 16 个 HDD + NVMe Ceph 节点(可添加简化公式验证这一结论)。
  • 若要达到 6 节点美光 6500 ION Ceph 配置的读取性能,还需要 68 个 HDD 节点;而若要达到美光 6500 ION Ceph 配置的相同写入性能,则需要 161 个 HDD 节点(可添加简化公式验证这一结论)。

测试环境

硬件配置

美光 6500 ION Ceph

HDD + NVMe

OSD 节点数

6

4

服务器大小

1 RU

1RU/2RU

CPU

AMD 74F3(24 核)

未列出

DRAM

 

64 GB

NVMe

6 个美光 6500 ION 30 TB

1 个 NVMe AIC

HDD

12 个 3.5 英寸 HDD 12 TB

网络

200 GbE

10 GbE

 

软件配置

美光 6500 ION Ceph

HDD + NVMe

操作系统

Ubuntu 20.04 HWE(内核版本 5.15)

未提供

Ceph 版本

Quincy(17.2.5)

未提供

基准

RADOS Bench 4MB

RADOS Bench 4MB

Ceph 池配置*

4+2 纠删码

3 倍复制

 

*对于 NVMe 测试,使用 4+2 纠删码与 3 倍复制相比,读取性能降低 15%,写入性能提高了 27%。有关详细信息,请参阅以下美光技术简报:利用低延迟 NVMeTM 固态硬盘释放高性能、可容错 Ceph® 对象存储系统的潜力

详细结果

由于 HDD + NVMe 测试使用的节点更少,而且使用 3 倍复制而不是 4+2 纠删码,因此我们希望通过考虑这些差异来进行比较。

节点差异(节点性能乘数):

• 我们将 HDD + NVMe 带宽结果乘以 1.5,来模拟 6 节点配置(假设性能呈线性扩展)

• 我们保持与 HDD 技术简报中相同的平均延迟。

数据保护差异(数据保护性能乘数):

• 读取性能:4+2 纠删码对集群的读性能有 15% 的性能损失。我们没有改变美光 6500 ION 测试的结果(增加),也没有减少 HDD + NVMe 配置的性能数据。这种方法将有利于 HDD 配置。

• 写入性能:在全 NVMe 测试中,4+2 纠删码的性能比 3 倍复制提高了 27%。虽然我们不认为在 HDD 上可以实现相同水平的性能,但我们将 HDD 的结果乘以 1.27 以考虑到这种潜在的提升。这种方法也有利于 HDD 配置。

数据保护性能增量由美光测量,更多详细信息可在此处找到。

读写性能

美光 6500 ION Ceph 配置的读取性能是 11.5 倍,写入性能是 27 倍。

图表:Ceph 4 MB 对象吞吐量(MB/秒)

 

节点性能
乘数

数据保护
写入性能 乘数

测量
读取带宽(MB/秒)

读取带宽(MB/秒)

测量
写入带宽(MB/秒)

写入带宽(MB/秒)

HDD + NVMe Ceph

1.5

1.27

3055

4,583

506

964

美光 6500 ION Ceph

1

1

52,540

52,540

25,800

25,800

差异

 

 

 

11 倍

 

27 倍

 

延迟

HDD + NVMe Ceph 配置的读取延迟和写入延迟分别是 6500 ION Ceph 配置的 8 倍和 37 倍。

图表:Ceph 4 MB 对象延迟(毫秒)越低越好

 

读取延迟(毫秒)

写入延迟(毫秒)

HDD + NVMe Ceph

290

1,760

美光 6500 ION Ceph

35

48

差异

8 倍

37 倍

 

每 TB 的吞吐量

存储性能和效率的一个衡量标准是每 TB 可用的性能量。在这里,我们测量原始容量和可用容量的吞吐量,单位为 MB/秒。

图表:每 TB 的 Ceph 吞吐量(可用容量)

 

可用容量

读取带宽(MB/秒)/TB

写入带宽(MB/秒)/TB

HDD + NVMe Ceph

192 TB

16

3.3

美光 6500 ION Ceph

760TB

69

34

差异

 

4 倍

10 倍

 

在考虑可用磁盘容量时,美光 6500 ION 固态硬盘 Ceph 配置每 TB 的读取带宽高出 4 倍,每 TB 的写入带宽高出 13 倍。请注意,HDD + NVMe 配置中的 3 倍复制将原始容量减少至三分之一(576 TB/3 = 192 TB),而美光 6500 ION Ceph 配置中的 4+2 纠删码将原始容量减少至六分之四(1,152 TB * 0.66 = 760 TB)。

功耗

HDD 技术简报显示,12 TB的 HDD 每块驱动器的功耗为 7.25 瓦,因此 4 节点解决方案的存储组件总功耗为 348 瓦。我们测量了美光 6500 ION 在测试期间的平均磁盘吞吐量,读取速度为 1.5 GB/秒,写入速度为 1.2 GB/秒,并在这些性能水平下计算了每个驱动器的功耗。读取结果为 10.1 W,写入结果为 10.6 W。由于 HDD 只有一个功耗数字,因此我们选择了更高的 10.6 W 结果进行比较。

图表:能耗(瓦/GBps)越低越好

功率(瓦)

每硬盘

每节点
12 个 HDD
6 个美光 6500 ION

每集群:6 个节点
72 个 HDD
36 个美光 6500 ION

HDD 12TB

7.25

87

522

美光 6500 ION

10.6

64

382

差异

1.5 倍

0.7 倍

0.7 倍

 

30 TB 美光 6500 ION 每个驱动器的功率是 12 TB HDD 的 1.5 倍。由于容量差异的原因,美光 6500 ION Ceph 解决方案每节点使用的功耗仅为 HDD + NVMe 的 70%。

容量能效(瓦/TB)

功耗是衡量存储解决方案效率的一个良好指标。HDD 简报报告了 Ceph 解决方案中 HDD JBOD 部分的平均瞬时功耗,不考虑 Ceph 存储节点的 CPU、内存和网络功耗。

对于美光 6500 ION 配置,我们根据吞吐量,计算了每个驱动器的功耗:读取功耗为 10.1 瓦(1.2 GB/秒吞吐量下),写入功耗(1.5 GB/秒吞吐量下)为 10.6 瓦。

图表:平均瞬时功耗瓦/TB 越低越好

仅比较存储组件,美光 6500 ION Ceph 配置的每 TB 的能效只有一半多点,展示出了 NVMe 固态硬盘配置的能效优于 HDD 配置。

性能能效(瓦/GBps)

另一个要检查的功率指标是功率除以吞吐量,得出解决方案每 GBps 传输的能效。在这里,我们继续使用美光 6500 ION 每个驱动器 10.1 瓦的读取功率和每个驱动器 10.6 瓦的写入功率,以及 12 TB HDD 标示的 7.25 瓦功耗。

在考虑功耗和性能时,HDD + NVMe 配置在读取时使用 16 倍的功耗,在写入时使用 46 倍的功耗。

图表:平均瞬时功耗(W)

解决方案成本分析

使用全 NVMe Ceph 配置可在生产中使用纠删码。使用 HDD 时,仍强烈建议使用 3 倍复制。考虑到每个可用容量的成本,美光 6500 ION 配置的成本与 HDD + NVMe 配置相同。

每节点成本

HDD + NVMe Ceph
3 倍复制

美光 6500 ION Ceph
4+2 纠删码

服务器、CPU、NIC

1 倍

1.3 倍

DRAM

64 GB:1 倍

256 GB:4 倍

HDD

12 个 12 TB HDD(每个 200 美元):2,400 美元

无:0 美元

NVMe

1 个 NVMe 固态硬盘 AIC(1.6 TB):200 美元

6 个美光 6500 ION 32 TB(每个 2,000 美元):12,000 美元

系统总成本

1 倍

2.7 倍

容量(原始)

144 TB

192 TB

容量(可用)

48 TB

127 TB

成本/TB(原始)

1 倍/TB

2 倍/TB

成本/TB(可用)

1 倍/TB

1 倍/TB

 

要达到测试的 6 节点美光 6500 ION Ceph 配置的可用容量,需要 16 个 HDD + NVMe 节点;要达到同等读取性能,需要 68 个 HDD + NVMe 节点;要达到同等写入性能,需要 161 个 HDD + NVMe 节点。

每节点性能

读取带宽
每节点

写入带宽
每节点

HDD + NVMe Ceph

764 MB/秒

161 MB/秒

美光 6500 ION Ceph

8,757 MB/秒

4,300 MB/秒

达到美光 6500 ION 节点性能所需的 HDD 节点数

11

27

达到 6 节点 6500 ION Ceph 性能所需的 HDD 节点数

68

161

 

结论

美光 6500 ION 非常适合 NVMe 支持的 Ceph 对象存储。在 HDD 上使用纠删码而不是使用 3 倍复制时,实现了与 HDD 的成本持平。

在 Ceph 唵,美光 6500 ION 具有以下若干好处:

  • 性能优于 HDD
    • 写入速度提高 27 倍,读取性能提高 11 倍
    • 写入速度降低 37 倍,读取延迟降低 8 倍
    • 每可用容量的写入速度提高 10 倍,读取吞吐量提高 4 倍
  • 比 HDD 更高效
    • 每 TB 驱动功率减半
    • 存储系统功耗的 70%,未考虑美光 6500 ION 的更高性能
    • 每 GBps 写入速度降低 46 倍,读取功率降低 16 倍
  • 比 HDD 更具成本效益
    • 要达到 6 节点美光 6500 ION Ceph 配置测试的写入和读取性能,分别需要 161 个和 68 个 HDD + NVMe 节点

最后一点是:随着性能的大幅提高,美光 6500 ION Ceph 配置可以快速处理请求,从而更快地返回空闲状态。凭借更小的系统占用空间、“尽快进入空闲状态”的理念,以及像美光 6500 ION 这样具有成本效益的大容量 NVMe SDD,从对象存储中淘汰 HDD 最终变得有意义。

© 2023 Micron Technology, Inc. 保留所有权利。所有信息均“按原样”提供,不含任何类型的质保。产品仅保证符合美光的生产数据表规格。产品、计划和规格如有变更,恕不另行通知。若印刷或照片出现遗漏或错误,Micron Technology, Inc.(美光科技股份有限公司)恕不负责。Micron、Micron 徽标和所有其他 Micron 商标均为 Micron Technology Inc.(美光科技股份有限公司)的财产。所有其他商标分别为其各自所有者所有。修订版 A 01/2023 CCM004-676576390-11635

美光存储解决方案架构总监

Ryan Meredith

Ryan Meredith 担任美光存储业务部门数据中心工作负载工程总监,负责测试新技术,助力美光在 AI 和 NVMe-oF/TCP 等领域,以及全闪存软件定义存储技术方面树立思想领袖地位并提升知名度。