设计工具
存储

美光 6500 ION 在基于 AMD 的服务器上提供优良的 WEKA 性能

Sujit Somandepalli | 2023 年 7 月

随着美光 6500 ION NVMe SSD 的推出,最近我们终于有机会在基于第四代 AMD EPYC™ 9554(64 核)的 Supermicro 平台上使用 WEKA™ 1 开展一些有趣的扩展研究。

WEKA 是一种基于 NVMe™ 的高性能软件定义存储解决方案,通常用于高性能计算 (HPC) 和人工智能 (AI) 等各种应用场景的大规模文件存储部署。

我们在由 6 台 Supermicro AS-1115CS-TNR2 单路服务器搭建成的集群上进行了测试,这些服务器搭载了 AMD EPYC 9004 系列处理器、美光 DDR5 内存且采用符合 400GbE 标准的 PCIe® 5.0 网络连接。由于具有高性能 Zen 4 内核和简化的单路设计,这些服务器非常适合使用 WEKA 设计集群存储系统。它们每个节点最多可安装 10 个 NVMe SSD,整个测试集群共计可安装 60 个驱动器。

此 6 节点 WEKA 存储集群连接到 12 个客户端,每个客户端在不同 IO 深度(队列深度)和 32 个工作负载下运行灵活 I/O 测试工具 (fio)3

我们在此集群上开展的测试最初使用了 36 个驱动器(6 个节点,每个节点 6 个驱动器),然后扩展到 60 个驱动器(6 个节点,每个节点 10 个驱动器)。结果不言自明。

顺序性能

在 1MB 顺序读取工作负载中,我们观察到,随着每个节点的驱动器数量从 6 个增加到 10 个,读取速度从大约 164GB/s 提高到了 229GB/s。这一结果表明,顺序读取性能提升了近 40%。对于 128KB 顺序读取工作负载,我们观察到性能几乎达到了六驱动器配置的两倍。

顺序工作负载的写入性能受到 WEKA 后端计算的限制,最高约为 106GB/s。

“1M 顺序读取——12 个客户端”图表
“128K 顺序读取——12 个客户端”图表
“128K 顺序写入——12 个客户端”图表

4KB 随机性能

我们还使用 fio 运行了小块随机 IO 测试(四个指标,4KB),并且我们观察到,除了提供更高的每秒读写操作次数 (IOPS) 之外,十驱动器配置中每次操作的延迟也更低。对于 100% 随机读取工作负载,十驱动器配置能够在 0.59ms 的平均读取延迟下达到超过 1,600 万的 IOPS,而对于 100% 随机写入工作负载,则能够在 3.19ms 的平均写入延迟下达到超过 3,100 万 IOPS。

“4K 随机读取和平均延迟 (ms)——12 个客户端”图表
“4K 随机写入和平均延迟 (ms)——12 个客户端”图表

结论

我们看到,随着每个节点的驱动器数量从 6 个增加到 10 个,WEKA 可实现近乎线性的性能提升。这一结果证明,通过使用具有成本竞争力的 30TB 美光 6500 NVMe SSD,您可以轻松在第 4 代 AMD EPYC 9004 系列处理器上扩展 WEKA 部署。 

  1. 有关 Weka 的更多信息,请访问 https://www.weka.io/ 
  2. 有关 Supermicro AS-115CS-TNS 平台的详细信息,请访问 https://www.supermicro.com/en/products/system/clouddc/1u/as-1115cs-tnr
  3. 有关 FIO 的详细信息,请访问 https://fio.readthedocs.io/en/latest/fio_doc.html

Principal Storage Solutions Engineer

Sujit Somandepalli

Sujit Somandepalli is Principal Storage Solutions Engineer at Micron Technology.