在不断发展变化的技术领域,计算系统架构正在经历一场深刻的变革。随着我们进入计算需求达到空前水平的新时代,再加上摩尔定律的步伐逐渐放缓,现在,计算机架构师和设计工程师正在从根本上重新构想我们如何设计、构建和配置系统。大量新的工作负载需求正在塑造计算机架构和节能硬件的未来,与此同时,多项支撑技术开始涌现,试图通过模块化来满足这些需求。
新需求推动系统架构变革
正如许多人已经注意到的那样,AI 革命已经到来。人工智能 (AI),特别是深度学习 (DL),如今已经走出研究实验室,成为云计算公司和各行各业增长计划中不可或缺的一部分。从医疗诊断和筛查到财务预测,许多决策过程都整合了 AI 算法。高效地存储和处理所有这些数据变得越来越困难,而大规模的 LLM 和生成式 AI 训练是推动技术发展的首要因素。
随着数据量的不断增长,一个特别值得关注的挑战是,如何将这些数据提供给驱动 DL 模型训练的主要计算引擎(通常是 GPU,某些情况下也可能是 AI 专用处理器)。数据集变得如此庞大,以至于它们不仅不适合直接连接到 GPU 的高带宽内存 (HBM) 的容量,甚至可能超过本地系统内存容量。 除 DRAM 外,NAND 闪存存储设备将很快成为实现更强大 AI 功能的另一个关键组件。在具有适当性能的系统中扩展可用容量似乎越来越多地关乎提供具有成本效益的带宽,同时最大限度地减少会降低性能和浪费电力的通信步骤及中间阶段。 相关的做法是将数据路径(数据流动的主要路径)与控制路径分离,以便更好地优化两者。 类似的优化模式过去曾在其他领域实施过,比如 SDN 和 OpenFlow 网络连接,但现在要应用于 AI 专用架构。
满足近期 AI 需求所面临的另一个重大困难也与之前的行业挑战相似,即,如何跟上频繁的技术变革和经过优化的新系统架构。 虽然开发新的复杂系统硬件设计所需的时间并没有显著缩短,但对最新进展和新优化系统的需求大大增加,它们可以通过提供更高的性能或效率带来竞争优势。 由于主要的工作负载需求在过去一两年中才开始变得明显,频繁的变化使得及时交付最知名的解决方案变得极其困难。
新模块化技术赋能系统架构
为了帮助跟上技术领域不断发展的步伐,各组织纷纷开始开发模块化计算模型,如开放计算项目 (OCP)、模块化硬件系统 (MHS),力求将一些复杂的系统分解为不同的部分。虽然一直有可插拔的模块和卡来实现各种功能,但现代系统中的传统方法一直是将核心计算子系统与处理器集成在主系统板中。这种集成提供了功能比率固定的单一、低成本实现,有助于大批量交付有益的解决方案。然而,构建和测试此类系统的时间以及所需的开发成本 (NRE) 使得使用最新组件频繁构建新配置(要提供运行关键工作负载的高性能,这是理想的做法)变得令人望而却步。
通过将复杂的系统设计划分为更小、可互换的子系统板,特别是包括仅含 CPU 和内存的标准尺寸主机处理器模块 (HPM),新的系统设计可以由现有的通用模块封装而成。 采用新技术的子系统板也可以更快开发出来,并且可以与现有通用子系统板一起使用,大大缩短部署新系统功能的时间。 例如,您可以想象在给定机箱中组装容量更高的新内存扩展模块,但存储背板、HPM、网络和存储保持不变,与使用旧内存扩展模块时一样。 这种通用尺寸的模块化设计使系统能够以更灵活的方式进行配置,从而更好地适应特定的工作负载需求——当下一代需求尚未普及开来时,它的价值更大。
与系统板的模块化具有类似的好处,另一项有益的技术是最近对芯粒通用接口的标准化。 通过将单块芯片分解成单独的颗粒,它们可以实现高效的制造和具有成本效益的生产。 芯粒为采用先进制造方法生产特定组件、使用旧方法生产其他组件提供了可能,不仅有助于扩大产品范围,还可提高效率。如果有可以提高计算性能的新技术被发现和开发出来,人们可以单独设计和升级各个芯粒。这可以提供更大的灵活性,缩短采用时间,以及让新功能(包括那些可以加速新 AI 模型和新兴工作负载的功能)的维护变得更简单。
利用 EDSFF 标准支持未来系统需求
在满足系统架构不断变化的需求方面,由 SNIA 的 SFF 技术联盟 (Technology Affiliate) 发布的企业和数据中心标准外形尺寸 (EDSFF) 行业标准也发挥了重要作用。EDSFF 标准是一系列相互依赖的规范,定义了与连接器兼容的可插拔模块的特定外形尺寸 (FF),即 E1 和 E3。 其中,E1 FF 系列的 E1.S(短版)和 E1.L(长版)可垂直安装在 1U 机架系统空间中。 E3 FF 系列的 E3.S(短版)和 E3.L(长版)可垂直安装在 2U 机架系统空间中。
当我们最开始在业内开发这些标准时,我们中的一些人认为它们应该具有通用性,既可以理想地适配我们的主要目标,即针对数据中心优化的存储设备,又可以支持新技术的采用和应用。
对于存储,EDSFF NVMe 硬盘相比传统外形尺寸具有多项优势:
- 它们支持更高的存储密度,允许在相同的物理空间中实现更高的存储容量和性能。
- EDSFF 硬盘的外形更纤薄小巧,表面积更大,具有更好的热特性。
- 支持 +12V 作为系统主电源电压轨的简化供电。
- 通过支持高达 112Gbps 信令的通用 EDSFF 标准平价连接器,提高了高速接口的信号完整性以及功率支持。
这些优势对于 AI 工作负载尤其有价值,因为它们通常需要大量的高性能存储来存储模型训练数据。较小的 EDSFF 硬盘可以通过扩展系统中的硬盘数量来提供高存储性能密度,以此缩短 GPU 或处理器等待下一组数据的时间。 较大外形尺寸则可以在单个硬盘中实现更大的容量,非常适合为通常存放在外部存储系统中的海量训练数据集提供高性能的大容量存储层。
由于 EDSFF 硬盘具有更好的热特性,因此可以对系统设计进行优化,进一步改善 GPU 的散热,在给定气流下获得更高的性能。 外形尺寸较小的硬盘还可以增加存储功能,在系统前部占据较少的位置,为前部通风管道和开口留出空间,以便为下游系统组件提供新鲜空气。
使用许多可插拔 EDSFF 存储设备为各种不同工作负载配置系统具有很大的灵活性,当下正在生产的服务器系统已经开始利用这一点。 根据特定的工作负载要求,可以在同一个系统中调整存储容量、性能和功率,以满足各种需求。
除存储之外,最近,我们还见证了采用 EDSFF 系列外形和标准高速接口的新设备的首次推出。 新的 CXL® 协议提供了一种方法,可以通过与 PCIe 相同的物理层信令和互连来以低延迟连接设备。 由于系统处理器和其他芯片可以在同一引脚上同时支持 CXL 和 PCIe,系统中的 EDSFF 设备插槽通常已经可以支持通过 CXL 协议连接的新设备。在致力于推动内存设备和许多其他半导体相关标准的 JEDEC 行业组织中,我们最近发布了业界首个用于 CXL 的内存模块规范,称为 CMM。 这些 CMM 设备通过带有 CXL 接口的模块化控制器连接标准 DRAM 设备,可插入符合 EDSFF 标准的系统插槽,无需重新设计系统板即可扩展系统内存容量。
因此,系统配置的灵活性已经扩展到使用 EDSFF 可插拔模块的内存和存储,并且可能会有更多类型的设备,包括也通过 PCIe 或 CXL 连接的处理和网络设备。 这些设备增强了系统的灵活性、功能和性能,使其成为 AI 驱动的系统架构的理想之选。
展望未来的系统架构
总的来说,系统架构的未来在于适应性、可扩展性和创新。随着我们采用 AI、模块化设计和前沿技术,系统设计师和架构师在塑造数字格局方面将发挥举足轻重的作用。从芯片封装到系统机箱和机架,他们必须从系统层面进行更多创新。 模块化系统设计、芯粒和 EDSFF 硬盘等可插拔模块将为不断变化的需求架设起通向强大、高性能系统设计的桥梁。鉴于灵活性是支持 AI 和其他高级工作负载未来需求的关键,它们将是系统更优化发展的关键推动因素。