FMS 2024:CXL展现强劲势头
CXL联盟在近日举办的未来存储与内存峰会(FMS)上再次成为焦点。继2022年发布CXL 3.0规范和2023年在超级计算大会(Supercomputing 2023)上推出3.1版本后,CXL联盟持续引领着存储和计算互连技术的发展。

最初作为一种连接主机和设备的互联标准,CXL如今已成功整合了OpenCAPI和Gen-Z等竞争标准,成为一个更加全面和开放的生态系统。基于广泛应用的PCIe扩展总线,CXL规范能够满足从数据中心到边缘计算等多种应用场景的需求。
AMD、英特尔等行业巨头以及众多初创企业都是CXL联盟的重要成员。在今年的FMS上,CXL成为了各家厂商展台的“明星”,彰显了其在行业中的重要地位。
从DDR4向DDR5的服务器平台迁移,以及对大容量RAM(但对内存带宽和延迟不特别敏感)需求日益增长的工作负载的崛起,共同推动了内存扩展模块成为首批广泛可用的CXL设备之一。过去几年,三星和Micron等厂商已在这一领域发布了相关产品。
SK hynix CMM-DDR5 CXL内存模块和HMSDK
SK hynix在FMS 2024上展示了其128GB容量的DDR5基CMM-DDR5 CXL内存模块。该公司还详细介绍了配套的异构内存软件开发套件(HMSDK)。该套件包含一系列内核和用户层库与工具,旨在简化CXL内存的使用。通过考虑内存金字塔/层次结构并根据使用频率在服务器主内存(DRAM)和CXL设备之间重新分配数据,HMSDK实现了这一目标。

CMM-DDR5 CXL内存模块采用SDFF外形(E3.S 2T),配备PCIe 5.0 x8主机接口,容量为128GB。该模块基于1α工艺DRAM,在单一NUMA节点内可提供DDR5级别的带宽和延迟。面向数据中心和企业应用,其固件包含RAS(可靠性、可用性、可服务性)功能以及安全启动和其他管理特性。





此外,SK hynix还展示了Niagara 2.0硬件解决方案(目前基于FPGA),用于实现内存池化和共享,支持多个CXL内存连接,使不同主机(CPU和GPU)能够优化共享其容量。前一版本仅支持容量共享,而最新版本还支持数据共享。SK hynix今年早些时候在CXL DevCon 2024上展示了这些解决方案,但在FMS 2024上,CMM-DDR5的规格似乎取得了一些进展。



Microchip与Micron展示CZ120 CXL内存扩展模块
Micron去年发布的CZ120 CXL内存扩展模块,搭载了Microchip SMC 2000系列CXL内存控制器。在FMS 2024上,双方展示了该模块在Granite Rapids服务器上的实际应用。

展会还深入介绍了SMC 2000控制器。


这款控制器不仅具备DRAM芯片故障处理能力,而且Microchip还提供了相应的诊断和调试工具。作为SMC 2000系列企业级RAS功能集的一部分,标配ECC。得益于其灵活性,基于SMC 2000的CXL内存模块可以在仅支持DDR5的服务器中,与主DDR5 DRAM形成互补。
Marvell发布Structera CXL产品线
Marvell在FMS 2024开幕前夕,宣布了全新的Structera CXL产品线。



不同于其他专注于内存池化和扩展的CXL设备解决方案,Structera产品线还集成了计算加速器部分。这些产品均基于台积电5nm工艺打造。

Structera A 2504计算加速器(A代表Accelerator)是一款PCIe 5.0 x16 CXL 2.0设备,集成了16个3.2 GHz Arm Neoverse V2(Demeter)核心。此外,它还集成了四个DDR5-6400通道,支持每个通道最多两个DIMM,并提供了内联压缩和解压缩功能。强大的服务器级Arm CPU核心的集成,不仅扩展了每个核心的内存带宽,还提升了计算能力。

深度学习推荐模型(DLRM)等应用可以充分利用CXL设备中的计算能力。在扩展带宽的同时,还能降低工作负载能耗。这种方法有助于实现服务器内部的解耦,从而优化整体热设计。

Structera X 2404(X代表Expander)将是一款PCIe 5.0设备(单x16或双x8),配备四个DDR4-3200通道(每个通道最多支持3个DIMM)。Structera X 2404还具备内联(解)压缩、加密/解密和硬件支持的安全启动等功能。相比于Structera A 2504的100W TDP,Marvell预计该部分功耗约为30W。其主要用途是帮助超大规模数据中心在增加服务器内存容量的同时,回收DDR4 DIMM(每个扩展器最多6 TB)。

Marvell还推出了Structera X 2504,支持四个DDR5-6400通道(每个通道最多支持2个DIMM,每个扩展器最多4 TB)。其他方面与DDR4回收部分保持一致。
Marvell强调了Structera产品线的独特优势:其在线压缩技术优化了可用DRAM容量,而对DDR4扩展器的每通道3个DIMM的支持则最大化了每个扩展器的DRAM容量,超越了竞争对手产品。此外,5nm工艺的应用降低了功耗,且该产品支持多个主机访问。集成Arm Neoverse V2内核作为CXL加速器的首创,能够将计算任务下放,进而提升系统整体性能。
虽然Marvell已公布Structera产品的规格,但样品预计至少还需要数个季度才能出货。近年来,Marvell的路线图和产品发布一直专注于满足大规模客户的需求,Structera产品线也不例外。大型云服务商急于回收DDR4内存模块,显然渴望获得这款扩展器产品。
CXL目前仍处于发展初期,快速增长阶段尚未到来。然而,随着越来越多支持CXL的主机系统逐步部署,像Structera加速器系列这样的产品在提升服务器效率方面的价值将逐渐显现。
Source:CXL Gathers Momentum at FMS 2024; Ganesh T S; August 19, 2024
FMS 2024关于CXL的讨论会
关键词:内存解耦、内存池化、内存分层、AI优化、数据中心架构、光互连、低延迟
热点主题
4. 新型互连技术:光互连和低延迟内存结构在CXL中的应用,为大规模内存池提供了新的解决方案。
挑战和问题
3. 性能优化:在多主机环境中实现动态内存分配和优化性能仍需进一步研究和开发。
未来趋势
3. 成本效益的提升:通过内存池化和分层,CXL有望在降低数据中心运营成本的同时提高性能。
其他重要信息
2. 开放源代码的推动:开放源代码的管理和编排工具对于CXL的广泛采用和集成至关重要。
CXL相关主题会议:
PDSB1: CXL for Disaggregated Memory & Accelerators in Data Ctrs(参与厂商:Samsung, Microsoft, Meta)
核心内容:讨论利用CXL标准实现内存解耦合,包括软硬件挑战与机遇、远程内存特性与使用,以及数据中心内存连接的未来展望。
CXLT-102-1: CXL Fabric Management(参与厂商:Intel, Jackrabbit Labs, VMware, MemVerge)
核心内容:探讨CXL设备和交换机的开源结构管理和编排层,以及CXL 1.1支持的内存扩展解决方案,旨在优化应用性能。
SPOS-103-1: CXL Member Implementations(参与厂商:Xconn Technologies, Astera Labs, Montage Technology)
核心内容:展示CXL成员公司的具体实现,包括CXL Type 3设备的预启动环境、CXL 2.0在服务器内存和带宽扩展中的应用,以及CXL 2.0结构在可组合内存系统中的部署。
CXLT-201-1: CXL Form Factors(参与厂商:SMART Modular Technologies, Wolley Inc)
核心内容:讨论CXL在嵌入式环境如主板中的集成,以及CXL内存扩展在X86服务器中的最新方案,包括易失性和非易失性内存,并探讨光学CXL对数据中心架构的影响。
SPOS-201-1: NVMe 2.1 Specification, CXL Support & Windows Innovations(参与厂商:KIOXIA, Samsung Electronics, Microsoft, Intel, Solidigm)
核心内容:概述最新NVMe技术和标准路线图,探讨NVMe对CXL的支持,特别是NVMe子系统本地内存(SLM)与CXL的连接,以及Windows对NVMe规范的支持更新。
CXLT-202-1: CXL Memory Pooling(参与厂商:Xconn Technologies, H3 Platform, SK hynix, Rambus)
核心内容:探讨利用CXL 3.1提供的MH-SLD和MLD机制实现内存池化和共享,以优化内存利用率并减少数据移动成本。
CXLT-203-1: CXL Memory Tiering(参与厂商:Western Digital, Samsung Electronics, Intel, Magnition IO)
核心内容:讨论CXL内存中的热数据检测、数据和控制平面分离、内存压缩,以及基于CXL的主动内存分层和近内存加速器的应用场景。
CXLT-301-1: CXL Use Cases(参与厂商:AMD, Objective Analysis, KIOXIA, Meta, Samsung, Google)
核心内容:探讨CXL技术的实际应用,包括其核心目的、潜在用户需求,以及CXL在内存扩展和闪存应用中的潜力,特别是在AI应用场景中的成本效益解决方案。
CXLT-302-1: CXL AI Implications(参与厂商:Samsung Electronics, Marvell, MetisX)
核心内容:讨论CXL技术在AI和数据系统中的变革潜力,特别是在优化数据中心基础设施、提高性能、资源利用率和能效方面的应用。
NETC-303-1: CXL and PCIe Memory Fabrics(参与厂商:NVIDIA, H3 Platform, MemVerge, PCI-SIG, Astera Labs)
核心内容:探讨可组合分解基础设施(CDI)和Sunfish开源管理框架,以及PCIe/CXL有源布线解决方案在扩展GPU集群和低延迟内存结构中的应用。
DCTR-304-1: 新议题:CXL in Context(参与厂商:Microsoft, Objective Analysis, PCI-SIG, Daedalus)
核心内容:专家小组讨论CXL与PCIe、数据库访问、内存和存储的关系,回答观众问题,提供来自内存/存储行业不同视角的专家洞见。
参与企业/组织(34家):
8. Wolley Inc
---【本文完】---
近期受欢迎的文章:
更多交流,可加本人微信
(请附中文姓名/公司/关注领域)





