本周,服务器市场迎来了来自Intel、AMD和NVIDIA的路线图更新,以及Ampere最新发布的AmpereOne更新。与此同时,围绕着产品规格公布、产品发布和产品上市日期,市场上出现了不少混淆。尽管如此,可以预见的是,12个月后,32-40核的服务器芯片将不再属于中端产品,而会被视为低端产品。
服务器核心数量预计将在2025年第一季度迎来爆炸性增长。
英特尔: P核心:Emerald Rapids,目前最高可达64核心 P核心:Granite Rapids-AP,预计于2024年第三季度推出,最高可达128核心(可能在Intel Innovation 2024上发布?) P核心:Granite Rapids-SP,预计于2025年第一季度推出,最高可达86核心 E核心:Sierra Forest-SP,目前最高可达144核心 E核心:Sierra Forest-AP,预计于2024年第四季度或2025年第一季度推出,最高可达288核心 AMD: P核心:Genoa/Genoa-X,目前最高可达96核心 P核心:Bergamo,目前最高可达128核心 P核心:Siena,目前最高可达64核心,采用单路设计 P核心:Turin,已宣布将于2024年第四季度发布,最高可达128核心(可能在SC24上发布?) P核心:Turin Dense,已宣布将于2024年第四季度发布,最高可达192核心 NVIDIA: P核心:Grace,预计于2024年发布,配备72个Arm核心/双芯片Grace超级模块则配备144核心。在图中,我们将采用144核心作为标注,但实际上它是72x2的模块配置。更准确地说,它应被视为72核心。 P核心:Vera,预计于2026年发布。NVIDIA尚未透露核心数量或架构细节,但我们预计每个CPU的核心数量将超过72个,并采用Arm架构。 Ampere: 128核心Ampere Altra Max,已于2021年发布 192核心AmpereOne,预计于2024年发布,我们已在2023年见过这款芯片,但STH和Phoronix都未能获得样品,因此我们推测这些部件将在今年公开发布 256核心12通道DDR5 AmpereOne,预计于2025年发布
可以将Grace超级芯片视为 一种跨两个模块的144核心CPU。按此计算,目前市场上已有四家公开厂商的产品达到了或超过了每路128核心的标准。到目前为止,我们已经见过足够多的Grace超级芯片,将其视为公开产品,而AmpereOne我们在一年前也亲眼见过。
因此,当我们假设Turin Dense将在11月宣布,AmpereOne将在2025年达到256核心时,让我们回顾一下从2010年到2025年的公告进度。请注意,NVIDIA和AMD尚未公布2025年的产品部件信息。
截至2024年第二季度公布的2010至2025年双路服务器CPU核心数(按供应商和类型划分)
过去一周,许多人将AMD EPYC Turin的已公布规格与实际出货部分混淆。AMD的发布周期通常比英特尔从产品发布到芯片实际上市的时间更长,但远不如FPGA供应商的延迟。例如,Genoa在2022年11月发布,但真正开始大量出货是在2023年。
值得关注的是,P核的领先地位可能会在2024年第三季度从AMD转移到英特尔。我们推测英特尔创新大会将于9月举行,但具体日期仅标注为第三季度。届时,Granite Rapids-AP不仅将拥有全新的P核,还将带来128个新核心,而此时AMD EPYC Genoa仅拥有96个核心。考虑到MCR DIMM支持、更高的TDP和更多的加速功能,我们预计它在性能上将超越128核的AMD EPYC Bergamo。
以下是我们按年度整理的时间线,展示了历年双路服务器的最大可用核心数。
截至2024年第二季度公布的2010至2025年双路服务器CPU最大核心数(按供应商和类型分类)
我们预计在2024年第四季度(可能是在11月,因为那时正好是2024年超级计算大会)发布AMD的128核P核Turin芯片。同时,我们也期待获得更多关于192核的Turin Dense的更多细节。不过,Turin Dense上市时间应该不会早于2024年第四季度。需要注意的是,类似于之前发布的AMD EPYC Genoa(在SC22大会之前发布)和Bergamo(去年夏天发布),AMD新品发布和实际供货之间通常会存在一定的时间差。不过,与AMD的嵌入式产品线相比,服务器处理器的供货延迟时间通常会短很多。
我们听说英特尔计划在2024年第四季度发布新芯片,但目前在Computex的幻灯片上显示的日期是2025年第一季度。如果AMD在2024年11月发布Turin Dense,那么英特尔在同一季度发布288核的Sierra Forest-AP的可能性相当大。如果这种情况发生,两款产品可能要到2025年而不是2024年才能实现批量出货。芯片公司高管通常有基于关键指标(如年底前发布某些芯片)的奖金结构。一种常见的做法是,即使批量出货在第二年开始,也会在11月末或12月“发布”。
截至2024年第二季度公布的2010至2025年双路服务器CPU最大核心数(按供应商和类型分类,附带AMD和英特尔P核趋势线)
现在让我们来看一看令人兴奋的部分,并回顾一下历史趋势。核心数量正在大幅增长,即使只看英特尔的P核,我们原本预计2024年的P核数量会在80核左右,但实际上下一季度将达到128核。AMD的P核则似乎遵循着既定的发展路线。真正值得关注的是我们称之为AMD Pc核的产品(Zen 4c、Zen 5c)。这些Pc核的数量远远超出AMD既有的趋势线。同样,英特尔也在E核方面下足了功夫,其E核数量的增长速度远远超过了P核的更新速度。
结语
鉴于以上情况,预计在2024年第四季度和2025年第一季度左右,我们将看到AMD推出128核和192核系统,英特尔则推出拥有86、128、144和288最大核心数的产品线。Ampere的最大核心数将达到192至256个,而NVIDIA则拥有72个核心(在144核Grace超级模块中)。
随着这些新产品的发布,拥有24、32甚至64核的系统在现代服务器架构中的核心数量将只有一半或更少。随着我们迈向新架构,预计核心数量将进一步增加。
准备迎接未来一两年内核心数量的爆炸性增长吧。
-----
Nils 2024年6月6日
我注意到的一个问题是,RAM速度似乎停滞不前。从DDR4到DDR5的过渡耗时较长。MCR DIMM和CXL内存或许能带来一些帮助,但目前来看,越来越多的核心在共享相同的带宽。
minosi 2024年6月6日
我认为这种趋势在2025年之后不会持续太久,因为受到冷却解决方案的物理限制,预计会达到一个平台期。低功耗芯片在追求效率的细分市场中或许还能继续存在,但也不会有太大的发展空间。
在这种情况下,我觉得将其与不断上升的TDP(热设计功耗)结合起来看很有意思。不久前,165W的22核Broadwell被认为是“高功耗”产品。
如今,我们有了400W甚至更高的“主流”SKU,有的功耗甚至超过500W。这已经接近1U机箱风冷散热的极限,即使是2U机箱也颇具挑战。
在我看来,除了超大规模计算和高性能计算的定制解决方案外,实际的冷却问题几乎可以确保每路的功耗极限在500W左右。出于同样的原因,IBM Power在过去十年里也没有超过500W的功耗。
David 2024年6月7日
这些变化表明,每机架20kW的新标准功率密度将使机架能够完全填充单路系统。
这引发了一个问题:密度的理想平衡点在哪里?希望STH能在标准测试中加入性能效率这一指标,以支持这些决策。例如,在固定问题基准测试中消耗的总功率量。
Sid Hoffman 2024年6月7日
NVIDIA刚刚展示了一块功率高达15000瓦的单板(HGX B200),因此AMD或英特尔那些“仅”消耗每路400瓦且每板仅运行2P的产品,显然无法与NVIDIA的成就相抗衡。
NVIDIA的展示表明,只要有足够的资金支持,极限是非常高的——远高于目前任何人使用CPU核心所能达到的水平。
Eric Olson 2024年6月7日
在我看来,这些高核心数系统需要一种新的审查和分析策略,重点在于处理器的可扩展性。
我对内存带宽如何随CPU核心数量的增加而变化很感兴趣。有些矛盾的是,总带宽通常会随着更多核心的内存负载而减少。RAM在开启页数上有其限制,当更多处理器尝试读写时会开始翻页。
我对标准的HPCG和HPL基准测试(尤其是HPCG)很感兴趣,这些测试可以评估传统数值任务上的多线程性能。同样,在任务分配给不同数量的核心并让其他核心空闲时进行的扩展性分析也会很有用。
我认为应该有一个与PCIe吞吐量相关的测试。或许可以安装多个GPU,同时在主机和设备内存之间复制数据。对NVMe SSD池的吞吐量测试也会很有意思,特别是那些基于dmcrypt加密块设备的。
Linux内核的构建速度也很有趣,但对于256核心的系统,可能需要测试整个构建农场。例如,在BSDs和各种Linux软件包构建系统中常见的构建世界类型的活动。
某种虚拟机性能的测试也很重要。例如,将一台机器分割成多个8核心的部分,然后在相应的虚拟机中运行相同的基准测试。当在一半虚拟机中运行内存带宽测试时,这对另一半虚拟机中的HPCG性能有多大影响?对我来说,运行哪些基准测试并不如当在不同虚拟机中运行多个副本时它们如何相互影响那么重要。
执行每种任务时的能效也非常关键。
我怀疑ARM系统在核心增多变得繁忙时,性能下降较少,但这只是我的一个猜测。无论如何,我认为增加一些新的测试来展示多核心扩展能力,将为这个网站上的新闻和分析增添不少价值。
Jason 2024年6月7日
大量的核心固然很好,但当你不得不为Windows或VMware许可付费时,情况就不同了。
因此,对于这些用途,这些高核心数服务器在很多情况下都不是首选。
Zibi 2024年6月7日
我认为Genoa发布的延迟不会对Turin的发布产生太大影响。
Genoa的延迟主要有两个原因:
需要时间来解决新平台上的所有问题,特别是关于DDR5内存的。
由于需要等待Sapphire Rapids的发布,供应被人为限制,因为英特尔为新一代服务器平台的市场营销提供了赞助,这些资金在第一季度可用。
Turin是Genoa的直接替代品。它可能只需要固件更新就能正常工作。在最坏的情况下,也只需要更新主板。
Stephen Beets 2024年6月7日
哇,随着服务器处理器核心数即将激增,我好奇16核移动处理器是否也会很快面世。这几乎意味着笔记本电脑也将紧随其后。谁能预测,再过十年,高端游戏笔记本电脑中是否会配备32个核心?真是令人惊叹。
John 2024年6月9日
接下来,我们期待的是软件能够跟上这一步伐。多核处理器已经存在了几十年,但几乎所有软件仍然主要支持单核处理,多核的使用场景仍主要集中在运行虚拟机和容器方面。
关于付费许可的评论,我使用的是免费的Linux版本,配合LXC(在测试模式下使用LXD)用于容器管理,以及libvirt用于虚拟机管理。这些系统在生产环境中已经稳定运行了几年,非常可靠。现在,我几乎完全转向了容器,因为它们在资源占用方面更为轻量。虚拟机只有在需要硬件模拟时才对我有用,否则我发现容器更易于设置和管理,且资源效率更高。在一个拥有196个核心和256GB内存的系统上,能运行多少个容器取决于运行在其上的应用程序,但可能达到数百个。
JayN 2024年6月9日
Intel Tech进行了一次Supermicro的视频采访。他们展示了一台配备双Granite Rapids AP的Gaudi3服务器,并宣布将于9月发布。
Source:Patrick Kennedy; Server Core Counts Going Supernova by Q1 2025; June 6, 2024
--【本文完】---
近期受欢迎的文章:
更多交流,可添加本人微信
(请附姓名/单位/关注领域)





