英特尔至强W-3400和W-2400处理器
在过去的几年里,英特尔一直专注于其消费者酷睿台式机CPU,如果你认为英特尔已经忘记了他们的至强高端工作站处理器阵容,这是可以理解的。在英特尔台式机级至强W-1x00系列产品实际上已经退役,而Intel当前一代用于服务器的大型芯片(基于Sapphire Rapids的第四代Xeon Scalable系列)也一再推迟,过去几年英特尔在工作站领域并没有太多的声音。但是现在针对服务器的Sapphire Rapids终于推出了,英特尔产品路线图中的僵局终于被打破了,英特尔终于可以继续将他们最新的芯片集成到新的工作站中。近期,英特尔宣布了他们的第一个从上到下更新的工作站处理器,至强W-3400和至强W-2400系列。针对英特尔大致划分为专家工作站和主流工作站的市场,这些芯片系列旨在用于高性能工作站的设置,特别是那些需要更多CPU内核、更多PCle通道、更多内存带宽或三者结合的设置。基于与英特尔最近推出的服务器相同的Sapphire Rapids芯片,新的至强W SKU将降低许多(但不是所有)定义Intel领先服务器芯片的功能,以及更适合在高性能工作站中使用的新芯片组(W790)和主板。与新的至强可扩展部件一样,这里的三大新增功能是转向英特尔的Golden Cove CPU架构——具有所有的IPC和时钟速度优势——以及对DDR5内存和用于I/O连接的PCle 5的支持。所有这些都是对构成英特尔之前产品堆栈的Cascade Lake和Ice Lake部件组合的重大升级。与此同时,与英特尔现有的台式机处理器阵容相比,这些都是2021年底在Alder Lake(第12代酷睿)上率先推出的功能,专注于工作站的Xeon W部件将在更大程度上进行构建。
至强W-3400系列(Sapphire Rapids-112L)将从12核到56核不等,且都包括112个PCle 5.0通道,支持8个内存通道最多4 TB的DDR5-4800内存、ECC内存(仅RDIMM)、Intel vPro和Intel标准可管理性(ISM)。7个W-3400 SKU(X系列)中的4个得益于解锁成熟,因此正式支持超频。与此同时,Xeon W-2400系列(Sapphire Rapids-64L)将提供6到24个CPU内核,搭配减少的64通道PCle 5.0连接,支持多达2TB的DDR5-4800内存跨四个内存通道,以及所有其余的Xeon W配件,如ECC内存。
新的至强W系列将取代英特尔之前的至强产品。虽然英特尔确实在2021年推出了一些基于Ice lake的至强产品—至强W-3300系列—这些是对英特尔至强阵容的补充更新,针对需要额外CPU内核或PCIe带宽的特定客户。对于其他人来说,即将推出的至强W系列产品,即大约2019年的W-3200和W-2200系列,都是基于英特尔的Cascade Lake芯片的,这本身是对英特尔Skylake部件的适度更新。因此,推出至强W-3400/2400系列对英特尔工作站阵容的重要性不言而喻:这是英特尔至强系列的一次重大升级。
新的至强W系列将与AMD的Threadripper Pro 5000 WX竞争,后者基于AMD的Zen 3架构。最近的Threadripper Pro于去年春天推出,从那时起,AMD在CPU性能方面基本上占据了市场的主导地位,这要归功于内核数量和IPC方面的显著优势。即使有了他们的新部件,英特尔在技术上仍然没有完全缩小内核数量的差距,但IPC、内核数量和时钟速度的提升应该有助于在整体CPU性能方面达到公平的竞争环境,但具体程度还有待观察。
英特尔至强W-3400系列:“专家”平台,最多56核,112个PCIe 5.0通道,8通道内存
英特尔至强的W-3400和W-2400系列工作站处理器基于英特尔的Golden Cove CPU架构,与英特尔的Alder Lake(第12代)台式机处理器相同。W-3400系列代表了英特尔第4代至强Scalable Sapphire Rapids高级工作站产品的首要产品线,总共有7个SKU。至强W-3400的范围从普通的12核/24线程部件(w5-3425)到备受期待的56核/112线程部件,旗舰w9-3495X。
特别是至强W-3400系列,基于英特尔Sapphire Rapids Extreme Core Count (XCC)芯片,该芯片目前用于英特尔高端至强服务器部件。XCC芯片依赖于4个计算模块,使用英特尔最新的EMIB互连连接在一起,这是至强工作站处理器的第一个互连。
Sapphire Rapids XCC芯片的各个区块都是相同或对称的,因此每个磁片提供整个芯片四分之一的CPU内核、I/O和内存通道。因此,每个tile最多可以提供32个PCle 5.0通道(w9-3495X上总共有112个),而每个tile还包括两个内存控制器,在W-3400系列上提供8通道内存。
专注于至强W-3400系列的高端SKU Intel Xeon w9-3495X,它与英特尔上一代巨无霸至强W-3175X有着类似的共鸣,后者于2019年发布,并提供了超频的官方支持。与基于skylake的至强W-3175X一样,最新的至强w9-3495X也有用于超频的解锁乘法器。
英特尔至强w9-3495X有56个核,112个线程,不像英特尔的台式机处理器,每一个都是性能(P)内核。此外,还提供了总计105 MB的英特尔智能L3缓存,官方支持8通道DDR5-4800 ECC RDIMM内存,最大容量高达4 TB。
w9-3495X的TDP额定值相当高,为350瓦。在实际操作中,启用英特尔Turbo Boost和Turbo Boost Max 3.0技术的情况下,满载时的峰值功耗可能会高得多,特别是在56-unlocked内核上。虽然它的56个Golden Cove内核的基本频率为1.9 GHz,但它的turbo频率高达4.6 GHz,而且由于turbo Boost Max 3.0(英特尔最青睐的核心技术),少数内核可以进一步提高到4.8 GHz。
至强W-3400系列的其他SKU从36核到12核不等,如w9-3475X (36C/72T)和w5-3425 (12C/24T)。最终,所有至强W-3400系列都提供相同数量的DDR5内存通道和PCIe通道,因此区分不同SKU的是CPU核心数、最大内存时钟速度、L3缓存,当然还有价格。
与此同时,如前所述,四款至强W-3400 SKU——w9-3495X、w9-3475X、w7-3465X和w5-3435X——都是“unlocked”处理器。这是英特尔几年来在至强W系列上没有提供的功能,并带来了一些有趣的现象。除了最基本的改变CPU时钟速度乘法器的能力外,“unlocked”处理器还可以调整其AVX和AMX偏移量,以防止处理器在沉重的SIMD负载下下降太多。最后,它们还为网状互连提供了一些调优选项,尽管英特尔没有说具体可以在这里进行调整。
英特尔至强W-3400系列的起售价为1189美元,Intel提供每单位1K的定价(托盘),而不是单独购买的零售SKU。至强w9-3495X的1KPU价格为5889美元,这使得顶级SKU和后续的每个W-3400 SKU比上一代的至强W-3300芯片更贵,但它们确实具有更多的内核,更快的频率,更多的L3缓存,并支持DDR5-4800。
值得指出的是,英特尔所有的W-3400 SKU都支持高达4TB的八通道DDR5 4800 ECC内存,即使是最底层的SKU,即w5-3425 (12C/24T)。因此,对于那些需要大量DRAM,但不一定需要大量CPU内核的系统,可以在至强的产品系列中找到合适的选择。但是,请注意,实际达到4TB需要每个通道使用2个DIMM(DPC),这需要回退到DDR5-4400内存速度。
由于CPU提供112个PCle 5通道(芯片组提供更多通道),至强W-3400芯片可以支持大量的I/O设备。这相当于7个独立的x16显卡,或高达28个x4高速存储设备。这一点,以及内核数和内存通道,是与较低级别的至强W-2400系列的主要区别之一,对于那些被英特尔早期至强W部件的一小部分I/O带宽所困扰的英特尔平台用户来说,应该是一个受欢迎的特点。
有趣的是,112个PCle 5通道实际上比英特尔Sapphire Rapids服务器部件提供的要多。至强可扩展阵容最多只有80个通道。造成这种差异的原因是英特尔仅为其服务器部件启用了7个根端口中的5个,还有2个端口(32个通道)未使用。然而,由于工作站Sapphire Rapids部件不需要分配任何引脚来支持英特尔的多插槽UPI链路,因此Intel似乎已将这些引脚分配给为工作站部件提供额外的PCIe通道。值得注意的是,英特尔在这里为服务器和工作站芯片使用了相同的插槽——LGA 4677——但随着引脚的变化,它们可能不兼容。
同时,在英特尔的另一个首次发布活动中,该公司表示,他们将支持RDIMM的DDR5 XMP 3.0内存超频配置文件。关于这个公告的细节非常少,但从高层次上讲,这将为运行在W790上的未锁定处理器用户提供尝试从内存中挤出更多空间的选项。一般来说,内存超频和RDIMM坚如磐石的稳定性是截然相反的目标,因此,看看这在市场上的表现会很有趣。DRAM的时钟速度可能高于DDR5-4800,但注册的时钟驱动器(RCD)可以吗?
此外,所有这些关于RDIMM的讨论都是有意的:与以前的Xeon W平台相比,Sapphire Rapids Xeon工作站平台将不支持UDIMM。这是DDR5规范的一个限制,它要求UDIMM和RDIMM使用不同的电压。UDIMM为5伏,RDIMM为12伏,因此不兼容。如果您曾经有机会亲眼看到DDR5 RDIMM,您可能会注意到它们的键控与UDIMM不同,因此它们在物理和电气上都不兼容。
这意味着用户将不得不将这些处理器和W790主板与更昂贵、但质量更高的ECC支持DDR5 RDIMM配对。对于羊毛染色工作站用户来说,这不太可能是一个问题,甚至不是一个能引起注意的差异,但任何希望以低廉的价格构建HEDT风格的系统或低端工作站的人都会发现,Xeon W系统的最终价格将高于W-3200/2200系列的价格。
加速计算:AMX和CXL占据优势,但大多数领域特定加速器无法做到
对于Sapphire Rapids Xeon芯片和相应的服务器部件,英特尔推出了一系列不同的加速块和其他加速器相关功能。在矩阵扩展(AMX)、各种特定领域的硬件加速块以及对外部加速器的Compute eXpress Link(CXL)的支持之间,英特尔最终将大量的精力投入到了非CPU任务中。这意味着,特别是针对其Xeon Scalable服务器部件,Intel选择依靠这些加速器功能,在所有芯片中启用一个DSA引擎。仍然不支持QAT、DLB和IAA。这取代了原始的x86 CPU性能,以使硬件与其前身及其竞争对手区别开来。
但对于他们的工作站部分,事情就简单多了,不管是好是坏。简而言之,并非所有英特尔的加速计算功能都在至强W-3400/2400系列中提供。那么,让我们来快速浏览一下哪些Sapphire Rapids功能适合Xeon W。
也许最关键的是,英特尔的高级矩阵扩展(AMX)确实做到了这一点,至强W-3400/2400系列完全支持它们。AMX是英特尔的矩阵数学执行块,类似于张量核和其他类型的矩阵加速器,这些都是用于有效执行矩阵数学的超高密度块。AMX不是一个专用的加速器,而是CPU核心的一部分,每个核心都有一个块,这允许AMX代码与x86(和AVX)代码混合,这也是Sapphire Rapids使用超密集代码时时钟速度偏移为负的原因。
AMX是英特尔在深度学习市场上的重头戏,通过使用更密集的数据结构,超越了他们目前使用AVX-512所能实现的吞吐量。虽然英特尔有AMX支持的GPU(英特尔数据中心Max GPU系列),甚至超越了这一点,但对于Sapphire Rapids,英特尔正在寻求解决需要AI推理的客户群体,这些推理发生在非常接近CPU内核的地方,而不是在一个不太灵活,更专用的加速器中。新的AMX单元还支持Bfloat16,确保英特尔的每一层加速计算块(AVX和AMX)都支持这种用于深度学习的常见中等精度浮点格式。
Sapphire Rapids的一个新的特定于领域的硬件加速器块,数据流加速器(DSA)也获得了成功。此块用于卸载/加速某些操作,如数据复制和简单计算,如计算CRC32。DSA块可用于所有至强W SKU。
然而,你不会发现提到其他的英特尔加速器模块,如英特尔动态负载均衡器(DLB),英特尔内存分析加速器(IAA)和英特尔快速辅助技术(QAT)。尽管事实上,这些加速器都是蓝宝石激流硅片上相同功能块的一部分。这些加速器块主要都是针对服务器的,所以没有看到它们也就不足为奇了,但这确实意味着任何为服务器创建原型代码的人,如果要使用它们的功能,都需要在实际的至强可扩展服务器上进行测试。
最后,虽然Intel的Xeon W规格表中没有CXL支持,但Intel已向我们证实,事实上这两个系列都支持CXL。用于主机到设备连接的基于PCIe标准的内置技术已经出现了几年,Sapphire Rapids是第一个支持该技术的Intel CPU平台。与其他一些功能一样,它主要用于服务器,因此将其引入工作站的动力较小。尽管如此,英特尔还是为希望利用其功能的用户提供了支持。
英特尔至强W-2400系列:最多24核,64个PCIe 5.0通道,适用于主流工作站
再往下看,我们有Xeon W-2400系列(Sapphire Rapids-64L),它被设计为“主流”工作站平台。Xeon W-2400提供的PCIe通道数量比W-3400 SKU的一半多一点,有64个PCIe 5.0通道可用,内存通道数量减少了一半,达到四个通道。因此,这意味着W-2400系列的价格低于其更强大的W-3400系列,入门级Xeon w3-2423的价格低至359美元。
总体而言,至强W-2400系列将从6核到24核年不等。英特尔在这里使用了他们的Sapphire Rapids Medium Core Count (MCC)芯片,与XCC芯片不同,它是传统的单片芯片。这意味着不需要花哨的EMIB封装来构建芯片,相反,英特尔只需要制造一个相当大的芯片。
至强W-2400系列的高端产品是w7-2495X,它具有24核/48线程,45 MB的Intel Smart L3缓存和225瓦的TDP。英特尔还有三个w5系列SKU,最后是三个w3 SKU。
与专家级同类产品一样,至强W-2400系列在整个系列中提供一致的内存和I/O配置。这是因为来自CPU的64通道PCIe 5和四通道DDR5内存,允许总内存最大为2TB。此外,只有w5和w7 SKU提供完整的DDR-4800内存速度;w3部件都以DDR4-4400为上限。在2个DPC配置中,所有SKU都下降到这个速度,因此出于任何原因构建2TB系统都可以实现。
像至强W-3400系列一样,W-2400系列中也有一些unlocked X SKU,包括顶级的w7-2495X。其他unlocked乘数的SKU包括具有20个内核和37.5 MB L3缓存的w7-2475X,以及两个w5 SKU(w5-2465X 16C/32T和w5-2455X 12C/24T)。然而,我们不会发现任何unlocked w3部件,因为所有三个入门级w3 SKU都已完全锁定。
Intel W790芯片组:支持Xeon W-3400和W-2400平台
英特尔所有至强W-3400和W-2400系列SKU均受益于英特尔vPro和英特尔的标准可管理性(ISM)技术。Xeon W-2400和W-3400系列都由相关的W790芯片组支持,但CPU特定的功能(如可用的内存通道和PCIe通道的数量)取决于处理器本身。
W790芯片组的一些主要功能包括处理器和芯片组之间的直接媒体接口(DMI) 4.0 x8链路,以及多达16个PCIe 4.0通道和支持多达8个SATA 3.0端口。W790还支持5个USB 3.2 Gen2x2 (20Gbps)端口,包括一个Intel Wi-Fi 6E PHY,并可支持2.5 GbE控制器。
虽然没有提及新的主板,但预计将有来自华硕、GIGABYTE、超微和ASRock等供应商的英特尔W790主板。戴尔、联想和超微等系统集成商预计将在DIY构建商获得解决方案和系统之前优先提供解决方案和系统。
ASRock在发布前大概介绍了其W790 WS模型,该模型具有20+2相供电,双10 GbE控制器,并支持8个插槽中多达2 TB的DDR5-4800 ECC RDIMM。虽然该板同时支持至强W-3400和W-2400处理器,但该板仅支持四通道内存。
关于最新一代主板,值得一提的是W790主板的成本可能高于用于支持至强W-3300系列(Ice Lake)的基于c621的主板。因为W790单板有4个DDR5内存通道和48个PCIe 5通道。虽然我们预计会看到不同级别的主板设计,具有不同的插槽和I/O配置,但英特尔还没有具体说明这些主板是否支持这两个系列,或者供应商是否会围绕Xeon W-3400和W-2400系列设计特定的主板。
英特尔的至强W-3400和W-2400处理器已经开始接受行业合作伙伴的预定,系统预计将在3月初部署。英特尔对Xeon w3-2423的预期和建议定价为359美元起,Xeon w9-3495X的预期和建议价格为5889美元。