
2025 年 3 月,英伟达发布了 DGX B300 AI 加速计算平台。
2025 年 3 月,英伟达发布了 DGX B300 AI 加速计算平台。2025 年 5 月,英特尔发布了三款全新英特尔至强 6 性能核处理器,其中一款 6776P 被用作是 DGX B300 的主控 CPU,这款处理器究竟有什么特殊之处呢?
AI加速系统为何看重CPU主控能力?
作为造价极高的 AI 加速系统,DGX B300 可以不计成本地选任何 CPU,只要它能充分的发挥整套系统的性能。选择英特尔至强 6 作为默认推荐的 CPU 配置,这意味着它能很好地满足需求,也意味大量 AI 加速系统会搭载这款英特尔处理器。
在 AI 服务器中,CPU 其实很重要,它不仅要运行操作系统,还要负责协调 GPU 的工作、管理系统资源,支撑整个 AI 系统稳定运行。此前,来自 IDC 的数据显示,有 73% 的 GPU 加速服务器都在使用英特尔至强处理器作为主控 CPU。
从技术细节看,主控 CPU 需要和 GPU 协同工作。因此,CPU 在 I/O、核心性能、内存(容量和带宽)、CPU 上的预处理或卸载(offload)能力、RAS 特性,以及对于多种形态的 AI 服务器架构的支持,都会影响整个 AI 系统的性能。
英特尔至强6:理想主控CPU的优势解析
首先,我们从产品角度来简要介绍一下,为什么英伟达会选择英特尔至强 6 处理器作为推荐配置?
首先,在 I/O 部分,英特尔至强 6 性能核处理器最多支持 96 个 PCIe 5.0 通道,相较于第五代至强可扩展处理器增加了 20%。像 DGX B300 这种双路服务器系统,PCIe 总数能来到 192 个。
在 CPU 核心部分,英特尔至强 6 支持最多 128 个性能核心,相较于上代直接翻倍。平均单核性能提升 20%,平均每瓦性能提升高达 1.6 倍,同等性能水平下平均可以节省 30% 的 TCO。并且还具备卓越的单线程能力。
在内存部分,英特尔至强 6 支持 DDR5-6400MT/s、最高达 8800MT/s 的 MRDIMM 内存以及 CXL 技术,可提供更大内存带宽和更大内存容量。其中,英特尔至强 6 性能核还将内存通道数从 8 个提升到了 12 个,整体内存带宽和内存容量都有了大幅提升。
英特尔至强 6 可以更好地支持在 CPU 上做预处理和卸载,这一部分会用到高级矩阵扩展(AMX)。因为现在的 MoE 模型越来越多,在 CPU 上做一些卸载工作现在变成了很热点的话题,英特尔和很多合作伙伴也在进行积极探索。
英特尔至强 6 支持专门的 RAS(Reliability, Availability, Serviceability)功能,它可以减少系统宕机时间。这次英伟达的 DGX B300 采用的是双路服务器,丰富的 RAS 特性支持可以显著减少宕机时间,提高系统资源的利用率。
因此,不管是英伟达的 DGX(英伟达的一体化平台)、MGX(英伟达开放给合作伙伴的模块化服务器设计规范),还是 DC-MHS 全球标准(英特尔牵头的模块化标准架构),英特尔至强 6 都可以灵活支持。
2025 年 5 月下旬,英特尔发布了三款新的性能核处理器,分别是 6962P、6776P 以及 6774P。其中,6776P 被用作英伟达的 DGX B300 系统的主控 CPU,为什么要选择这款处理器呢?
为什么选英特尔至强6776P做DGX B300的主控CPU?
此前,推荐作为英伟达 DGX 主控的 CPU 型号是 6767P,这是一个 64 核的处理器,它的基础频率是 2.4GHz,全核睿频是 3.6GHz,最大睿频来到了 3.9GHz。
6776P 也是一块 64 核的处理器,基础频率是 2.3GHz,全核睿频是 3.6GHz,最大睿频是 3.9GHz。得益于英特尔创新的 PCT 技术,最高主频提升到了 4.6GHz,更高的主频可以让数据更快传递到 GPU,从而提高 GPU 在高强度工作负载下的性能。
PCT 指的是英特尔 Priority Core Turbo 技术,它让部分核心成为高优先级的核心,相应的,其他的核心就是低优先级。搭配英特尔 Speed Select 睿频频率(Intel SST-TF)技术,让高优先级的核心以更高的主频工作。
英特尔官方用这种方式把少数核心拉到更高频率,意味着用户可以不用额外考虑散热等问题,还能保证可以长时间稳定运行。
英特尔此次发布的 3 款支持 PCT 的至强处理器当中,6774P 是单路 CPU,6776P 和 6962P 是双路 CPU。为了获得更高的 4.6GHz PCT 频率,又因为要支持双路服务器,所以要选 6776P。
双路的 DGX B300 可以提供 176 条 Gen 5.0 通道。内存部分,在 DGX B300 系统中,它只支持 8 个内存通道,为了追求更大容量,这里采用了 2 DPC 的设置,每个通道配置 2 个 DIMM,双路理论最高容量为 8TB,可以更好地应对未来更大数据规模。
上方在 AI 系统中使用至强 6 为主控 CPU 的示意图中,有两块 CPU 带着 8 块 GPU,8 块 GPU 之间通过 NVLink 互连,两块 CPU 之间通过 UPI 互连。
6776P 最多支持 8 个 PCT 核心,也就是让 8 个核心运行在高频率,用户可以根据需求选择 8 个、6 个、4 个或 2 个。
PCT 核心的设置也比较简单,一种是在 BIOS 里进行设置,把一定数量的核心设定为 PCT 高核心。另外一种是通过 SST 的 TF 工具进行设置,在系统运行时可以动态配置调整,这种方式更便捷。
从英特尔专家的介绍中了解到,这三款处理器都是英特尔至强常规产品路线图中的一部分,三款产品都是可以面向所有客户开放的标准产品,而不是为特定用户特定场景定制的特殊方案。
对于选择 DGX B300 的用户来说,6776P 已是默认选项。如果是 MGX 用户,则可以使用此前已发布的 6767P。理论上,英特尔至强 6 的所有型号都支持作为 AI 加速计算系统的主控 CPU,用户在选用时可以根据实际需求作出选择。
来源:互联网