AMD 的 EPYC 9004 Genoa CPU 已经在 Phoronix 的各种 AVX-512 基准测试中进行了测试,看起来最新的 Zen 4 部件在保持相同功率的同时大幅提升了性能。
AMD EPYC 9004“热那亚”CPU 在启用 AVX-512 的情况下以相同的功率提供 35% 的性能提升
AMD EPYC 9654 处理器是一系列新服务器处理器之一,这些处理器在发布时就被誉为“地球上最快的服务器 CPU ”, Phoronix的Michael Larabel以令人印象深刻的方式对新的第四代 Genoa CPU 进行了测试Ubuntu 22.10 操作系统环境中的 130 个基准测试。
这些基准测试没有遗漏任何东西——性能、温度、频率限制等都经过了测试,以了解新的 EPYC(霄龙)处理器如何处理最近添加到这个新处理器系列中的 AVX-512 的实现。
AMD Zen 4 引入了AVX-512 指令集,该指令集首先由 Intel 提出,并整合到该公司的 Intel Xeon Phi x200、Skylake-X 和最近的 Xeon Scalable 处理器中。AVX-512 指令集中的每个扩展都必须独立执行。最近,AVX-512 已在多个实例中使用,例如提高性能。据称,与 AMD 合作后,AVX-512 将在处理视频、分析金融方程式和模拟科学进步方面提高性能和管理数据。
Larabel 已经测试了其他带有 AVX-512 active 的 AMD 处理器,例如 Ryzen 9 7950X 和 EPYC 9004 系列。在他之前的测试中,AVX-512 对这两款处理器都非常有利,显示出更高的效率,同时保持较低的功耗和时钟频率,尤其是在大型工作负载中。他在最近的测试中使用了 AMD EPYC 9654 2P 处理器,在 Ubuntu 22.10 中激活和停用了 AVX-512,该版本使用当前的 Linux 内核 (v6.1)。
在他围绕人工智能的基准测试中,启用 AVX-512 的性能比停用指令集的性能高 35%(在某些情况下甚至更高)。AI 工作负载中的处理器功耗几乎可以忽略不计,但在处于活动状态时,AVX-512 实例通过保持较低的功耗水平仍然更好。
一组与 AI 相关的基准测试,Neural Magic DeepSparse 1.1,确实在新的 AMD EPYC 9654 处理器中显示了 AVX-512 的可喜结果,但它不像其他一些机器学习工作负载测试那样引人注目。Neural Magic DeepSparse 是“一种稀疏感知推理运行时”,可在处理器和 API 上提供图形处理性能,从而实现机器学习的集成。您可以在此处了解更多信息。
另一个基于 AI 的基准测试,移动神经网络 2.1,是一系列基准测试的“奇怪的鸭子”,因为 AVX-512 实施表现更差,并且仅在模型“Inception-v3”的特定测试中。Larabel 提到软件本身可能是催化剂,但没有明确的答案。
加密基准测试和腾讯的 NCNN 模型很受欢迎,因此作者转而使用专注于 AVX-512 优势的英特尔专用软件。同样,AMD EPYC 在支持 AVX-512 的测试中表现出色。在运行 Intel Open Image Denoise (v1.4.0) 基准测试时,有两个实例显示的结果可以忽略不计,但 Larabel 显示使用活动的 AVX-512 时功耗仍然较低。
Larabel 现在结束了他的测试,但指出与当前的英特尔至强可扩展处理器相比,AMD 的 Zen 4 架构继续为新一代显示出有利的结果,看起来即使是即将推出的 Sapphire Rapids Xeon 芯片也很难与 Genoa CPU 竞争.