2022年9月15日Arm宣布Arm Neoverse再添新成员,同时推出代号“Demeter”的Neoverse V2和Neoverse E2,再度扩大服务器芯片版图,前者更是由Nvidia Grace CPU率先采用,内置72个Neoverse核心,但当时Arm并未透露Neoverse V2性能提升幅度。今年Hot Chips 2023(第35届),Arm终于公开Neoverse V2技术细节,并以SPEC CPU整数测...
因此单芯片和单线程性能是Arm Neoverse十分看重的一项性能指标。在现有市场上,使用 Arm Neoverse V1 核心的 AWS Graviton3 可提供最高的单线程性能。在Arm同合作伙伴打磨Neoverse V2的过程中,也有客户表示希望能够提升云工作负载的性能,在平衡功耗和面积的同时继续推进单线程性能。与Neoverse V1相比,Arm尚未给出Neo...
而且,随着异构计算的兴起,Arm 在高性能计算、AI/ML算力基础设施中的影响力正在扩大——或许,随着Neoverse V2 推出和英伟达加入战团,Arm 在服务器 CPU 领域有望从一个参与者变为领先者。早在2021年,英伟达就对外介绍了基于 Arm Neoverse 架构的数据中心专属CPU —— NVIDIA Grace,拥有72个核心。Grace CPU超级...
NVIDIA Grace CPU 的核心是 Arm Neoverse V2 CPU 核心。Neoverse V2 核心经过优化,为每个线程提供行业领先的性能,同时提供比传统 CPU 更高的能效性。 NVIDIA Grace CPU 超级芯片将多达 144 个高性能 Arm Neoverse V2 核心与可扩展向量扩展版本 2 (SVE2) 4x128b 单指令多数据 (SIMD) 管线每个核心集成,从而提供...
图4. NVIDIA Grace CPU 的 Arm Neoverse V2 内核 Arm架构 NVIDIA Grace CPU Neoverse V2 核心实现了 Armv9-A 架构,它将 Armv8-A 架构中定义的架构扩展到 Armv8.5-A。为 Armv8.5-A 之前的 Armv8 架构构建的任何应用程序二进制文件都将在 NVIDIA Grace CPU 上执行。这包括针对 Ampere Altra、AWS Graviton...
从英伟达官方数据来看,NVIDIA Grace 超级芯片总共提供了 144 个物理核心(每个芯片 72 个 Arm Neoverse V2 核心),支持 960 GB 的 LPDDR5X 内存,原始带宽最高可达 1 TB / s,总功耗为 500W,其他规格还包括 117 MB 的 L3 缓存和 58 个 PCIe Gen5 通道。
为了实现最大的工作负载加速,快速高效的 CPU 是系统设计的重要组成部分。 Grace CPU 的核心是 Arm Neoverse V2 CPU 内核。 Neoverse V2 是 Arm V 系列基础架构 CPU 内核中的最新产品,经过优化可提供领先的每线程性能,同时与传统 CPU 相比提供领先的能效。
NVIDIA Grace 是基于ArmNeoverse V2 IP的第一款重磅产品。目前还没看到 NVIDIA Grace 晶体管规模的相关资料,不妨先参照两位“前辈”的数据。据推测基于Arm Neoverse V1 的 AWS Graviton 3是550亿晶体管,对应64核、8 通道DDR5内存;据推测基 Arm Neoverse N2的阿里云倚天710是600亿晶体管,对应128核、8 通道DDR5内...
根据定义,我们知道Grace用的也不是Arm在“Zeus”V1核心中使用的双256位SVE向量,因为其并不属于SVE2向量。所以根据猜测,我们认为英伟达很可能会使用Arm接下来发布的“Poseidon”Neoverse N3和V2核心(这是我们按命名方式推断出的名称)来创建Grace核心及其向量。Grace的核心很可能采用双128位或双256位向量,但使用双...
依据NV官网白皮书可知,Grace CPU采用的是Neoverse V2公版核。Neoverse V2公版核是面向服务器端的,能耗...