NVIDIA Grace CPU Superchip The Grace CPU Superchip is composed of two Grace CPU chips connected coherently over NVIDIA NVLink™ Chip-to-Chip (C2C) at 900 GB/s. It packs 144 Neoverse V2 cores into a single module, with server-class LPDDR5X memory that delivers up to 1TB/s of memory ...
Explore NVIDIA LaunchPad Labs With the Grace CPU Get Started With the High-Performance, Power-Efficient NVIDIA Grace CPU In this free lab, get hands-on experience with the NVIDIA Grace CPU Superchip and interact with demos of its memory bandwidth and software environment. ...
Nvidia近期公布了其Grace CPU Superchip的新基准测试结果。这款下一代基于Arm Neoverse架构的芯片,旨在为数据中心提供强劲动力。在相同功耗条件下,其性能竟能达到AMD第四代EPYC Genoa和英特尔第四代Sapphire Rapids Xeon处理器的两倍之高。具体而言,Grace CPU Superchip集成了两块72核芯片,总计拥有144个Arm Neoverse...
NVIDIA Grace CPU Superchip 结合了两个连接超过 900 GB/s 双向带宽 NVLink-C2C 的 NVIDIA Grace CPU,提供 144 个高性能 Arm Neoverse V2 内核和高达 1 TB/s 带宽的数据中心级 LPDDR5X 内存,带纠错码( ECC)内存。 使用NVLink-C2C 互连缓解瓶颈 为了扩展到 144 个 Arm Neoverse V2 内核并在两个 CPU 之...
英伟达的 Grace CPU 基于 Arm 架构,共有 72 个 Arm Neoverse N2 内核。该 CPU 在主板上采用 LPDDR5x 内存,有两种不同的平台: Grace Superchip(含 2 个 Grace CPU,共 144 个内核) Grace Hopper Superchip(含 72 核 Grace CPU 和 Hopper H200 GPU)。
图 1. 与双插槽Milan 7763 CPU相比,NVIDIA Grace CPU Superchip在应用程序性能和节能方面的优势 专为HPC和AI工作负载优化的超级芯片 NVIDIA Grace CPU超级芯片通过集成旗舰双路x86-64服务器或工作站平台的性能,打破了传统的计算平台设计界限。其高效能设计使得在低功率范围内就能实现高达2倍的计算密度,为HPC和AI...
Grace CPU Superchip 的强项在于芯片的功效。Nvidia 的图表显示,在 5 MW 数据中心环境中,Grace CPU Superchip 的能效比竞争对手高出 2.5 倍——它比 AMD EPYC 9654 的能效高出近 2 倍,而 Xeon Platinum 8480+ 的能效是最低的——三人组的效率。 从数字来看,Grace CPU Superchip 由两个处理器和 LPDDR5X ...
英伟达还在GTC大会上首次展示了其Grace Hopper 超级芯片。Superchip在同一个封装上结合了Grace CPU和Hopper GPU,这两个模块就可以装入一个服务器机箱中。▲Grace Hopper(图源:Tom’s Hardware)这种设计的最大优势是使CPU与GPU的结合更连贯协调,提供更低延迟的芯片与芯片之间的连接,其接口速度是PCIe接口的七倍,...
英伟达称,Grace CPU Superchip的FP64峰值运算性能达到了7.1TFlops。相比于AMD基于Zen 3架构的EPYC 7763处理器(64核心)搭建的双路系统,Grace CPU Superchip性能是其1.5至2.5倍,能效是其2至3.5倍。英伟达表示,Grace CPU Superchip旨在为AI和高性能计算应用设计,可以运行所有英伟达软件堆栈和平台,包括了...
AMD表示,其EPYC处理器在包括商业应用、技术计算、数据管理、数据分析、数字服务、媒体和娱乐以及基础设施解决方案在内的各种基准测试中,保持了300多项性能和效率的世界纪录。然而,Nvidia的Grace CPU Superchip主要针对AI训练和推理工作负载进行了优化,所以在某些通用计算性能方面落后于EPYC确实不太意外。