为此去年底AMD推出了新的AI芯片,宣称在性能方面可以直追NVIDIA的高端AI芯片H100,而价格方面也更便宜,这自然让NVIDIA着急,NVIDIA可不希望有竞争对手能超过它,这次NVIDIA推出的B100、B200大幅度提升性能,数倍于AMD的AI芯片,毫无疑问NVIDIA仍然是最强的AI芯片王者。中国的AI芯片企业也曾宣称他们的AI芯片在性能方面可以...
综合H100 中所有新的计算技术进步的因素,H100 的计算性能比 A100 提高了约 6 倍。首先是 H100 配备 132 个 SM,比 A100 的 108 个 SM 增加了 22%。由于采用新的第四代 Tensor Core,每个 H100 SM 的速度都提升了 2 倍。在每个 Tensor Core 中,新的 FP8 格式和相应的 Transformer 引擎又将性能提升了 2...
然而,Nvidia 可能更倾向于销售基于 Blackwell GPU 的服务器,而不是单独销售芯片,特别是考虑到 B200 NVL72 服务器预计每台成本高达 300 万美元。 汇丰银行估计,Nvidia 的“入门级”B100 GPU 的平均售价(ASP)将在 30,000 美元至 35,000 美元之间,至少在 Nvidia H100 的价格范围内。据报道,功能更强大的 GB200 ...
H100不具备旋转对对称性,而双Die的B100仍需支持 GH200 SuperChip 超级芯片,因此B100可能由两颗异构 Die组成。按照不同的长宽比采用“IO边缝合的方式”B100 的面积达到3.3到3.9倍的Reticle面积,小于当前TSMC CoWoS先进封装能够提供的4倍Reticle面积的能力极限。计算 Die 之间互联可以复用 NVLink C2C 互联技术,既利用 ...
同时,英伟达也在持续推出新的芯片,以期望不断拉开与后来者的距离。目前,英伟达已经公布了其下一代AI芯片B100的消息,设计性能要比H100快3倍。 所以,虽然超越英伟达的机会仍然存在,这个世界也从不缺少挑战“霸权”的勇士,但这个任务显然还很漫长。
NVIDIA 的 Blackwell 架构将拥有迄今为止最大的芯片,拥有 1040 亿个晶体管。Blackwell GPU(B100 和 B200)采用双芯片组设计,与 Hopper 相比有了重大飞跃。例如,B100 的晶体管数量比 H100 多 1280 亿个,AI 性能是 H100 的五倍。 NVIDIA 的 Blackwell GPU 包含 2080 亿个晶体管,采用定制的 TSMC 4NP 工艺制造。
1. H200是基于H100的基础上从HBM3升级到HBM3e,提升了内存的容量和带宽。 2. B100将采用双Die架构。如果采用异构Die合封方式,封装基板面积将小于当前先进封装4倍Reticle面积的约束。而如果采用计算Die和IO Die分离,同构计算Die和IO Die合封的方式,封装基板面积将超出当前先进封装4倍Reticle面积的约束。如果采用计算Di...
B100 GPU架构推演 以H100 GPU芯片布局为基础,通过先进的封装技术将两颗类似H100大小的裸Die进行合封,可以推演B100 GPU架构。B100 GPU有两种“双Die”推演架构:IO边缝合和HBM边缝合。 “HBM边缝合”利用H100的HBM边进行双Die连接,这种方案的优点在于,它可以使得IO可用边长翻倍,从而有利于扩展IO带宽。
NVIDIA 的 Blackwell 架构将拥有迄今为止最大的芯片,拥有 1040 亿个晶体管。Blackwell GPU(B100 和 B200)采用双芯片组设计,与 Hopper 相比有了重大飞跃。例如,B100 的晶体管数量比 H100 多 1280 亿个,AI 性能是 H100 的五倍。 NVIDIA 的 Blackwell GPU 包含 2080 亿个晶体管,采用定制的 TSMC 4NP 工艺制造。