但从HGX H20的硬件SPEC综合来看,几乎把<BIS性能密度禁令>中严格限制的算力门槛以外的指标全部拉满了;显然是定位为一颗训推通用的处理器,只是针对LLM大模型业态而言,实际使用H20做千卡分布式训练,虽然大部分有效利用时间都是GPU上的矩阵乘加计算的时间,通信和访存的时间占比缩小,但毕竟单卡算力规格较低,超限度的千卡...