据业内人士分析,微软当时在芯片上加载了大量的SRAM,从而帮助减少所需的显存带宽,但这似乎并不适用于现在的大语言模型. Maia的另一个值得关注的点便是微软对网络的处理. 就AMD和英伟达而言,它们都有自己的Infinity Fabric和NVLink,用于小范围芯片的高速连接(通常为8个).如果要将数以万计的GPU连接在一起,则需要将...