我们假设L3.1-70B-Q4 GGUF 格式的权重大概42GB,然后内存带宽简单换算下(8000×256)÷8=256,000MB...
“including but not limited to theA100, A800, H100, H800, L40, L40S, and RTX 4090”...
部分信息没有披露,所以尚不做判断 资料来源:英伟达 datasheet,特斯拉官方网站,谷歌官方网站,申万宏源研究 3)预计带宽的增强是后续关键能力,因为在计算/存储/读写 IO 中,瓶颈在带宽。后续也会论述。区别是 55、,有些处理器是较难模仿的,尤其是特斯拉 Dojo。原因是不同处理器的设计架构是“架构向后兼容”的。