Groq回归到第一原则,认识到机器学习工作负载是关于简单数据类型和操作上的大规模并行性。通过消除通用硬件甚至像局部性这样的概念,该设计最大化了吞吐量和效率。 这得益于Groq的编译器,它位于诸如TensorFlow之类的软件框架和硬件之间。编译器分析和优化神经网络图,将其定制和映射到底层架构以加速执行。它将计算分解为最...