Los cuantos se refieren a los distintos niveles de cuantificación aplicados a los pesos del modelo, como la cuantificación de 2 bits, 4 bits u 8 bits. Los modelos GGUF también emplean Compute Unified Device Architecture (CUDA), una plataforma de computación paralela e interfaz de prog...