Chat glm36B支持在CPU、GPU和Apple的M系列芯片上运行。 在CPU上运行至少需要32G内存,但运行效率较低。 Apple的M系列芯片至少需要13GB内存。 推荐在GPU上运行以提高效率,特别是对于推理和微调任务。 实际部署在单卡环境下进行,使用NVIDIA RTX 4080 GPU。