在之前的篇章《AI模型部署:一文搞定Triton Inference Server的常用基础配置和功能特性》,《AI模型部署:Triton Inference Server模型推理核心特性和配置汇总实践》,我们已经介绍了Triton的基础功能以及推理阶段的核心配置方法,有了前文的基础,本篇使用Triton Inference Server来实践部署大语言模型ChatGLM3-6B,同样以Python作为...