- glm4-chat gguf格式 - 新功能 - 注册自定义模型接口可支持指定worker_ip。现在配合launch模型接口的worker_ip参数,可以在分布式场景下仅在一个worker上传模型文件,然后部署使用 - Launch模型接口支持download_hub参数,以最高优先级控制从哪里下载模型