- ️ 当注册gptq和awq量化的自定义模型时,UI界面已支持设置量化方式 - Python客户端chat现可支持多个system_prompt传入,使用起来更加灵活 - 新增支持通过环境变量XINFERENCE_DISABLE_HEALTH_CHECK禁用xinference节点健康检查 - Xinference launch命令现已支持透传额外的引擎相关的参数 ...