目前相对比较成型的解决方案是 TKEStack 管理方案组件,包括 gpu-manager、vcuda-controller 和 gpu- admission 三个组件。其中 vcuda-controller 是对英伟达 GPU Driver 的封装,gpu-admission 是 Kubernetes Scheduler 的插件,gpu-manager 是调度管理的核心 【需求描述】使用 Rust 语言参照以上的逻辑重写 GPU 计算的管理...