node-problem-detector将为每个配置启动一个单独的自定义插件监视器。您可以使用不同的自定义插件监视器来监视不同的节点问题。 Kubernetes exporter --enable-k8s-exporter:启用向KubernetesAPI服务器报告的功能,默认为true。 --apiserver-override:一个URI参数,用于自定义node-problem-detector连接apiserver的地址。如果--...
node-problem-detector uses Event and NodeCondition to report problems to apiserver. NodeCondition: Permanent problem that makes the node unavailable for pods should be reported as NodeCondition. Event: Temporary problem that has limited impact on pod but is informative should be reported as Event. ...
不同的检测类型通过不同的goroutine来实现,配置例子参考: https://github.com/kubernetes/node-problem-detector/tree/master/config, 配置文件为json结尾。 检测问题上报api node-problem-detector使用Event和NodeCondition将问题报告给apiserver。 NodeCondition:导致节点无法处理于Pod生命周期的的永久性问题应报告为NodeCon...
问题守护进程是 node-problem-detector 的子守护进程。它监视特定类型的节点问题并将它们报告给节点问题检测器。 问题守护进程可能是: 为专用 Kubernetes 用例设计的小型守护程序。 与node-problem-detector 集成的现有节点健康监控守护程序。 目前,一个问题守护进程在 node-problem-detector 二进制文件中作为 goroutine ...
node-problem-detector 使用 Event 和 NodeCondition 向 apiserver 报告问题。 NodeCondition:使节点对 pod 不可用的永久性问题应报告为 NodeCondition。 Event:对 pod 影响有限但提供信息的临时问题应报告为事件。 2.3 Problem 守护进程(Monitor) Problem Daemon(在代码内部也叫Monitor)是NPD的子守护进程,每个PD监控一...
Node Problem Detector(NPD)是Kubernetes集群中一个重要的监控插件,它的作用是监控节点的健康状况并检测可能出现的问题。NPD 通过在每个节点上运行的检测器来工作,能够发现基础设施、容器运行时、硬件和内核等问题,并将这些问题报告给集群中的上层控制面。
步骤一:部署kube-eventer和node-problem-detector 阿里云Kubernetes 其他Kubernetes 如果是ACK集群,则对应阿里云Kubernetes组件中的ack-node-problem-detector组件已集成eventer和node-problem-detector功能,您只需要部署该组件。更多信息,请参见事件监控。如果是ACK Serverless集群,您需要部署kube-eventer组件。
Node Problem Detector(NPD)是 Kubernetes 集群中一个重要的监控插件,它的作用是监控节点的健康状况并检测可能出现的问题。NPD 通过在每个节点上运行的检测器来工作,能够发现基础设施、容器运行时、硬件和内核等问题,并将这些问题报告给集群中的上层控制面。
K8S集群管理对node的健康状态是无法感知的,pod依旧会调度到有问题的node上,通过DaemonSet部署node-problem-detector,向apiserver上报node的状态信息,使node的健康状态对上游管理可见,pod不会再调度到有异常的node上。 cat<<EOF>node-problem-detector.yamlapiVersion:extensions/v1beta1kind:DaemonSetmetadata:name:node-pr...
name: node-problem-detector-v0.1 namespace: kube-system labels: k8s-app: node-problem-detector version: v0.1kubernetes.io/cluster-service: "true" spec: selector: matchLabels: k8s-app: node-problem-detector version: v0.1 kubernetes.io/cluster-service: "true" ...