Node-Problem-Detector 暴露 Prometheus 指标如下:指标名指标类型指标说明 problem_counter counter 当前时刻已经发生的故障数量 problem_gauge gauge 当前时刻,是否存在某类型的故障指标中包含的 LabelSet 如下:instance: 故障节点 namespace: npd 实例部署的 namespace type:故障类型,对应 Node Condition Type reason:...
node-problem-detector的作用是收集k8s集群管理中节点问题,并将其报告给apiserver。它是在每个节点上运行的守护程序。node-problem-detector可以作为DaemonSet运行,也可以独立运行。当前,GCE集群中默认开启此扩展。 项目地址: https://github.com/kubernetes/node-problem-detector kubernetes目前问题 基础架构守护程序问题:ntp...
--address:绑定node-problem-detector服务器的地址。--port:绑定node-problem-detector服务器的端口。 使用0禁用。 Prometheus exporter--prometheus-address:绑定Prometheus抓取端点的地址,默认为127.0.0.1。--prometheus-port:绑定Prometheus抓取端点的端口,默认为20257。使用0禁用。 Stackdriver exporter --exporter....
Healthchecker负责node-problem-detector运行节点的kubelet和容器运行时的健康检查功能,并在检查出异常后进行重启造作。 ProblemMetricsManager node-problem-detector检测问题的指标数据,如某个类型问题发生的次数,某个异常问题是否影响了节点。 部署 (1)部署node-problem-detector 添加node-problem-detector repo: [root@mas...
Exporter的作用是把检测到的问题或数据上报给相应后端。node-problem-detector目前提供三种Exporter: Exporter类型 说明 Kubernetes exporter 上报问题到Kubernetes API server:临时问题以Events形式上报; 永久问题以Node Conditions形式上报。 Prometheus exporter 上报节点的监控指标到Prometheus。
--address:绑定node-problem-detector服务器的地址。 --port:绑定node-problem-detector服务器的端口。使用0禁用。 Prometheus exporter --prometheus-address:绑定Prometheus抓取端点的地址,默认为127.0.0.1。 --prometheus-port:绑定Prometheus抓取端点的端口,默认为20257。使用0禁用。
Node-problem-detector也可以直接独立启动,需要指定k8s-apiserver的地址以及配置inClusterConfig 为false,详细可以参考独立部署 四 配置参数 system-log-monitor相关参数--config.system-log-monitor: system log monitor配置文件路径,多个文件用逗号分隔,如config/kernel-monitor.json,NPD会为每一个配置文件...
node-problem-detector介绍 node-problem-detector介绍node-problem-detector是一个收集节点异常的组件,目标是使上层控制面对节点异 常可见。在kubernetes集群中当前控制层面对节点异常的感知还比较薄弱,对于一些节点异常情况不能感知到,而这些异常问题往往会影 响pod的运行。如当某节点pod网络异常时,kubernetes任然可以把...
Healthchecker负责node-problem-detector运行节点的kubelet和容器运行时的健康检查功能,并在检查出异常后进行重启造作。 ProblemMetricsManager node-problem-detector检测问题的指标数据,如某个类型问题发生的次数,某个异常问题是否影响了节点。 部署 (1)部署node-problem-detector ...
metheusProblemMetricsManagerPrometheusexporterKubernetesexport erStackdriverexporterHealthcheckernode-problem-detector主要包括“Moni tor”和“Exporter”两大类型功能组件。“Monitor”类组件负责异常问题检测或指标数据采集,“Exporter”类组件 负责向上对接控制层面进行数据上报。其中SystemLogMonitor和CustomPluginMonitor检测到...