kube-prometheus 的安装,我们可以看到监控指标大部分的配置都是正常的,只有两个没有管理到对应的监控目标,比如 kube-controller-manager 和 kube-scheduler 这两个系统组件。 备注: controller-manager:负责管理集群各种资源,保证资源处于预期的状态。 kube-scheduler:资源调度,负责决定将Pod放到哪个Node上...
文件prometheus-kubeControllerManagerService.yaml apiVersion:v1kind:Servicemetadata:labels:k8s-app:kube-controller-managername:kube-controller-managernamespace:kube-systemspec:type:ClusterIPsessionAffinity:Noneports:-name:http-metricsport:10252protocol:TCPtargetPort:10252---#二进制部署还得创建对应的 Endpoints...
#可以看到他是通过标签app.kubernetes.io/name=kube-controller-manager来匹配controller-manager的当我们查看的时候,并没有符合这个标签的svc所以prometheus找不到controller-manager地址。 #我们需要做的是:1.吧监听地址改成0.0.0.02.吧service创建上 解决方案 #1.修改监听地址 vi/etc/kubernetes/cfg/kube-controller-ma...
Prometheus Operator 部署成功后,默认就监控了 kube-controller-manager,使用 ServiceMonitor 方式。 不过kubeadm 部署的 kube-controller-manager 并没有创建 Service,只要创建 Service 就能将其监控上了。 apiVersion:v1kind:Servicemetadata:name:kube-controller-managernamespace:kube-systemlabels:app.kubernetes.io/name...
controller-manager:负责管理集群各种资源,保证资源处于预期的状态。 kube-scheduler:资源调度,负责决定将Pod放到哪个Node上运行。 环境(使用kubeadm安装的k8s集群) Kubernetes v1.23.8 prometheus operator 0.11.0 报警监控如图 原因 ServiceMonitor 资源对象的声明方式,kube-system 这个命名空间下需要匹配具有 k8s-app=kube...
监测KubeControllerManager 服务,Down 或者网络不通。 表达式: absent(up{job="kube-controller-manager"} == 1) 7. 应用相关 7.1 KubePodCrashLooping Pod 重启时间,重启时间超过3m告警。 表达式: rate(kube_pod_container_status_restarts_total{job="kube-state-metrics"}[5m]) * 60 * 3 > 0 ...
我前面使用Kubernetes构建prometheus监控,没有什么大问题,但是monitoring/kube-controller-manager/0 (0/0 up),这个没有数值。 一般出现这个问题,都是Kubernetes部署时,没有对应的标签,导致无法找到资源 问题 问题一:ip地址 正常开启的,但是这个监听端口是127.0.0.1的,普罗米修斯无法直接访问 ...
1:prometheus 的Targets面板 kube-controller-manager显示error: server returned HTTP status 403 Forbidden2: kube-controller-manager 日志错误如下 E0623 05:00:59.765767 29872 resource_quota_controller.go:437] failed to sync resource monitors: [couldn’t start monitor for resource “crd.projectcalico.org/...
#3.1 获取kube-prometheus 需要注意,自己当前集群版本与kube-prometheus的兼容性,具体参考:版本映射关系(opens new window) # GitHub仓库 直接获取下载:gitclone https://github.com/prometheus-operator/kube-prometheus.git 这里下载之后,可以看到对应的资源配置清单已经按照应用组件进行分类。
🐾上面的.scheduler.extraArgs和.controllerManager.extraArgs。这样就把kube-controller-manager和kube-scheduler服务暴露给集群的其他组件。 另外, 如果你把 kubernetes 核心组件作为pods放在 kube-system namespace,就要确保kube-prometheus-exporter-kube-scheduler和kube-prometheus-exporter-kube-controller-managerservice ...