container_cpu_usage_seconds_total counter 容器在每个CPU内核上的累积占用时间 (单位:秒) container_cpu_system_seconds_total counter System CPU累积占用时间(单位:秒) container_cpu_user_seconds_total counter User CPU累积占用时间(单位:秒) container_fs_usage_bytes gauge 容器中文件系统的使用量(单位:字节)...
#CPU利用率由sum(rate (container_cpu_usage_seconds_total{origin_prometheus=~"$origin_prometheus",id="/"}[2m]))by (instance) /sum(machine_cpu_cores{origin_prometheus=~"$origin_prometheus"})by (instance) 改为 label_replace(sum(rate (container_cpu_usage_seconds_total{origin_prometheus=~"$orig...
sum(container_memory_usage_bytes{instance=~"master"})/1024/1024/1024 计算master节点最近 1m 所有容器 cpu 使用率 sum (rate (container_cpu_usage_seconds_total{instance=~"master"}[1m])) / sum (machine_cpu_cores{ instance =~"master"}) * 100 计算最近 1m 所有容器 cpu 使用率 sum (rate (co...
在Grafana创建面板时,示例Prometheus查询代码如下: # CPU使用率 rate(container_cpu_usage_seconds_total[1m]) # 内存使用情况 container_memory_usage_bytes{job="docker"} 1. 2. 3. 4. 5. 4. 类图设计 为了更好地理解Docker监控的组件关系,我们用Mermaid语法绘制一个类图: InheritsClassA+methodA()ClassB+...
- name: Container rules: - alert: ContainerCPU expr: (sum by(name,instance) (rate(container_cpu_usage_seconds_total{image!=""}[5m]))*100) > 200 for: 1m labels: name: CPU_Usage severity: Warning annotations: summary: "{{ $labels.name }} " ...
回到主页,在搜索框中输入container_cpu_usage_seconds_total,点击回车,选择”Graph”,可以看到过去一小时各个容器的CPU使用情况: Image 现在我们可以进行最后一项工作——部署Grafana。 3 Grafana 3.1 简介 Grafana是一个开源的轻量级仪表盘工具。它可以与许多数据源集成,如Prometheus、AWS云观察、Stackdriver等。
timeoutSeconds: 1 resources: limits: cpu: 300m memory: 300Mi requests: cpu: 300m memory: 300Mi volumeMounts: - name: grafana-data mountPath: /var/lib/grafana subPath: grafana securityContext: fsGroup: 472 runAsUser: 472 volumeClaimTemplates: ...
目前只采集了部分免费基础指标,采集指标列表如下。序号指标名称1kube_pod_container_status_last_terminated_reason2rest_client_requests_total3scheduler_pod_scheduling_attempts_bucket4sc...
- name: Container rules: - alert: ContainerCPU Usage expr: (sum by(name,instance) (rate(container_cpu_usage_seconds_total{image!=""}[5m]))*100) > 60 for: 1m labels: name: CPU severity: Warning annotations: summary: "{{ $labels.name }} " ...
`sum(rate(container_cpu_usage_seconds_total{pod_name=~"your_pod_name"}[5m])) / sum(kube_pod_container_resource_requests_cpu_cores{pod_name=~"your_pod_name"}) * 100` 计算CPU使用率 内存使用率也有类似的表达式 3. 设置告警规则: 可以根据这些指标设定阈值报警,当实际副本数与期望副本数不一致时...