跳到主要内容
版本:v1.5.x

监控:Kubernetes 监控

对kubernetes的通用性能指标进行采集监控。

监控前操作

如果想要监控 Kubernetes 中的信息,则需要获取到可访问Api Server的授权TOKEN,让采集请求获取到对应的信息。

参考获取token步骤

方式一

  1. 创建service account并绑定默认cluster-admin管理员集群角色

    kubectl create serviceaccount dashboard-admin -n kube-system

  2. 用户授权

    kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin
    kubectl -n kube-system get secret | grep dashboard-admin | awk '{print $1}'
    kubectl describe secret {secret} -n kube-system

方式二

kubectl create serviceaccount cluster-admin

kubectl create clusterrolebinding cluster-admin-manual --clusterrole=cluster-admin --serviceaccount=default:cluster-admin

kubectl create token --duration=1000h cluster-admin

配置参数

参数名称参数帮助描述
监控Host被监控的对端IPV4,IPV6或域名。注意⚠️不带协议头(eg: https://, http://)。
任务名称标识此监控的名称,名称需要保证唯一性。
APiServer端口K8s APiServer端口,默认6443
token授权Access Token
URL数据库连接URL,可选,若配置,则URL里面的数据库名称,用户名密码等参数会覆盖上面配置的参数
采集间隔监控周期性采集数据间隔时间,单位秒,可设置的最小间隔为30秒
是否探测新增监控前是否先探测检查监控可用性,探测成功才会继续新增修改操作
描述备注更多标识和描述此监控的备注信息,用户可以在这里备注信息

采集指标

指标集合:nodes

指标名称指标单位指标帮助描述
node_name节点名称
is_ready节点状态
capacity_cpuCPU容量
allocatable_cpu已分配CPU
capacity_memory内存容量
allocatable_memory已分配内存
creation_time节点创建时间

指标集合:namespaces

指标名称指标单位指标帮助描述
namespacenamespace名称
status状态
creation_time创建时间

指标集合:pods

指标名称指标单位指标帮助描述
podpod名称
namespacepod所属namespace
statuspod状态
restart重启次数
host_ip所在主机IP
pod_ippod ip
creation_timepod创建时间
start_timepod启动时间

指标集合:services

指标名称指标单位指标帮助描述
serviceservice名称
namespaceservice所属namespace
typeservice类型 ClusterIP NodePort LoadBalancer ExternalName
cluster_ipcluster ip
selectortag selector匹配
creation_time创建时间