grafana+loki日志告警
时间:2025-08-21 17:41 来源:未知 作者:liangzh 点击:次
sum by(pod, container, cluster) (count_over_time({cluster=~".*", namespace="prod-core", stream=~"stdout|stderr", container=~".*", pod=~".+", namespace!="loki|kube-system"} |~ `error|ERROR` !~ `ERROR\d+|\w+ERROR|ERROR\w+` !~ `error\d+|\w+error|error\w+` [1m])) >1000 2.告警配置 sumary: 错误日志告警: 服务{{ $labels.container }} 错误日志数{{ .Values.A.Value }} 描述:
服务: {{ $labels.container }}
pod: {{ $labels.pod }}
环境 {{ $labels.cluster }}
错误日志条数: {{ .Values.A.Value }}
注意:grafna配置loki告警规则,获取如下{{ $value }}变量值中过滤value=的值的方法:{{ .Values.A.Value }}
[ var='A' labels={cluster=prod-core, container=async-recorder, pod=prod-async-recorder-57b467fc89-vjx9v} value=204 ], [ var='B' labels={cluster=prod-core, container=async-recorder, pod=prod-async-recorder-57b467fc89-vjx9v} value=204 ]
3.告警通道alertmange (责任编辑:liangzh) |