在运维系统中,我认为 Alert 光发出来是不够的。每一个 Alert 发出来都需要处理,都要被解决。 我们现 […]
Continue reading…
Posts tagged with 'Prometheus'
PromCon 2022 演讲:Alerting with Confidence
我从 2018 年就在做和监控告警相关的工作,到现在已经有差不多5年了。之前几年集中在报警的自动化处理上,后来 […]
Continue reading…
没来的请举手
我们需要在一个 VPC 网络环境中采集一些服务的 metrics,TSDB 存储在中心机房中,存储节点、中心节 […]
Continue reading…
Prometheus HTTP SD 框架
Prometheus 是现在比较流行的监控系统,它的工作模式是拉的模式:要监控的目标要负责把 metris 数 […]
Continue reading…
PromQL 使用多个 label 组合过滤
继《最近的工作感悟》中提到的大部分问题都解决了之后,有一些错误还是无法避免的,就试图想办法从监控系统中忽略掉。 […]
Continue reading…