在运维系统中,我认为 Alert 光发出来是不够的。每一个 Alert 发出来都需要处理,都要被解决。 我们现 […]
Continue reading…
Posts tagged with 'Python'
一个十万行的 trackback
之前写过一个服务发现系统,叫做 prometheus-http-sd,给 Prometheus 查找监控的目标 […]
Continue reading…
用 BPF 动态追踪 Python 程序
最近在学习 BPF,这是一种目前比较流行的动态追踪技术,简单来说,它允许我们在不中断目前正在运行的程序的情况下 […]
Continue reading…
Prometheus alert rules 拆分成多个查询表达式
Alertmanager 发送出来的告警是一条消息,一般我们会用 annotation 来说明发生什么事了。 […]
Continue reading…
寻找丢失的信号
记录一个今天遇到的小问题。这是继 Debug 一个在 uWSGI 下使用 subprocess 卡住的问题 之 […]
Continue reading…