DevOps Středně pokročilý
SRE — Four Golden Signals v Praxi¶
SREGolden SignalsMonitoringObservability 5 min čtení
Implementace Four Golden Signals: Latency, Traffic, Errors, Saturation s PromQL dotazy a alertingem.
Čtyři Zlaté Signály¶
- Latency — doba zpracování requestu
- Traffic — objem requestů (RPS)
- Errors — procento neúspěšných requestů
- Saturation — jak plný je systém (CPU, RAM, disk, connections)
PromQL Implementace¶
# Latency (p99)
histogram_quantile(0.99, sum by (le) (
rate(http_request_duration_seconds_bucket[5m])))
# Traffic
sum(rate(http_requests_total[5m]))
# Errors
sum(rate(http_requests_total{status=~"5.."}[5m]))
/ sum(rate(http_requests_total[5m])) * 100
# Saturation
1 - avg(rate(node_cpu_seconds_total{mode="idle"}[5m]))
Alerting Rules¶
groups:
- name: golden-signals
rules:
- alert: HighLatency
expr: histogram_quantile(0.99, sum by (le) (rate(http_request_duration_seconds_bucket[5m]))) > 1
for: 5m
labels:
severity: warning
- alert: HighErrorRate
expr: sum(rate(http_requests_total{status=~"5.."}[5m])) / sum(rate(http_requests_total[5m])) > 0.01
for: 2m
labels:
severity: critical
- alert: HighSaturation
expr: 1 - avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) > 0.85
for: 10m
labels:
severity: warning
Shrnutí¶
Four Golden Signals jsou nejjednodušší framework pro monitoring služeb. Pokrývají 90% potřeb s minimem metrik.
Potřebujete pomoct s implementací?¶
Náš tým má zkušenosti s návrhem a implementací moderních architektur. Rádi vám pomůžeme.