Checklist

Disaster recovery checklist

7 min čtení

DRBusiness ContinuityInfrastruktura

Havárie se stane. Otázka je, jak rychle se zotavíte.

Definice

☐ RTO (Recovery Time Objective) definováno per službu
☐ RPO (Recovery Point Objective) definováno
☐ Kritické služby identifikovány
☐ Závislosti zmapovány

Infrastruktura

☐ Multi-AZ/multi-region deployment
☐ Database replication (async/sync)
☐ Load balancer health checks
☐ DNS failover (Route53/CloudFlare)
☐ CDN jako fallback

Data

☐ Backup ověřen a aktuální
☐ Point-in-time recovery funkční
☐ Data replication lag monitorovaný

Proces

☐ DR runbook dokumentovaný
☐ Kontaktní seznam aktuální
☐ Komunikační plán (interní + externí)
☐ Eskalační postup jasný

Testování

☐ Tabletop exercise (diskuze scénářů) 1× kvartálně
☐ Partial failover test 1× za 6 měsíců
☐ Full DR test 1× ročně
☐ Chaos engineering (volitelné)

Realita

DR plán, který nebyl testován, selže v produkci. Testujte pravidelně.

CORE SYSTEMS tým

Enterprise architekti a DevOps inženýři. Stavíme systémy, které fungují.