Přeskočit na obsah
Checklist

Disaster recovery checklist

7 min čtení
DRBusiness ContinuityInfrastruktura

Havárie se stane. Otázka je, jak rychle se zotavíte.

Definice

  • ☐ RTO (Recovery Time Objective) definováno per službu
  • ☐ RPO (Recovery Point Objective) definováno
  • ☐ Kritické služby identifikovány
  • ☐ Závislosti zmapovány

Infrastruktura

  • ☐ Multi-AZ/multi-region deployment
  • ☐ Database replication (async/sync)
  • ☐ Load balancer health checks
  • ☐ DNS failover (Route53/CloudFlare)
  • ☐ CDN jako fallback

Data

  • ☐ Backup ověřen a aktuální
  • ☐ Point-in-time recovery funkční
  • ☐ Data replication lag monitorovaný

Proces

  • ☐ DR runbook dokumentovaný
  • ☐ Kontaktní seznam aktuální
  • ☐ Komunikační plán (interní + externí)
  • ☐ Eskalační postup jasný

Testování

  • ☐ Tabletop exercise (diskuze scénářů) 1× kvartálně
  • ☐ Partial failover test 1× za 6 měsíců
  • ☐ Full DR test 1× ročně
  • ☐ Chaos engineering (volitelné)

Realita

DR plán, který nebyl testován, selže v produkci. Testujte pravidelně.

CORE SYSTEMS tým

Enterprise architekti a DevOps inženýři. Stavíme systémy, které fungují.