Zum Inhalt springen
_CORE
AI & Agentic Systems Core Information Systems Cloud & Platform Engineering Data Platform & Integration Security & Compliance QA, Testing & Observability IoT, Automation & Robotics Mobile & Digital Banking & Finance Insurance Public Administration Defense & Security Healthcare Energy & Utilities Telco & Media Manufacturing Logistics & E-commerce Retail & Loyalty
Referenzen Technologien Blog Know-how Tools
Über uns Zusammenarbeit Karriere
CS EN DE
Lassen Sie uns sprechen

Postmortem: jak na to správně

23. 10. 2025 1 Min. Lesezeit intermediate

Postmortem není o hledání viníků. Je o tom, aby se to nestalo znovu.

Blameless kultura

„Jan smazal databázi” → „Chyběla ochrana proti mazání produkční databáze.” Hledejte systémové příčiny, ne viníky.

Template

Incident: [název]

**Datum:** YYYY-MM-DD
**Severity:** Critical/Major/Minor
**Duration:** X hodin
**Impact:** Y uživatelů zasaženo, Z transakcí ztraceno

Timeline

HH:MM — Co se stalo
HH:MM — Alert fired
HH:MM — On-call notifikován
HH:MM — Příčina identifikována
HH:MM — Mitigace aplikována
HH:MM — Resolved

Root Cause

Detailní popis příčiny.

Contributing Factors

Co zhoršilo situaci?

Action Items

Akce Vlastník Deadline Priority
Přidat guard Jan 2 týdny P1
## Klíčové otázky
  • Proč to detekce trvala tak dlouho?
  • Proč neexistoval automatický rollback?
  • Proč test nepokryl tento scénář?
  • Měli jsme runbook? Pomohl?

Follow-up

Action items musí mít vlastníky a deadliny. Reviewujte plnění na týdenním standupu.

Pamatujte

Postmortem bez action items je jen příběh. Postmortem s follow-through je zlepšení.

postmortemsreincident response
Teilen:

CORE SYSTEMS tým

Stavíme core systémy a AI agenty, které drží provoz. 15 let zkušeností s enterprise IT.