Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Know-how Nástroje
O nás Spolupráce Kariéra
Pojďme to probrat

Chaos Engineering — Pokročilé Techniky

10. 02. 2026 1 min čtení intermediate

DevOps Expert

Chaos Engineering — Pokročilé Techniky

Chaos EngineeringLitmusChaos MeshResilience 6 min čtení

Pokročilé chaos engineering experimenty. Litmus, Chaos Mesh, steady state hypothesis a blast radius.

Principy

  1. Definujte steady state — jak vypadá normální chování?
  2. Formulujte hypotézu
  3. Injectujte poruchu — kontrolovaně
  4. Pozorujte — potvrdila/vyvrátila se hypotéza?
  5. Opravte — fixněte nalezené slabiny

Litmus Chaos

apiVersion: litmuschaos.io/v1alpha1
kind: ChaosEngine
metadata:
  name: pod-kill-test
spec:
  appinfo:
    appns: production
    applabel: app=api-server
    appkind: deployment
  engineState: active
  experiments:
    - name: pod-delete
      spec:
        components:
          env:
            - name: TOTAL_CHAOS_DURATION
              value: "60"
            - name: CHAOS_INTERVAL
              value: "10"
        probe:
          - name: check-api-health
            type: httpProbe
            httpProbe/inputs:
              url: http://api-server.production/health
              method:
                get:
                  criteria: ==
                  responseCode: "200"
            mode: Continuous

Chaos Mesh

apiVersion: chaos-mesh.org/v1alpha1
kind: NetworkChaos
metadata:
  name: network-delay
spec:
  action: delay
  mode: all
  selector:
    namespaces: [production]
    labelSelectors:
      app: order-service
  delay:
    latency: "200ms"
    jitter: "50ms"
  duration: "5m"

Typy Experimentů

  • Pod failure — kill/delete pody
  • Network — latence, packet loss, DNS failure
  • Resource stress — CPU, memory, disk I/O
  • Node drain — evikce podů
  • AZ failure — simulace výpadku availability zone

Shrnutí

Chaos engineering odhaluje slabiny dříve než produkční incident. Začněte jednoduše, stupňujte a vždy mějte abort kritéria.

Potřebujete pomoct s implementací?

Náš tým má zkušenosti s návrhem a implementací moderních architektur. Rádi vám pomůžeme.

Nezávazná konzultace

Sdílet:

CORE SYSTEMS tým

Stavíme core systémy a AI agenty, které drží provoz. 15 let zkušeností s enterprise IT.