Cloud & Platform Engineering
Infrastruktura jako kód. Platforma jako produkt.
Stavíme cloud infrastrukturu a interní platformy, které dávají vývojářům superschopnosti — a operations klid.
Cloud migrace
Assessment, risk mapping, dependency analýza. Migrace bez výpadků s hybrid bridge — ne 'přesuneme to za víkend a doufáme'. Iterativní přístup s rollback plánem pro každý krok.
Infrastructure as Code
Terraform, Pulumi, GitOps. Infrastruktura verzovaná, testovaná, reprodukovatelná. Nikdy víc 'kdo změnil ten firewall pravidla' — vše je v gitu s code review.
Kubernetes & kontejnery
AKS, EKS, GKE — managed Kubernetes s Helm charts, ArgoCD pro GitOps a progressive delivery. Od dev prostředí po produkci s konzistentní konfigurací.
CI/CD Pipeline
GitHub Actions, GitLab CI, Azure DevOps. Od commitu po produkci za minuty s automatizovanými quality gates, security scany a progressive delivery.
Observability & SRE
Grafana, Prometheus, Loki, Jaeger, OpenTelemetry. SLO/SLI, error budgets, runbooky. Víte PROČ je problém, ne jen ŽE je problém — a máte proces pro jeho řešení.
FinOps
Cloud cost optimization jako kontinuální proces. Víte kolik platíte za jednotku práce, ne za idle resources. Typicky 30-50% úspora oproti neoptimalizovanému stavu.
Platform Engineering
Vybudování interní platformy, která vývojářům poskytuje standardní šablony služeb, jednotné logování, metriky, tracing, self-service prostředí a guardrails pro bezpečnost i náklady.
- ✓ Self-service pro vývojáře (deploy bez ops tiketu)
- ✓ Golden paths — standardní šablony služeb
- ✓ Guardrails pro security a cost
- ✓ DORA metriky jako feedback loop
Jak to děláme
Cloud Assessment
Zhodnotíme současnou infrastrukturu, aplikace a připravenost na migraci do cloudu.
Plán migrace
Navrhneme cílovou architekturu, roadmapu a strategii přechodu s minimálním rizikem.
Pilot migrace
Přesuneme první workloady, ověříme výkon, bezpečnost a provozní procesy.
Full migrace & automatizace
Kompletní přesun zbývajících systémů s IaC, CI/CD a auto-scalingem.
Optimalizace & FinOps
Průběžná optimalizace nákladů, výkonu a governance nad cloudovým prostředím.
Kdy potřebujete platform engineering¶
Typické situace¶
- „Chceme do cloudu” bez strategie — Lift & shift za trojnásobek nákladů se stejnými problémy.
- Release bolí — Manuální deploy, strach z pátečních releasů, rollbacky přes SSH.
- Snowflake servery — Servery konfigurované ručně, nikdo neví jak je reprodukovat.
- Cloud cost bez kontroly — Překvapivé účty na konci měsíce, žádná visibility.
- Každý tým deployuje jinak — 8 týmů, 8 pipeline variant, žádný standard.
Internal Developer Platform¶
Platform engineering není jen infrastruktura — je to produkt pro vaše vývojáře. Self-service portál, kde tým si za minuty vytvoří nové prostředí, nasadí službu, nastaví monitoring — bez tiketu do operations.
Co platforma poskytuje¶
| Capability | Bez platformy | S platformou |
|---|---|---|
| Nové prostředí | Tiket, 2 týdny | Self-service, 10 minut |
| Deployment | Manuální, strašidelný | CI/CD, automatický |
| Monitoring | Každý tým jinak | Standardní, zero-touch |
| Security | Audit na konci | Guardrails od začátku |
| Cost visibility | Měsíční faktura | Real-time per tým |
Golden Paths¶
Standardní šablony pro typické workloady:
- Web API — Kontejner, Kubernetes deployment, ingress, TLS, monitoring, CI/CD
- Event consumer — Kafka consumer, dead letter queue, retry logic, monitoring
- Scheduled job — CronJob/Azure Function, monitoring, alerting
- Static site — CDN, TLS, CI/CD from git
Tým vybere golden path, vyplní parametry, platforma vytvoří vše potřebné. Guardrails zabudované — security best practices, cost limits, naming conventions.
Migrační postup¶
Z on-prem do cloudu bez výpadků — 5 kroků:
- Assessment & Planning — 5R analýza (Rehost, Replatform, Refactor, Replace, Retire). Dependency mapping. Risk scoring. Migration roadmap s prioritizací podle business value.
- Foundation — Landing zone setup. Networking (VPN/ExpressRoute), IAM, security baseline, monitoring. Terraform modules pro standardní patterny.
- Pilot Migration — 2-3 workloady s různým rizikovým profilem. Validace procesu, tooling, rollback. Lessons learned pro další vlny.
- Wave Migration — Systematická migrace po vlnách (2-4 workloady/měsíc). Hybrid bridge, traffic shifting, automated validation.
- Optimization & Decommission — FinOps optimization, decommission on-prem, SRE procesy, knowledge transfer.
DORA metriky¶
Měříme to, co doopravdy záleží:
- Deployment frequency — Kolikrát denně deployujete. Elite: multiple per day.
- Lead time for changes — Od commitu po produkci. Elite: < 1 hodina.
- Change failure rate — S guardrails pod 5%. Elite: < 5%.
- MTTR — Z hodin na minuty díky observability. Elite: < 1 hodina.
Dashboard s trendy, ne snapshoty. Retrospektiva nad DORA metriky každé 2 týdny.
Stack¶
| Kategorie | Technologie |
|---|---|
| Cloud | Azure, AWS, GCP |
| IaC | Terraform, Pulumi, Crossplane |
| Container | Docker, Kubernetes (AKS/EKS/GKE), Helm |
| GitOps | ArgoCD, Flux |
| CI/CD | GitHub Actions, GitLab CI, Azure DevOps |
| Observability | Grafana, Prometheus, Loki, Jaeger, OpenTelemetry |
| Service Mesh | Istio, Linkerd |
| Security | Vault, cert-manager, Falco, Trivy |
| FinOps | Kubecost, AWS Cost Explorer, Azure Cost Management |
Časté otázky
Záleží na kontextu. Azure je silný v enterprise a Microsoft ekosystému. AWS má nejširší nabídku. GCP vyniká v datech a ML. Pomůžeme vybrat a minimalizovat vendor lock-in.
Jednoduchá migrace: 4–8 týdnů. Komplexní enterprise s compliance: 6–12 měsíců. Migrujeme iterativně — první služba běží v cloudu za týdny.
Ne vždy. Pro jednoduchou aplikaci stačí App Service nebo Lambda. Kubernetes dává smysl při 5+ microservices, potřebě multi-cloud nebo specifických provozních požadavcích.
Typicky 30-50% oproti neoptimalizovanému stavu. Reserved instances, right-sizing, spot instances, automatický scaling. FinOps jako kontinuální proces.
Infrastructure as Code (Terraform) pro portabilitu, kontejnerizace (Docker/K8s) pro runtime agnostičnost, abstrakce nad managed services. 100% vendor neutralita je iluze — ale 80% portability je dosažitelná a stojí za to.
Azure Arc, AWS Outposts, nebo Anthos pro konzistentní management. VPN/ExpressRoute pro konektivitu. Jednotný monitoring a deployment pipeline přes obě prostředí.