Edge Computing

Rozhodnutí za 10ms. Bez cloudu.

Zpracováváme data tam, kde vznikají — na zařízení, v lokální síti. Cloud dostane výsledky, ne terabajty raw dat.

Chci edge řešení Zpět na IoT & Automatizace

<50ms

Inference latence

99.95%

Edge uptime

90%+

Bandwidth reduction

24/7

Offline autonomy

Proč edge computing¶

Ne všechno patří do cloudu. Když třídící linka potřebuje rozhodnutí za 10ms, nemůžete čekat na round-trip do Azure (50-100ms minimum). Když kamera generuje 25 fps v 4K rozlišení, nemůžete posílat 15 GB/hodinu do cloudu. Když bezpečnostní systém musí reagovat i při výpadku internetu, nemůžete záviset na cloudové konektivitě.

Edge computing zpracovává data tam, kde vznikají. Cloud dostane výsledky — alarmy, agregované metriky, business events — ne raw data. Výsledek: nižší latence, nižší bandwidth costs, vyšší resilience, nižší cloud bill.

Kdy edge, kdy cloud¶

Kritérium	Edge	Cloud
Latence < 50ms	✅	❌
High bandwidth data (video, audio)	✅ Zpracování lokálně	❌ Příliš drahé přenášet
Offline resilience	✅	❌
Compliance (data locality)	✅ Data neopustí site	⚠️ Závisí na regionu
Complex ML training	❌ Omezený compute	✅ GPU clusters
Fleet-wide analytics	❌ Izolovaná data	✅ Centrální pohled

Správná odpověď je hybrid. Edge pro real-time rozhodování a pre-processing. Cloud pro training, fleet analytics, long-term storage.

Computer vision na edge¶

Hardware¶

NVIDIA Jetson řada: - Jetson Orin Nano (8GB): 40 TOPS, ideální pro single-camera CV úlohy. ~$200. - Jetson Orin NX (16GB): 100 TOPS, multi-camera, komplexnější modely. - Jetson AGX Orin (64GB): 275 TOPS, enterprise workloady, multiple ML pipelines.

Alternativy: - Google Coral TPU: USB nebo M.2 accelerator. 4 TOPS, ultra-low power. Pro jednoduché classification/detection. - Intel NCS2 / OpenVINO: x86 inference optimization. Vhodné pokud edge node je Intel-based. - Hailo-8: 26 TOPS, M.2 form factor. Competitive alternative k NVIDIA pro dedicated inference.

Optimalizace modelů pro edge¶

Cloud model (FP32, 200MB) nelze jen tak přesunout na edge. Optimalizační pipeline:

Quantization: FP32 → FP16 → INT8. Až 4× menší model, 2-3× rychlejší inference. Accuracy drop typicky <1% s proper calibrací.
Pruning: Odstranění neuronů s nízkou aktivací. 30-50% redukce parametrů bez measurable accuracy loss.
Knowledge distillation: Velký „teacher” model trénuje malý „student” model. Student dosahuje 90-95% accuracy teachera na 10% parametrů.
TensorRT (NVIDIA): GPU-specific optimalizace — layer fusion, kernel auto-tuning, dynamic tensor memory. 2-5× speedup oproti vanilla PyTorch.
OpenVINO (Intel): Analogická optimalizace pro Intel CPU/GPU/VPU.

Use cases¶

Quality inspection: Kamera nad výrobní linkou, model detekuje defekty (škrábance, deformace, chybějící díly). Inference pod 30ms per frame = real-time QC při 30 fps. Reject signal do PLC za < 50ms.

OCR na štítcích: Čtení sériových čísel, lot codes, expiration dates. Strukturovaná data místo manuálního přepisování.

People counting / occupancy: Detekce a tracking osob v prostoru. Heatmapy, flow analysis, capacity management. GDPR-compliant — na edge se zpracovává video, do cloudu jdou jen počty.

Safety zone monitoring: Detekce osob v nebezpečné zóně kolem stroje. Alert operátorovi, signal do PLC pro zastavení. Latence rozhoduje — 50ms edge vs. 200ms+ cloud.

Anomaly detection na edge¶

Ne každá anomálie vyžaduje ML model. Často stačí statistika — ale musí běžet lokálně:

Statistické metody¶

Z-score: Aktuální hodnota vs. historický průměr a směrodatná odchylka. Jednoduché, interpretovatelné. Alert když |z| > 3.
Moving average + bands: Exponential moving average s Bollinger bands. Adaptivní na sezónní vzorce.
Change point detection: CUSUM, PELT algoritmy. Detekce trvalé změny v distribuci (ne spike, ale shift).

ML modely na edge¶

Isolation Forest: Unsupervised anomaly detection. Malý footprint, rychlá inference. Ideální pro multivariate anomaly detection.
Autoencoder: Neural network trénovaný na normálních datech. Vysoká reconstruction error = anomálie. Zvládne komplexní vzorce, které statistika nevidí.
Temporal models: LSTM/GRU pro time-series anomálie. Predikuje next value, porovná s actual. Velká odchylka = anomálie.

Typické aplikace¶

Vibration analysis: Akcelerometr na motoru/ložisku. FFT spektrum na edge. Změna frekvenčního profilu = degradace ložiska.
Power consumption: Proud a napětí. Anomální spotřeba = mechanický problém, ucpaný filtr, přetížení.
Temperature drift: Pomalý nárůst teploty, který by v raw datech nebyl viditelný. Edge detekuje trend dny předem.

Edge orchestrace¶

K3s (Lightweight Kubernetes)¶

Kubernetes cluster na edge — stejné abstrackce (pods, deployments, services), ale single-binary, nízké nároky na resources:

Single node: K3s na jednom Jetson/RPi. Orchestruje multiple containers.
Multi-node cluster: Více edge zařízení v jednom clusteru. Service mesh pro inter-node komunikaci.
GitOps deploy: Flux nebo ArgoCD. Git push → automatic rollout na edge cluster.

Docker pro jednodušší scénáře¶

Ne každý edge potřebuje Kubernetes:

Docker Compose pro multi-container aplikace
Watchtower pro automatic image updates
Portainer pro GUI management

Centrální management¶

Azure IoT Edge: Runtime na edge zařízení, management z Azure. Module deployment, monitoring, remote troubleshooting.
AWS Greengrass: Lambda functions na edge, managed deployment, shadow sync.
Custom: Ansible pro konfigurace, Terraform pro infra, custom fleet dashboard.

Offline resilience¶

Edge node musí fungovat autonomně při výpadku konektivity:

Lokální decision engine: Všechna pravidla a modely lokálně. Rozhodnutí nezávisí na cloudu.
Store-and-forward: Telemetrie se ukládá lokálně (SQLite, RocksDB). Po obnovení konektivity chronologické odeslání.
Local alerting: Alerty se doručí lokálně (sirena, signální světlo, display) i bez internetu.
Autonomous operation: Výrobní linka běží s edge QC i bez cloudu. Cloud přidává fleet analytics, ale není nutný pro provoz.

Technologický stack¶

Hardware: NVIDIA Jetson (Nano/Orin), Raspberry Pi 4/5, Google Coral, Intel NUC, průmyslové IPC.

ML Runtime: TensorRT, OpenVINO, TensorFlow Lite, ONNX Runtime, PyTorch Mobile.

CV: OpenCV, GStreamer, DeepStream (NVIDIA), YOLO, MediaPipe.

Orchestrace: K3s, Docker, Azure IoT Edge, AWS Greengrass, Balena.

Storage: SQLite, RocksDB, Redis, local InfluxDB.

Monitoring: Prometheus node exporter, Grafana Agent, custom health checks.

Časté otázky

NVIDIA Jetson (Nano/Orin) pro computer vision a ML inference. Raspberry Pi 4/5 pro lehčí workloady. Průmyslové ARM/x86 počítače (Advantech, Kontron) pro harsh prostředí. Volíme podle výkonu, prostředí a certifikací.

GitOps — stejný workflow jako pro cloud. Git push → CI/CD → container update na edge. K3s nebo Docker s Watchtower pro orchestraci. Rolling updates, health checks, automatic rollback.

Nic kritického. Edge node funguje plně autonomně. Lokální rozhodování, store-and-forward pro telemetrii, lokální alerting. Po obnovení konektivity sync s cloudem. Kritická rozhodnutí nikdy nezávisí na cloudu.

Trénink v cloudu na plných datech (GPU cluster). Optimalizace pro edge: quantization (FP32→INT8), pruning, knowledge distillation. Export do TensorRT/OpenVINO/TFLite. Validace na edge hardware před deploy.

Souvisí s

IoT, Automation & Robotics {'cs': 'Průmyslové IoT, edge computing, robotická automatizace.', 'en': 'Industrial IoT, edge computing, robotic automation.'}

AI & Agentic Systems {'cs': 'Stavíme AI agenty s governance, bezpečností a produkčním provozem.', 'en': 'We build AI agents with governance, security, and production operations.'}

Cloud & Platform Engineering {'cs': 'Kubernetes, IaC, CI/CD a provoz v cloudu.', 'en': 'Kubernetes, IaC, CI/CD and cloud operations.'}

Logistics & E-commerce {'cs': 'Supply chain, WMS, fulfillment automatizace', 'en': 'Supply chain, WMS, fulfillment automation'}

Máte projekt?

Pojďme si o něm promluvit.

Domluvit schůzku