Edge Computing
Rozhodnutí za 10ms. Bez cloudu.
Zpracováváme data tam, kde vznikají — na zařízení, v lokální síti. Cloud dostane výsledky, ne terabajty raw dat.
Proč edge computing¶
Ne všechno patří do cloudu. Když třídící linka potřebuje rozhodnutí za 10ms, nemůžete čekat na round-trip do Azure (50-100ms minimum). Když kamera generuje 25 fps v 4K rozlišení, nemůžete posílat 15 GB/hodinu do cloudu. Když bezpečnostní systém musí reagovat i při výpadku internetu, nemůžete záviset na cloudové konektivitě.
Edge computing zpracovává data tam, kde vznikají. Cloud dostane výsledky — alarmy, agregované metriky, business events — ne raw data. Výsledek: nižší latence, nižší bandwidth costs, vyšší resilience, nižší cloud bill.
Kdy edge, kdy cloud¶
| Kritérium | Edge | Cloud |
|---|---|---|
| Latence < 50ms | ✅ | ❌ |
| High bandwidth data (video, audio) | ✅ Zpracování lokálně | ❌ Příliš drahé přenášet |
| Offline resilience | ✅ | ❌ |
| Compliance (data locality) | ✅ Data neopustí site | ⚠️ Závisí na regionu |
| Complex ML training | ❌ Omezený compute | ✅ GPU clusters |
| Fleet-wide analytics | ❌ Izolovaná data | ✅ Centrální pohled |
Správná odpověď je hybrid. Edge pro real-time rozhodování a pre-processing. Cloud pro training, fleet analytics, long-term storage.
Computer vision na edge¶
Hardware¶
NVIDIA Jetson řada: - Jetson Orin Nano (8GB): 40 TOPS, ideální pro single-camera CV úlohy. ~$200. - Jetson Orin NX (16GB): 100 TOPS, multi-camera, komplexnější modely. - Jetson AGX Orin (64GB): 275 TOPS, enterprise workloady, multiple ML pipelines.
Alternativy: - Google Coral TPU: USB nebo M.2 accelerator. 4 TOPS, ultra-low power. Pro jednoduché classification/detection. - Intel NCS2 / OpenVINO: x86 inference optimization. Vhodné pokud edge node je Intel-based. - Hailo-8: 26 TOPS, M.2 form factor. Competitive alternative k NVIDIA pro dedicated inference.
Optimalizace modelů pro edge¶
Cloud model (FP32, 200MB) nelze jen tak přesunout na edge. Optimalizační pipeline:
- Quantization: FP32 → FP16 → INT8. Až 4× menší model, 2-3× rychlejší inference. Accuracy drop typicky <1% s proper calibrací.
- Pruning: Odstranění neuronů s nízkou aktivací. 30-50% redukce parametrů bez measurable accuracy loss.
- Knowledge distillation: Velký „teacher” model trénuje malý „student” model. Student dosahuje 90-95% accuracy teachera na 10% parametrů.
- TensorRT (NVIDIA): GPU-specific optimalizace — layer fusion, kernel auto-tuning, dynamic tensor memory. 2-5× speedup oproti vanilla PyTorch.
- OpenVINO (Intel): Analogická optimalizace pro Intel CPU/GPU/VPU.
Use cases¶
Quality inspection: Kamera nad výrobní linkou, model detekuje defekty (škrábance, deformace, chybějící díly). Inference pod 30ms per frame = real-time QC při 30 fps. Reject signal do PLC za < 50ms.
OCR na štítcích: Čtení sériových čísel, lot codes, expiration dates. Strukturovaná data místo manuálního přepisování.
People counting / occupancy: Detekce a tracking osob v prostoru. Heatmapy, flow analysis, capacity management. GDPR-compliant — na edge se zpracovává video, do cloudu jdou jen počty.
Safety zone monitoring: Detekce osob v nebezpečné zóně kolem stroje. Alert operátorovi, signal do PLC pro zastavení. Latence rozhoduje — 50ms edge vs. 200ms+ cloud.
Anomaly detection na edge¶
Ne každá anomálie vyžaduje ML model. Často stačí statistika — ale musí běžet lokálně:
Statistické metody¶
- Z-score: Aktuální hodnota vs. historický průměr a směrodatná odchylka. Jednoduché, interpretovatelné. Alert když |z| > 3.
- Moving average + bands: Exponential moving average s Bollinger bands. Adaptivní na sezónní vzorce.
- Change point detection: CUSUM, PELT algoritmy. Detekce trvalé změny v distribuci (ne spike, ale shift).
ML modely na edge¶
- Isolation Forest: Unsupervised anomaly detection. Malý footprint, rychlá inference. Ideální pro multivariate anomaly detection.
- Autoencoder: Neural network trénovaný na normálních datech. Vysoká reconstruction error = anomálie. Zvládne komplexní vzorce, které statistika nevidí.
- Temporal models: LSTM/GRU pro time-series anomálie. Predikuje next value, porovná s actual. Velká odchylka = anomálie.
Typické aplikace¶
- Vibration analysis: Akcelerometr na motoru/ložisku. FFT spektrum na edge. Změna frekvenčního profilu = degradace ložiska.
- Power consumption: Proud a napětí. Anomální spotřeba = mechanický problém, ucpaný filtr, přetížení.
- Temperature drift: Pomalý nárůst teploty, který by v raw datech nebyl viditelný. Edge detekuje trend dny předem.
Edge orchestrace¶
K3s (Lightweight Kubernetes)¶
Kubernetes cluster na edge — stejné abstrackce (pods, deployments, services), ale single-binary, nízké nároky na resources:
- Single node: K3s na jednom Jetson/RPi. Orchestruje multiple containers.
- Multi-node cluster: Více edge zařízení v jednom clusteru. Service mesh pro inter-node komunikaci.
- GitOps deploy: Flux nebo ArgoCD. Git push → automatic rollout na edge cluster.
Docker pro jednodušší scénáře¶
Ne každý edge potřebuje Kubernetes:
- Docker Compose pro multi-container aplikace
- Watchtower pro automatic image updates
- Portainer pro GUI management
Centrální management¶
- Azure IoT Edge: Runtime na edge zařízení, management z Azure. Module deployment, monitoring, remote troubleshooting.
- AWS Greengrass: Lambda functions na edge, managed deployment, shadow sync.
- Custom: Ansible pro konfigurace, Terraform pro infra, custom fleet dashboard.
Offline resilience¶
Edge node musí fungovat autonomně při výpadku konektivity:
- Lokální decision engine: Všechna pravidla a modely lokálně. Rozhodnutí nezávisí na cloudu.
- Store-and-forward: Telemetrie se ukládá lokálně (SQLite, RocksDB). Po obnovení konektivity chronologické odeslání.
- Local alerting: Alerty se doručí lokálně (sirena, signální světlo, display) i bez internetu.
- Autonomous operation: Výrobní linka běží s edge QC i bez cloudu. Cloud přidává fleet analytics, ale není nutný pro provoz.
Technologický stack¶
Hardware: NVIDIA Jetson (Nano/Orin), Raspberry Pi 4/5, Google Coral, Intel NUC, průmyslové IPC.
ML Runtime: TensorRT, OpenVINO, TensorFlow Lite, ONNX Runtime, PyTorch Mobile.
CV: OpenCV, GStreamer, DeepStream (NVIDIA), YOLO, MediaPipe.
Orchestrace: K3s, Docker, Azure IoT Edge, AWS Greengrass, Balena.
Storage: SQLite, RocksDB, Redis, local InfluxDB.
Monitoring: Prometheus node exporter, Grafana Agent, custom health checks.
Časté otázky
NVIDIA Jetson (Nano/Orin) pro computer vision a ML inference. Raspberry Pi 4/5 pro lehčí workloady. Průmyslové ARM/x86 počítače (Advantech, Kontron) pro harsh prostředí. Volíme podle výkonu, prostředí a certifikací.
GitOps — stejný workflow jako pro cloud. Git push → CI/CD → container update na edge. K3s nebo Docker s Watchtower pro orchestraci. Rolling updates, health checks, automatic rollback.
Nic kritického. Edge node funguje plně autonomně. Lokální rozhodování, store-and-forward pro telemetrii, lokální alerting. Po obnovení konektivity sync s cloudem. Kritická rozhodnutí nikdy nezávisí na cloudu.
Trénink v cloudu na plných datech (GPU cluster). Optimalizace pro edge: quantization (FP32→INT8), pruning, knowledge distillation. Export do TensorRT/OpenVINO/TFLite. Validace na edge hardware před deploy.