Monitoring & Prediktivní údržba
Opravit před poruchou. Ne po ní.
Kontinuální monitoring, anomaly detection, predikce Remaining Useful Life. Snížení neplánovaných výpadků o 70%.
Od reaktivní k prediktivní údržbě¶
Většina průmyslových firem provozuje údržbu reaktivně nebo časově. Obojí je suboptimální:
Reaktivní údržba: Stroj se rozbije → opravíme. Neplánovaný výpadek, expresní díly, přesčasy. Nejdražší přístup — neplánovaný výpadek stojí 3-10× víc než plánovaný.
Časová údržba: Každých 6 měsíců vyměníme ložisko. Bez ohledu na skutečný stav. Měníme díly, které ještě fungují (waste). A stejně nás překvapí porucha mezi intervaly.
Prediktivní údržba: Kontinuální monitoring stavu. Údržba když data říkají „za 2 týdny bude problém” — ne dříve (waste), ne později (porucha). Optimální timing, minimální výpadky.
ROI v číslech¶
Průmyslový konsensus (McKinsey, Deloitte):
- 25-30% snížení nákladů na údržbu
- 70-75% snížení neplánovaných výpadků
- 20-25% prodloužení životnosti zařízení
- 35-45% snížení inventory náhradních dílů
Neplánovaný výpadek výrobní linky: 50-500 tis. CZK/hodinu (závisí na odvětví). Jeden předpovězený a předejitý výpadek zaplatí projekt.
Condition monitoring¶
Senzory a měřené veličiny¶
Vibrace — nejcitlivější indikátor mechanického stavu: - Akcelerometry na ložiskových domcích, motorech, převodovkách - FFT (Fast Fourier Transform) analýza frekvenčního spektra - Charakteristické frekvence: BPFO, BPFI, BSF, FTF pro různé typy defektů ložisek - Envelope analysis pro detekci rané fáze defektu
Teplota: - Povrchová teplota motorů, ložisek, transformátorů - Termokamery pro bezdotykové měření - Trend: pomalý nárůst nad baseline = degradace maziva, přetížení, ucpaný chladič
Elektrické veličiny: - Proud a napětí — motor current signature analysis (MCSA) - Asymetrie fází = problém vinutí - Nárůst proudu při konstantním zatížení = mechanický odpor
Další: - Akustická emise — ultrazvuková detekce úniků, partial discharge - Tlak — hydraulické systémy, kompresory, filtrační systémy - Průtok — chladicí okruhy, mazací systémy - Vlhkost — transformátorový olej, izolace
Senzorická infrastruktura¶
Retrofit bez zásahu do kabeláže:
Wireless vibration senzory (ABB, SKF, Fluke) s baterií na 3-5 let. Instalace za minuty — magnet nebo lepidlo na ložiskový domek. Komunikace přes BLE, Wi-Fi nebo LoRaWAN do gateway → cloud/edge.
Integrace s existujícím PLC:
Většina moderních PLC už sbírá data z analogových vstupů. Nemusíme přidávat senzory — stačí data exportovat přes OPC-UA. Problém: PLC typicky vzorkuje pomalu (1 Hz) — pro vibrace potřebujeme 10-50 kHz (dedikovaný senzor).
Anomaly detection¶
Baseline — co je normální¶
Každý stroj má svůj „otisk normálního provozu.” Vibrace na frekvenci 120 Hz s amplitudou 2.5 mm/s je normální pro motor X za zatížení Y. Statistický model normálu:
- Training period: 2-4 týdny sběru dat v normálním provozu
- Feature extraction: Statistické featury (mean, std, RMS, kurtosis, crest factor), frekvenční featury (dominant frequencies, spectral entropy)
- Baseline model: Multivariable normal distribution nebo autoencoder
Detekce anomálií¶
Statistické metody (rychle nasaditelné): - Z-score per feature. Alert když |z| > 3 (3 sigma). - Control charts (Shewhart, CUSUM, EWMA). Průmyslový standard, dobře pochopitelné. - Advantage: interpretovatelné, nízké false positive, žádný training.
ML metody (přesnější, komplexnější): - Isolation Forest: Unsupervised, tree-based. Anomálie jsou „snadno izolovatelné” body. Fast, low memory. - One-class SVM: Boundary kolem normálních dat. Vše mimo boundary = anomálie. - Autoencoder: Neural network komprimuje a rekonstruuje vstup. High reconstruction error = anomálie. Zvládne multivariate, non-linear vzorce. - Temporal models: LSTM predikuje next timestep. Velká odchylka prediction vs. actual = anomálie.
Alert management¶
Ne každá anomálie je alarm. Hierarchie:
- Info: Odchylka detekována, trend monitoring aktivován
- Warning: Odchylka trvá / roste. Naplánovat inspekci.
- Alert: Vysoká pravděpodobnost poruchy do X dní. Naplánovat údržbu.
- Critical: Okamžité riziko. Zvážit odstavení.
Fatigue prevention: Příliš mnoho false alarmů = operátoři začnou ignorovat. Target: <5% false positive rate. Alert tuning je kontinuální proces.
Predikce Remaining Useful Life (RUL)¶
Anomaly detection říká: „něco je špatně.” RUL predikce říká: „vydrží ještě ~14 dní.”
Přístupy¶
Physics-based modely: Matematický model degradačního procesu (Paris law pro crack propagation, Archard equation pro opotřebení). Přesné, ale vyžadují hlubokou znalost domény a specifických failure modes.
Data-driven modely:
- Training data: Historická data run-to-failure — senzory od instalace po poruchu. Čím více run-to-failure cyklů, tím lepší model.
- Feature engineering: Sliding window statistiky, trend features, frequency domain features.
- Model: Gradient boosted trees (XGBoost, LightGBM) pro tabulární data. LSTM/Transformer pro sequence data. Survival analysis (Cox regression) pro censored data.
- Output: Predikovaný RUL v dnech/hodinách + confidence interval.
Hybrid: Physics-informed neural networks — ML model s physical constraints. Nejlepší z obou světů.
Bez historických poruch¶
Nemáte run-to-failure data? (Většina firem nemá.) Začínáme s:
- Anomaly detection — zachytí odchylky od normálu
- Degradation tracking — trendy klíčových indikátorů
- Expertní znalost — maintenance tým ví, co indikátory znamenají
- Postupná akumulace failure dat — každá porucha = training data pro budoucí model
Za 1-2 roky provozu typicky nasbíráme dostatek dat pro supervised RUL model.
IoT dashboardy¶
Grafana jako vizualizační platforma¶
- Fleet overview: Všechny stroje na jedné obrazovce. Zelená/žlutá/červená. Drill-down na detail.
- Machine detail: Real-time senzorická data, trendy, historické srovnání, predikce.
- Shift report: KPI per směna — OEE, availability, performance, quality.
- Maintenance view: Open work orders, upcoming predictions, spare parts inventory.
Alerting integrace¶
Alert z monitoring → automatické workflow:
- Anomaly detected → alert v Grafana
- Work order vytvořen v CMMS (SAP PM, Maximo, Fiix)
- Přiřazení technikovi (automaticky nebo manuálně)
- Technik diagnostikuje a opraví
- Potvrzení opravy → uzavření work order
- Feedback do ML modelu (was prediction correct?)
Mobilní přístup¶
Maintenance tým v terénu potřebuje data na telefonu:
- Responsive Grafana dashboardy
- Push notifikace při novém alertu
- QR kód na stroji → otevře dashboard stroje v mobilu
- Offline přístup k runbookům a dokumentaci
Technologický stack¶
Senzory: ABB, SKF, Fluke wireless vibration. Průmyslové RTD/thermocouple. Current transformers.
Data pipeline: MQTT, OPC-UA, Kafka, InfluxDB, TimescaleDB.
ML: scikit-learn, XGBoost, PyTorch (LSTM/Transformer), MLflow, Kubeflow.
Visualization: Grafana, custom web dashboards.
Integration: SAP PM, IBM Maximo, Fiix CMMS, custom work order systems.
Edge: Processing na edge pro real-time anomaly detection (viz Edge Computing).
Časté otázky
Minimálně: vibrace, teplota, proud/napětí, provozní hodiny. Ideálně: historická data o poruchách (co se pokazilo, kdy, za jakých podmínek). Čím více historických dat, tím přesnější predikce. Ale i bez failure history začneme anomaly detection.
Závisí na kvalitě a množství dat. Typicky: anomaly detection zachytí 85-95% incipientních poruch. RUL predikce s přesností ±15-20% (tj. predikce 14 dní → skutečná porucha za 12-17 dní). Přesnost se zlepšuje s více daty.
Často ne. Využijeme data z existujících PLC a SCADA systémů. Pokud chybí klíčové senzory (vibrace na kritických ložiscích), doporučíme retrofit — wireless senzory bez zásahu do kabeláže.
Pilot na 5-10 strojích: 2-3 měsíce, low six figures CZK. Scale-out na celý provoz: 6-12 měsíců. Typický payback period: 6-12 měsíců díky redukci neplánovaných výpadků a optimalizaci plánované údržby.