Modern Data Stack je ekosystém cloud-native nástrojů pro datovou platformu. Od ingestion přes transformace po vizualizaci — přehled klíčových komponent a jejich alternativ.
Vrstvy Modern Data Stack¶
1. Ingestion (EL)¶
- Fivetran — SaaS, 300+ konektorů
- Airbyte — open-source alternativa
- Stitch — jednoduchý, Talend
2. Storage & Compute¶
- Snowflake — oddělený compute/storage
- BigQuery — serverless, Google
- Databricks — lakehouse, Spark
3. Transformace¶
- dbt — SQL transformace jako kód
4. Orchestrace¶
- Airflow / Dagster / Prefect
5. Data Quality¶
- Great Expectations / Soda / Elementary
6. BI & Vizualizace¶
- Metabase / Superset / Looker
# Typický MDS stack:
# Fivetran → Snowflake → dbt → Metabase
# Airflow (orchestrace)
# Great Expectations (kvalita)
# DataHub (katalog)
# Open-source alternativa:
# Airbyte → DuckDB/Postgres → dbt → Superset
# Dagster (orchestrace)
# Soda (kvalita)
# OpenMetadata (katalog)
Trendy¶
- Konsolidace — méně nástrojů, více funkcí v jednom
- Open source — rostoucí adopce OSS alternativ
- Lakehouse — nahrazování warehouse lakehouse přístupem
Shrnutí¶
Modern Data Stack je modulární a cloud-native. Vyberte nástroje podle velikosti týmu, budgetu a technických požadavků.
modern data stackarchitekturanástrojepřehled