Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Know-how Nástroje
O nás Spolupráce Kariéra
Pojďme to probrat

Modern Data Stack — přehled nástrojů pro moderní datovou platformu

11. 11. 2023 1 min čtení intermediate

Modern Data Stack je ekosystém cloud-native nástrojů pro datovou platformu. Od ingestion přes transformace po vizualizaci — přehled klíčových komponent a jejich alternativ.

Vrstvy Modern Data Stack

1. Ingestion (EL)

  • Fivetran — SaaS, 300+ konektorů
  • Airbyte — open-source alternativa
  • Stitch — jednoduchý, Talend

2. Storage & Compute

  • Snowflake — oddělený compute/storage
  • BigQuery — serverless, Google
  • Databricks — lakehouse, Spark

3. Transformace

  • dbt — SQL transformace jako kód

4. Orchestrace

  • Airflow / Dagster / Prefect

5. Data Quality

  • Great Expectations / Soda / Elementary

6. BI & Vizualizace

  • Metabase / Superset / Looker
# Typický MDS stack:
# Fivetran → Snowflake → dbt → Metabase
# Airflow (orchestrace)
# Great Expectations (kvalita)
# DataHub (katalog)

# Open-source alternativa:
# Airbyte → DuckDB/Postgres → dbt → Superset
# Dagster (orchestrace)
# Soda (kvalita)
# OpenMetadata (katalog)

Trendy

  • Konsolidace — méně nástrojů, více funkcí v jednom
  • Open source — rostoucí adopce OSS alternativ
  • Lakehouse — nahrazování warehouse lakehouse přístupem

Shrnutí

Modern Data Stack je modulární a cloud-native. Vyberte nástroje podle velikosti týmu, budgetu a technických požadavků.

modern data stackarchitekturanástrojepřehled
Sdílet:

CORE SYSTEMS tým

Stavíme core systémy a AI agenty, které drží provoz. 15 let zkušeností s enterprise IT.