Domů / Know-how / Data

KATEGORIE

Data

61 článků

intermediate12. 11. 2025

MongoDB Aggregation Pipeline

Jak efektivně dotazovat MongoDB. $match, $group, $lookup, $unwind.

intermediate30. 10. 2025

ETL vs ELT — kdy použít který přístup pro datové pipeline

Porovnání ETL a ELT přístupů k datovým pipeline. Kdy zvolit extrakci před transformací a kdy naopak.

intermediate21. 10. 2025

ChromaDB tutorial

Open-source vector DB — instalace a dotazování.

intermediate20. 10. 2025

Kompletní průvodce PostgreSQL

PostgreSQL kompletně — instalace, SQL, indexy, JSONB, replikace, backup.

intermediate14. 10. 2025

SQL vs NoSQL

Relační vs nerelační databáze — CAP theorem a use cases.

intermediate01. 10. 2025

Jak škálovat aplikaci od 0 do 1M uživatelů

Postupné škálování webové aplikace — od jednoho serveru po milion uživatelů.

intermediate25. 09. 2025

Lakehouse architektura — spojení data lake a warehouse

Lakehouse kombinuje flexibilitu data lake se spolehlivostí warehouse. Medalionová architektura.

intermediate24. 09. 2025

Parquet, Avro, ORC — serializační formáty pro data engineering

Porovnání datových formátů Parquet, Avro, ORC a JSON. Kdy který použít v data pipeline.

intermediate17. 09. 2025

MongoDB vs PostgreSQL

Dokumentová vs relační databáze — kdy co zvolit.

intermediate07. 09. 2025

Kompletní průvodce Elasticsearch

Elasticsearch — full-text search, agregace, logging, monitoring.

intermediate22. 08. 2025

Spark Structured Streaming — unifikované batch a stream zpracování

Spark Structured Streaming kombinuje batch a stream v jednom API. Micro-batch a Delta Lake integrace.

intermediate21. 08. 2025

Batch Processing

Jak efektivně zpracovávat velké objemy dat. Chunks, streaming, parallel.

intermediate13. 08. 2025

System design interview: příprava

Jak se připravit na system design interview — framework, příklady, zdroje.

intermediate13. 08. 2025

Looker — BI platforma s LookML modelovací vrstvou

Looker od Google s LookML vrstvou. Centrální definice metrik a governance.

intermediate12. 08. 2025

OWASP Top 10: Injection

SQL injection, NoSQL injection, OS command injection — jak fungují a jak se bránit.

intermediate04. 08. 2025

Read Replicas — škálování čtení

Škálování databáze pomocí read replik. Master-slave replikace a routing.

intermediate05. 07. 2025

ClickHouse — sloupcová databáze pro bleskové analytické dotazy

ClickHouse je open-source sloupcová OLAP databáze. MergeTree engine a materialized views.

intermediate10. 06. 2025

Docker Compose pro development

Lokální development s docker-compose. Multi-kontejner setup, volumes a networking.

intermediate02. 06. 2025

Trino — distribuovaný SQL engine pro federované dotazy

Trino je distribuovaný SQL engine pro dotazy nad heterogenními zdroji bez přesunu dat.

intermediate05. 04. 2025

Hadoop ekosystém — HDFS, YARN a moderní alternativy

Hadoop ekosystém od HDFS po Hive. Historie a přechod na moderní cloudové řešení.

intermediate22. 03. 2025

PostgreSQL replikace

Streaming a logical replikace, failover.

intermediate23. 02. 2025

DataHub — otevřený datový katalog pro moderní data stack

DataHub od LinkedIn je open-source datový katalog. Metadata, lineage a governance.

intermediate03. 02. 2025

Redis Patterns — cache, session, queue

Redis jako cache, session store, pub/sub, rate limiter.

intermediate12. 12. 2024

PostgreSQL JSON operace

JSONB typ, operátory, indexy a praktické příklady.

intermediate13. 11. 2024

PostgreSQL indexy deep dive

B-tree, GIN, GiST, BRIN, partial a expression indexy.

intermediate06. 11. 2024

PostgreSQL vs MySQL

Dvě nejpopulárnější open-source SQL databáze.

intermediate08. 09. 2024

Apache Flink — real-time stream processing engine

Apache Flink je framework pro stateful stream processing. Windowing, event time a exactly-once sémantika.

intermediate10. 07. 2024

PostgreSQL Advanced Features

JSONB, CTE, window functions, partitioning, extensions.

intermediate27. 04. 2024

Connection Pooling

Jak správně poolovat databázové spojení. PgBouncer, HikariCP, SQLAlchemy.

intermediate24. 03. 2024

OLAP vs OLTP — analytické vs transakční databáze

Rozdíl mezi OLAP a OLTP databázemi. Sloupcové vs řádkové uložení a volba pro různé use cases.

intermediate16. 03. 2024

Dagster — moderní orchestrace s asset-based přístupem

Dagster přináší asset-oriented přístup k orchestraci. Software-defined assets, type system a monitoring.

intermediate02. 03. 2024

WebSocket — real-time komunikace

Implementace WebSocket serveru pro chat, notifikace a live dashboardy. Škálování s Redis.

intermediate12. 01. 2024

AWS RDS — Managed databáze

Relational Database Service. Multi-AZ, Read Replicas, Aurora, backup a performance tuning.

intermediate26. 11. 2023

Real-time analytics — architektura pro analýzu v reálném čase

Architektura real-time analytics. Lambda vs Kappa, streaming pipelines a OLAP enginy.

intermediate20. 09. 2023

Debezium — Change Data Capture pro real-time replikaci

Debezium je open-source CDC platforma. Zachytávání změn v databázích přes Kafka Connect.

intermediate07. 08. 2023

Kdy použít NoSQL vs SQL

SQL vs NoSQL — PostgreSQL vs MongoDB vs Redis. Kdy co použít.

intermediate28. 07. 2023

Azure Cosmos DB — Globální NoSQL

Cosmos DB API modely, konzistenční úrovně, partitioning a RU optimalizace.

intermediate04. 07. 2023

PostgreSQL partitioning

Deklarativní partitioning pro velké tabulky.

intermediate10. 06. 2023

Redis Pub/Sub

Real-time messaging s Redis Pub/Sub.

intermediate26. 05. 2023

Kolik stojí hosting webové aplikace (2025)

Reálné náklady na hosting webové aplikace — od free tier po enterprise.

intermediate09. 03. 2023

Apache Kafka — distribuovaná streamovací platforma

Apache Kafka je distribuovaný event streaming systém. Témata, partitioning a consumer groups.

intermediate01. 02. 2023

Elasticsearch tutorial

Full-text search, indexing, queries, aggregations.

intermediate28. 01. 2023

Apache Iceberg — otevřený table format pro data lake

Apache Iceberg — hidden partitioning, schema evolution a time travel. Vendor-neutral.

intermediate06. 11. 2022

dbt — transformace dat ve warehouse pomocí SQL

dbt umožňuje transformovat data ve warehouse pomocí SQL. Modely, testy, dokumentace a verzování.

intermediate16. 07. 2022

Database migration checklist

Database migration checklist — plánování, testování, rollback, zero-downtime.

intermediate25. 06. 2022

CAP Theorem prakticky

Praktické dopady CAP theoremu na design. CP vs AP systémy.

intermediate20. 06. 2022

Kafka Connect — integrace systémů bez kódu

Kafka Connect propojuje Kafka s databázemi, soubory a cloud službami. Source a sink konektory bez programování.

intermediate04. 06. 2022

Apache Spark — distribuované batch zpracování velkých dat

Apache Spark je engine pro distribuované zpracování dat. DataFrame API, Spark SQL a optimalizace.

intermediate08. 05. 2022

Kafka vs RabbitMQ

Event streaming vs message broker — architektura a use cases.

intermediate10. 04. 2022

Docker Volumes a Storage

Správa dat v Dockeru — volumes, bind mounts a best practices.

intermediate03. 12. 2021

PostgreSQL: 15 optimalizačních triků

PostgreSQL optimalizace — indexy, EXPLAIN ANALYZE, connection pooling, vacuum a další.

intermediate25. 09. 2021

PostgreSQL instalace a konfigurace

Kompletní průvodce instalací a konfigurací PostgreSQL.

intermediate05. 08. 2021

Redis Streams

Perzistentní event streaming s consumer groups.

intermediate13. 01. 2021

Schema Registry — centrální správa schémat pro streaming

Schema Registry verzuje schémata v Kafka ekosystému. Avro, Protobuf a kompatibilitní strategie.

intermediate21. 12. 2020

Lakehouse vs Data Warehouse — kdy který přístup zvolit

Porovnání lakehouse a tradičního data warehouse. Architektura, náklady, výkon a migrace.

intermediate02. 06. 2020

Metabase — open-source BI pro self-serve analytiku

Metabase je open-source BI platforma. Query builder, dashboardy a embedding.

intermediate24. 05. 2020

Database per Service

Proč by měla mít každá mikroservisa vlastní databázi a jak řešit dotazy napříč službami.

intermediate12. 05. 2020

PostgreSQL EXPLAIN ANALYZE

Čtení query plánů — scany, joins, cost a optimalizace.

intermediate05. 02. 2020

Analytics engineering — role mezi daty a business

Analytics engineering spojuje data engineering a business analytics. dbt, modelování a self-serve.

intermediate03. 07. 2019

DuckDB — analytická databáze přímo ve vašem notebooku

DuckDB je embedded OLAP databáze. Zero dependency, SQL nad CSV, Parquet a JSON.

intermediate21. 03. 2019

MySQL vs PostgreSQL

Dvě nejpopulárnější open-source relační databáze.

Všechny kategorie

Ai 278 Architecture 17 Cloud 105 Data 61 Development 116 Devops 28 Guide 2 Infrastructure 21 Observability 1 Security 24