Home / Know-how / Data

KATEGORIE

Data

61 articles

intermediate12. 11. 2025

MongoDB Aggregation Pipeline

Jak efektivně dotazovat MongoDB. $match, $group, $lookup, $unwind.

intermediate30. 10. 2025

ETL vs ELT — When to Use Which Approach for Data Pipelines

Porovnání ETL a ELT přístupů k datovým pipeline. Kdy zvolit extrakci před transformací a kdy naopak.

intermediate21. 10. 2025

ChromaDB Tutorial

Open-source vector DB — installation and querying.

intermediate20. 10. 2025

The Complete Guide to PostgreSQL

PostgreSQL kompletně — instalace, SQL, indexy, JSONB, replikace, backup.

intermediate14. 10. 2025

SQL vs NoSQL

Relational vs non-relational databases — CAP theorem and use cases.

intermediate01. 10. 2025

How to Scale an Application from 0 to 1M Users

Progressive web application scaling — from a single server to a million users.

intermediate25. 09. 2025

Lakehouse architektura — spojení data lake a warehouse

Lakehouse kombinuje flexibilitu data lake se spolehlivostí warehouse. Medalionová architektura.

intermediate24. 09. 2025

Parquet, Avro, ORC — Serialization Formats for Data Engineering

Comparison of data formats Parquet, Avro, ORC and JSON. When to use which in data pipeline.

intermediate17. 09. 2025

MongoDB vs PostgreSQL

Document vs relational database — when to choose which.

intermediate07. 09. 2025

The Complete Guide to Elasticsearch

Elasticsearch — full-text search, agregace, logging, monitoring.

intermediate22. 08. 2025

Spark Structured Streaming — Unified Batch and Stream Processing

Spark Structured Streaming combines batch and stream in one API. Micro-batch and Delta Lake integration.

intermediate21. 08. 2025

Batch Processing

Jak efektivně zpracovávat velké objemy dat. Chunks, streaming, parallel.

intermediate13. 08. 2025

System design interview: příprava

Jak se připravit na system design interview — framework, příklady, zdroje.

intermediate13. 08. 2025

Looker — BI platforma s LookML modelovací vrstvou

Looker od Google s LookML vrstvou. Centrální definice metrik a governance.

intermediate12. 08. 2025

OWASP Top 10: Injection

SQL injection, NoSQL injection, OS command injection — jak fungují a jak se bránit.

intermediate04. 08. 2025

Read Replicas — scaling čtení

Škálování database pomocí read replik. Master-slave replikace a routing.

intermediate05. 07. 2025

ClickHouse — Columnar Database for Lightning-Fast Analytical Queries

ClickHouse is an open-source columnar OLAP database. MergeTree engine and materialized views.

intermediate10. 06. 2025

Docker Compose pro development

Lokální development s docker-compose. Multi-kontejner setup, volumes a networking.

intermediate02. 06. 2025

Trino — distribuovaný SQL engine pro federované dotazy

Trino je distribuovaný SQL engine pro dotazy nad heterogenními zdroji bez přesunu dat.

intermediate05. 04. 2025

Hadoop ekosystém — HDFS, YARN a moderní alternativy

The Hadoop ecosystem from HDFS to Hive. History and the transition to modern cloud solutions.

intermediate22. 03. 2025

PostgreSQL Replication

Streaming and logical replication, failover.

intermediate23. 02. 2025

DataHub — Open Data Catalog for Modern Data Stack

DataHub from LinkedIn is open-source data catalog. Metadata, lineage and governance.

intermediate03. 02. 2025

Redis Patterns — cache, session, queue

Redis jako cache, session store, pub/sub, rate limiter.

intermediate12. 12. 2024

PostgreSQL JSON Operations

JSONB type, operators, indexes and practical examples.

intermediate13. 11. 2024

PostgreSQL Indexes Deep Dive

B-tree, GIN, GiST, BRIN, partial and expression indexes.

intermediate06. 11. 2024

PostgreSQL vs MySQL

The two most popular open-source SQL databases.

intermediate08. 09. 2024

Apache Flink — real-time stream processing engine

Apache Flink je framework pro stateful stream processing. Windowing, event time a exactly-once sémantika.

intermediate10. 07. 2024

PostgreSQL Advanced Features

JSONB, CTE, window functions, partitioning, extensions.

intermediate27. 04. 2024

Connection Pooling

Jak správně poolovat databázové spojení. PgBouncer, HikariCP, SQLAlchemy.

intermediate24. 03. 2024

OLAP vs OLTP — analytické vs transakční databáze

Rozdíl mezi OLAP a OLTP databázemi. Sloupcové vs řádkové uložení a volba pro různé use cases.

intermediate16. 03. 2024

Dagster — Modern Orchestration with Asset-Based Approach

Dagster brings asset-oriented approach to orchestration. Software-defined assets, type system and monitoring.

intermediate02. 03. 2024

WebSocket — real-time komunikace

Implementace WebSocket serveru pro chat, notifikace a live dashboardy. Škálování s Redis.

intermediate12. 01. 2024

AWS RDS — Managed Databases

Relational Database Service. Multi-AZ, Read Replicas, Aurora, backup, and performance tuning.

intermediate26. 11. 2023

Real-time analytics — architektura pro analýzu v reálném čase

Architektura real-time analytics. Lambda vs Kappa, streaming pipelines a OLAP enginy.

intermediate20. 09. 2023

Debezium — Change Data Capture for Real-time Replication

Debezium is open-source CDC platform. Capturing database changes via Kafka Connect.

intermediate07. 08. 2023

Kdy použít NoSQL vs SQL

SQL vs NoSQL — PostgreSQL vs MongoDB vs Redis. Kdy co použít.

intermediate28. 07. 2023

Azure Cosmos DB — Globální NoSQL

Cosmos DB API modely, konzistenční úrovně, partitioning a RU optimalizace.

intermediate04. 07. 2023

PostgreSQL Partitioning

Declarative partitioning for large tables.

intermediate10. 06. 2023

Redis Pub/Sub

Real-time messaging with Redis Pub/Sub.

intermediate26. 05. 2023

Kolik stojí hosting webové aplikace (2025)

Reálné náklady na hosting webové aplikace — od free tier po enterprise.

intermediate09. 03. 2023

Apache Kafka — distribuovaná streamovací platforma

Apache Kafka je distribuovaný event streaming systém. Témata, partitioning a consumer groups.

intermediate01. 02. 2023

Elasticsearch tutorial

Full-text search, indexing, queries, aggregations.

intermediate28. 01. 2023

Apache Iceberg — otevřený table format pro data lake

Apache Iceberg — hidden partitioning, schema evolution a time travel. Vendor-neutral.

intermediate06. 11. 2022

dbt — Data Transformation in Warehouse Using SQL

dbt enables data transformation in warehouse using SQL. Models, tests, documentation and versioning.

intermediate16. 07. 2022

Database Migration Checklist

Database migration checklist — planning, testing, rollback, zero-downtime.

intermediate25. 06. 2022

CAP Theorem prakticky

Praktické dopady CAP theoremu na design. CP vs AP systémy.

intermediate20. 06. 2022

Kafka Connect — integrace systémů bez kódu

Kafka Connect propojuje Kafka s databázemi, soubory a cloud službami. Source a sink konektory bez programování.

intermediate04. 06. 2022

Apache Spark — distribuované batch zpracování velkých dat

Apache Spark je engine pro distribuované zpracování dat. DataFrame API, Spark SQL a optimalizace.

intermediate08. 05. 2022

Kafka vs RabbitMQ

Event streaming vs message broker — architecture and use cases.

intermediate10. 04. 2022

Docker Volumes a Storage

Správa dat v Dockeru — volumes, bind mounts a best practices.

intermediate03. 12. 2021

PostgreSQL: 15 optimalizačních triků

PostgreSQL optimalizace — indexy, EXPLAIN ANALYZE, connection pooling, vacuum a další.

intermediate25. 09. 2021

PostgreSQL Installation and Configuration

Complete guide to PostgreSQL installation and configuration.

intermediate05. 08. 2021

Redis Streams

Persistent event streaming with consumer groups.

intermediate13. 01. 2021

Schema Registry — centrální správa schémat pro streaming

Schema Registry verzuje schémata v Kafka ekosystému. Avro, Protobuf a kompatibilitní strategie.

intermediate21. 12. 2020

Lakehouse vs Data Warehouse — When to Choose Which Approach

Comparison of lakehouse and traditional data warehouse. Architecture, costs, performance and migration.

intermediate02. 06. 2020

Metabase — open-source BI pro self-serve analytiku

Metabase je open-source BI platforma. Query builder, dashboardy a embedding.

intermediate24. 05. 2020

Database per Service

Proč by měla mít každá mikroservisa vlastní databázi a jak řešit dotazy napříč službami.

intermediate12. 05. 2020

PostgreSQL EXPLAIN ANALYZE

Reading query plans — scans, joins, cost and optimization.

intermediate05. 02. 2020

Analytics engineering — role mezi daty a business

Analytics engineering spojuje data engineering a business analytics. dbt, modelování a self-serve.

intermediate03. 07. 2019

DuckDB — analytická databáze přímo ve vašem notebooku

DuckDB je embedded OLAP databáze. Zero dependency, SQL nad CSV, Parquet a JSON.

intermediate21. 03. 2019

MySQL vs PostgreSQL

Two most popular open-source relational databases.

Všechny kategorie

Ai 278 Architecture 17 Cloud 105 Data 61 Development 116 Devops 28 Guide 2 Infrastructure 21 Observability 1 Security 24