Startseite / Know-how / Data

KATEGORIE

Data

61 Artikeln

intermediate12. 11. 2025

MongoDB Aggregation Pipeline

Wie man MongoDB effizient abfragt. $match, $group, $lookup, $unwind.

intermediate30. 10. 2025

ETL vs ELT -- Wann welchen Ansatz fuer Datenpipelines verwenden

Vergleich von ETL- und ELT-Ansaetzen fuer Datenpipelines. Wann Extraktion vor Transformation waehlen und wann umgekehrt.

intermediate21. 10. 2025

ChromaDB Tutorial

Open-Source-Vektordatenbank — Installation und Abfragen.

intermediate20. 10. 2025

Der vollstaendige Leitfaden zu PostgreSQL

PostgreSQL komplett -- Installation, SQL, Indizes, JSONB, Replikation, Backup.

intermediate14. 10. 2025

SQL vs NoSQL

Relationale vs nicht-relationale Datenbanken — CAP-Theorem und Einsatzgebiete.

intermediate01. 10. 2025

Wie man eine Anwendung von 0 auf 1M Benutzer skaliert

Schrittweise Skalierung einer Webanwendung — von einem einzelnen Server bis zu einer Million Benutzer.

intermediate25. 09. 2025

Lakehouse-Architektur — Vereinigung von Data Lake und Warehouse

Lakehouse vereint die Flexibilität eines Data Lake mit der Zuverlässigkeit eines Warehouse. Medallion-Architektur.

intermediate24. 09. 2025

Parquet, Avro, ORC — Serialisierungsformate für Data Engineering

Vergleich der Datenformate Parquet, Avro, ORC und JSON. Welches Format in welcher Data-Pipeline einsetzen.

intermediate17. 09. 2025

MongoDB vs PostgreSQL

Dokument- vs relationale Datenbank — wann was wählen.

intermediate07. 09. 2025

Der vollstaendige Leitfaden zu Elasticsearch

Elasticsearch -- Volltextsuche, Aggregationen, Logging, Monitoring.

intermediate22. 08. 2025

Spark Structured Streaming — Batch- & Stream-Verarbeitung

Spark Structured Streaming kombiniert Batch und Stream in einer API. Micro-Batch und Delta Lake Integration.

intermediate21. 08. 2025

Batch-Verarbeitung

Wie man große Datenmengen effizient verarbeitet. Chunks, Streaming, Parallel.

intermediate13. 08. 2025

System Design Interview: Vorbereitung

Wie man sich auf ein System Design Interview vorbereitet — Framework, Beispiele, Ressourcen.

intermediate13. 08. 2025

Looker — BI-Plattform mit LookML-Modellierungsschicht

Looker von Google mit LookML-Schicht. Zentrale Metrik-Definitionen und Governance.

intermediate12. 08. 2025

OWASP Top 10: Injection

SQL Injection, NoSQL Injection, OS Command Injection — wie sie funktionieren und wie man sich schützt.

intermediate04. 08. 2025

Read Replicas — Leseskalierung

Datenbankskalierung mit Read Replicas. Master-Slave-Replikation und Routing.

intermediate05. 07. 2025

ClickHouse — Spaltenbasierte Datenbank für schnelle Analytik

ClickHouse ist eine Open-Source spaltenbasierte OLAP-Datenbank. MergeTree Engine und Materialized Views.

intermediate10. 06. 2025

Docker Compose für die Entwicklung

Lokale Entwicklung mit docker-compose. Multi-Container-Setup, Volumes und Networking.

intermediate02. 06. 2025

Trino — Verteilte SQL-Engine für föderierte Abfragen

Trino ist eine verteilte SQL-Engine für Abfragen über heterogene Quellen ohne Datenverschiebung.

intermediate05. 04. 2025

Hadoop-Ökosystem — HDFS, YARN und moderne Alternativen

Das Hadoop-Oekosystem von HDFS bis Hive. Geschichte und der Uebergang zu modernen Cloud-Loesungen.

intermediate22. 03. 2025

PostgreSQL Replikation

PostgreSQL-Replikation einrichten — Streaming- und logische Replikation, automatisches Failover, Read-Replicas und...

intermediate23. 02. 2025

DataHub — Offener Datenkatalog für den modernen Data Stack

DataHub von LinkedIn ist ein Open-Source-Datenkatalog. Metadaten, Lineage und Governance.

intermediate03. 02. 2025

Redis Patterns — Cache, Session, Queue

Redis als Cache, Session Store, Pub/Sub, Rate Limiter.

intermediate12. 12. 2024

PostgreSQL JSON-Operationen

JSONB-Typ, Operatoren, Indizes und praktische Beispiele.

intermediate13. 11. 2024

PostgreSQL Indizes im Detail

B-tree, GIN, GiST, BRIN, partielle und Expression-Indizes.

intermediate06. 11. 2024

PostgreSQL vs MySQL

Vergleich der zwei beliebtesten Open-Source-SQL-Datenbanken — PostgreSQL vs MySQL, Funktionen, Leistung und Einsatzbereiche.

intermediate08. 09. 2024

Apache Flink — Real-time Stream Processing Engine

Apache Flink ist ein Framework fuer Stateful Stream Processing. Windowing, Event Time und Exactly-once-Semantik.

intermediate10. 07. 2024

PostgreSQL Erweiterte Features

JSONB, CTE, Window Functions, Partitioning, Extensions.

intermediate27. 04. 2024

Connection Pooling

Wie man Datenbankverbindungen richtig poolt. PgBouncer, HikariCP, SQLAlchemy.

intermediate24. 03. 2024

OLAP vs. OLTP — Analytische vs. transaktionale Datenbanken

Unterschied zwischen OLAP- und OLTP-Datenbanken. Spalten- vs. Zeilenspeicherung und Auswahl für verschiedene Use Cases.

intermediate16. 03. 2024

Dagster — Moderne Orchestrierung mit Asset-basiertem Ansatz

Dagster bringt einen asset-orientierten Ansatz zur Orchestrierung. Software-defined Assets, Type System und Monitoring.

intermediate02. 03. 2024

WebSocket — Echtzeit-Kommunikation

WebSocket-Server-Implementierung für Chat, Benachrichtigungen und Live-Dashboards. Skalierung mit Redis.

intermediate12. 01. 2024

AWS RDS — Managed Datenbanken

Relational Database Service. Multi-AZ, Read Replicas, Aurora, Backup und Performance-Tuning.

intermediate26. 11. 2023

Real-Time Analytics — Architektur für Echtzeitanalyse

Real-Time-Analytics-Architektur. Lambda vs Kappa, Streaming-Pipelines und OLAP-Engines.

intermediate20. 09. 2023

Debezium — Change Data Capture für Echtzeit-Replikation

Debezium ist eine Open-Source-CDC-Plattform. Erfassung von Datenbankänderungen über Kafka Connect.

intermediate07. 08. 2023

Wann NoSQL vs SQL verwenden

SQL vs NoSQL -- PostgreSQL vs MongoDB vs Redis. Wann was verwenden.

intermediate28. 07. 2023

Azure Cosmos DB — Globales NoSQL

Cosmos DB API-Modelle, Konsistenzebenen, Partitioning und RU-Optimierung.

intermediate04. 07. 2023

PostgreSQL Partitionierung

Deklarative Partitionierung in PostgreSQL für große Tabellen — Range-, List- und Hash-Strategien, Partition-Wartung...

intermediate10. 06. 2023

Redis Pub/Sub

Echtzeit-Messaging mit Redis Pub/Sub — Publish, Subscribe, Pattern Matching, Einschränkungen und Vergleich mit Redis Streams.

intermediate26. 05. 2023

Was kostet das Hosting einer Webanwendung (2025)

Reale Kosten fuer das Hosting einer Webanwendung -- vom Free Tier bis Enterprise.

intermediate09. 03. 2023

Apache Kafka — Verteilte Streaming-Plattform

Apache Kafka ist ein verteiltes Event-Streaming-System. Topics, Partitioning und Consumer Groups.

intermediate01. 02. 2023

Elasticsearch-Tutorial

Volltextsuche, Indexierung, Abfragen, Aggregationen.

intermediate28. 01. 2023

Apache Iceberg — Offenes Tabellenformat fuer Data Lake

Apache Iceberg — Hidden Partitioning, Schema Evolution und Time Travel. Herstellerneutral.

intermediate06. 11. 2022

dbt — Datentransformation im Warehouse mit SQL

dbt ermöglicht Datentransformation im Warehouse mit SQL. Modelle, Tests, Dokumentation und Versionierung.

intermediate16. 07. 2022

Datenbank-Migration-Checkliste

Datenbank-Migration-Checkliste -- Planung, Tests, Rollback, Zero-Downtime.

intermediate25. 06. 2022

CAP Theorem in der Praxis

Praktische Auswirkungen des CAP Theorems auf das Design. CP- vs. AP-Systeme.

intermediate20. 06. 2022

Kafka Connect — Systemintegration ohne Code

Kafka Connect verbindet Kafka mit Datenbanken, Dateien und Cloud-Diensten. Source- und Sink-Konnektoren ohne Programmierung.

intermediate04. 06. 2022

Apache Spark — Verteilte Batch-Verarbeitung von Big Data

Apache Spark ist eine Engine für verteilte Datenverarbeitung. DataFrame API, Spark SQL und Optimierung.

intermediate08. 05. 2022

Kafka vs RabbitMQ

Event Streaming vs Message Broker — Architektur und Einsatzgebiete.

intermediate10. 04. 2022

Docker Volumes und Storage

Datenverwaltung in Docker — Volumes, Bind Mounts und Best Practices.

intermediate03. 12. 2021

PostgreSQL: 15 Optimierungstricks

PostgreSQL-Optimierung — Indexe, EXPLAIN ANALYZE, Connection Pooling, Vacuum und mehr.

intermediate25. 09. 2021

PostgreSQL Installation und Konfiguration

Vollständige Anleitung zur Installation und Konfiguration von PostgreSQL.

intermediate05. 08. 2021

Redis Streams

Persistentes Event-Streaming in Redis Streams — Append-Only Log, Consumer Groups, Acknowledgment und Event Sourcing.

intermediate13. 01. 2021

Schema Registry — Zentrale Schemaverwaltung für Streaming

Schema Registry versioniert Schemas im Kafka-Ökosystem. Avro, Protobuf und Kompatibilitätsstrategien.

intermediate21. 12. 2020

Lakehouse vs Data Warehouse — Wann welchen Ansatz wählen

Vergleich von Lakehouse und traditionellem Data Warehouse. Architektur, Kosten, Leistung und Migration.

intermediate02. 06. 2020

Metabase — Open-Source-BI für Self-Serve-Analytik

Metabase ist eine Open-Source-BI-Plattform. Query Builder, Dashboards und Embedding.

intermediate24. 05. 2020

Database per Service

Warum jeder Microservice seine eigene Datenbank haben sollte und wie man dienstübergreifende Abfragen löst.

intermediate12. 05. 2020

PostgreSQL EXPLAIN ANALYZE

Abfragepläne lesen — Scans, Joins, Cost und Optimierung.

intermediate05. 02. 2020

Analytics Engineering — Die Rolle zwischen Daten und Business

Analytics Engineering verbindet Data Engineering und Business Analytics. dbt, Modellierung und Self-Serve.

intermediate03. 07. 2019

DuckDB — Analytische Datenbank direkt in Ihrem Notebook

DuckDB ist eine eingebettete OLAP-Datenbank. Zero Dependency, SQL ueber CSV, Parquet und JSON.

intermediate21. 03. 2019

MySQL vs PostgreSQL

Die zwei beliebtesten relationalen Open-Source-Datenbanken.

Alle Kategorien

Ai 278 Architecture 17 Cloud 105 Data 61 Development 116 Devops 28 Guide 2 Infrastructure 21 Observability 1 Security 24