OLAP Databáze
DuckDB — analytická databáze přímo ve vašem notebooku
DuckDB je SQLite pro analytiku — embedded sloupcová databáze bez serveru. Gigabajty dat rychlostí konkurující Sparku.
DuckDB — analytika bez infrastruktury
In-process OLAP bez serveru — běží ve vaší aplikaci.
import duckdb
result = duckdb.sql("""
SELECT region, COUNT(*) AS orders, SUM(total_czk) AS revenue
FROM 'data/orders/*.parquet'
WHERE order_date >= '2026-01-01'
GROUP BY region ORDER BY revenue DESC
""").fetchdf()
# Různé formáty bez importu
duckdb.sql("SELECT * FROM 'data.csv' LIMIT 10")
duckdb.sql("SELECT * FROM 's3://bucket/*.parquet'")
Kdy použít DuckDB
- Lokální analýza — ad-hoc dotazy
- Prototypování — testování SQL
- CI/CD — testování dbt lokálně
- Data science — SQL v Jupyter
Shrnutí
DuckDB je revoluční pro lokální analytiku. Zero setup, SQL nad soubory, integrace s pandas.