_CORE
AI & Agentic Systems Core Information Systems Cloud & Platform Engineering Data Platform & Integration Security & Compliance QA, Testing & Observability IoT, Automation & Robotics Mobile & Digital Banking & Finance Insurance Public Administration Defense & Security Healthcare Energy & Utilities Telco & Media Manufacturing Logistics & E-commerce Retail & Loyalty
References Technologies Blog Know-how Tools
About Collaboration Careers
CS EN
Let's talk

DuckDB — analytická databáze přímo ve vašem notebooku

03. 07. 2019 1 min read intermediate

DuckDB je SQLite pro analytiku — embedded sloupcová databáze bez serveru. Gigabajty dat rychlostí konkurující Sparku.

DuckDB — analytika bez infrastruktury

In-process OLAP bez serveru — běží ve vaší aplikaci.

import duckdb

result = duckdb.sql("""
    SELECT region, COUNT(*) AS orders, SUM(total_czk) AS revenue
    FROM 'data/orders/*.parquet'
    WHERE order_date >= '2026-01-01'
    GROUP BY region ORDER BY revenue DESC
""").fetchdf()

# Různé formáty bez importu
duckdb.sql("SELECT * FROM 'data.csv' LIMIT 10")
duckdb.sql("SELECT * FROM 's3://bucket/*.parquet'")

When to Use DuckDB

  • Lokální analýza — ad-hoc dotazy
  • Prototypování — testování SQL
  • CI/CD — testování dbt lokálně
  • Data science — SQL v Jupyter

Summary

DuckDB je revoluční pro lokální analytiku. Zero setup, SQL nad soubory, integrace s pandas.

duckdbolapembeddedanalytics
Share:

CORE SYSTEMS tým

Stavíme core systémy a AI agenty, které drží provoz. 15 let zkušeností s enterprise IT.