DataHub centralizuje metadata z celého data stacku — automatický lineage, vyhledávání, tagging a governance.
DataHub — centrální hub pro metadata¶
Řeší problém — kde najít data a jak jim důvěřovat.
Funkce¶
- Automatická ingestion — 50+ konektorů
- Lineage — automatické mapování závislostí
- Search — full-text vyhledávání
- Ownership — přiřazení vlastníků
# datahub-ingestion.yml
source:
type: postgres
config:
host_port: "warehouse:5432"
database: analytics
profiling:
enabled: true
sink:
type: datahub-rest
config:
server: "http://datahub:8080"
Shrnutí¶
DataHub je přední open-source katalog s automatickým lineage a bohatými integracemi.
datahubdata catalogmetadatalineage