ChromaDB tutorial

Jednoduchá vector DB pro prototypy.

Instalace¶

pip install chromadb

Použití¶

import chromadb client = chromadb.Client() col = client.create_collection(‘docs’) col.add(documents=[‘PG je DB’,’Redis je cache’], ids=[‘d1’,’d2’]) results = col.query(query_texts=[‘relační databáze’], n_results=5)

Persistent¶

client = chromadb.PersistentClient(path=’/data/chroma’)

Kdy použít ChromaDB¶

ChromaDB je ideální pro rychlé prototypování AI aplikací, zejména RAG (Retrieval-Augmented Generation) pipeline. Díky jednoduchému Python API můžete během minut vytvořit funkční semantic search. ChromaDB automaticky generuje embeddingy pomocí výchozího modelu, takže nemusíte řešit embedding pipeline samostatně.

Pro produkční nasazení s miliony dokumentů zvažte přechod na Qdrant nebo Pinecone, které nabízejí lepší škálovatelnost a distribuované zpracování. ChromaDB však zůstává nejlepší volbou pro lokální vývoj, experimenty a menší projekty do přibližně 100 000 dokumentů. Podporuje také filtrování podle metadat, což umožňuje kombinovat vektorové vyhledávání s klasickými filtry.

ChromaDB pro start¶

Nejjednodušší vector search. Pro produkci Pinecone/Qdrant.

chromadbvector dbpython

Sdílet:

CORE SYSTEMS tým

Stavíme core systémy a AI agenty, které drží provoz. 15 let zkušeností s enterprise IT.

Všechny články

Instalace¶

Použití¶

Persistent¶

Kdy použít ChromaDB¶

ChromaDB pro start¶

CORE SYSTEMS tým

Další know-how

Batch Processing

ChromaDB vs Pinecone

Read Replicas — škálování čtení

ClickHouse — sloupcová databáze pro bleskové analytické dotazy

Odcházíte?