Jednoduchá vector DB pro prototypy.
Instalace¶
pip install chromadb
Použití¶
import chromadb client = chromadb.Client() col = client.create_collection(‘docs’) col.add(documents=[‘PG je DB’,’Redis je cache’], ids=[‘d1’,’d2’]) results = col.query(query_texts=[‘relační databáze’], n_results=5)
Persistent¶
client = chromadb.PersistentClient(path=’/data/chroma’)
Kdy použít ChromaDB¶
ChromaDB je ideální pro rychlé prototypování AI aplikací, zejména RAG (Retrieval-Augmented Generation) pipeline. Díky jednoduchému Python API můžete během minut vytvořit funkční semantic search. ChromaDB automaticky generuje embeddingy pomocí výchozího modelu, takže nemusíte řešit embedding pipeline samostatně.
Pro produkční nasazení s miliony dokumentů zvažte přechod na Qdrant nebo Pinecone, které nabízejí lepší škálovatelnost a distribuované zpracování. ChromaDB však zůstává nejlepší volbou pro lokální vývoj, experimenty a menší projekty do přibližně 100 000 dokumentů. Podporuje také filtrování podle metadat, což umožňuje kombinovat vektorové vyhledávání s klasickými filtry.
ChromaDB pro start¶
Nejjednodušší vector search. Pro produkci Pinecone/Qdrant.