Klíčová infrastruktura pro AI, RAG a semantic search.
Princip¶
Data → embedding model → vektor → uložení. Query → embedding → nearest neighbor → výsledky.
Algoritmy¶
- HNSW — nejpopulárnější
- IVF — partitioning
- Flat — brute force
Databáze¶
- Pinecone — managed
- ChromaDB — OSS embedded
- Weaviate — hybrid search
- Qdrant — Rust, výkon
-
pgvector — PG extension
-
RAG
- Semantic search
- Recommendations
- Image similarity
Jak vybrat správnou vector databázi¶
Při výběru zvažte několik faktorů: velikost datasetu, požadavky na latenci, provozní komplexitu a rozpočet. Pro prototypy a menší projekty (do 100K vektorů) je ChromaDB nebo pgvector nejjednodušší start. Pro produkční workloady s miliony vektorů zvažte Pinecone (managed, zero ops) nebo Qdrant (self-hosted, vysoký výkon).
HNSW algoritmus nabízí nejlepší poměr rychlost/přesnost pro většinu use cases. Index se buduje při vkládání dat a umožňuje approximate nearest neighbor (ANN) vyhledávání v sublineárním čase. Parametry ef_construction a M ovlivňují kvalitu indexu vs. rychlost budování. Pro hybridní vyhledávání (kombinace vektorové podobnosti a keyword filtru) je Weaviate přední volba díky nativní podpoře BM25 + vector search.
Vector DB pro AI¶
Nezbytné pro RAG a semantic search.