Kombinace vector a keyword search pro nejlepší výsledky.
Instalace¶
docker run -d -p 8080:8080 semitechnologies/weaviate:latest
Schema + dotaz¶
import weaviate client = weaviate.Client(‘http://localhost:8080’) result = client.query.get(‘Article’,[‘title’,’content’])\ .with_hybrid(query=’PostgreSQL indexy’, alpha=0.5)\ .with_limit(5).do()
- Hybrid (vector+BM25)
- Auto-vectorization
- GraphQL API
- Multi-tenancy
Architektura a funkce¶
Weaviate používá vlastní vektorový index (HNSW) a kombinuje ho s invertovaným indexem pro keyword search. Parametr alpha v hybridním dotazu určuje poměr mezi vektorovou podobností (alpha=1) a BM25 keyword relevancí (alpha=0). Hodnota 0.5 je dobrý výchozí bod.
Auto-vectorization znamená, že Weaviate může automaticky generovat embeddingy při vkládání dat pomocí integrovaných modulů (text2vec-openai, text2vec-transformers). Nemusíte tedy spravovat embedding pipeline externě. GraphQL API umožňuje flexibilní dotazování s filtrováním, agregacemi a cross-reference dotazy. Pro multi-tenant aplikace Weaviate nabízí nativní tenant izolaci s efektivním využitím zdrojů.
Weaviate pro hybrid¶
Nejlepší výsledky díky kombinaci vector + keyword.