Fully managed, zero ops, serverless.
Setup¶
pip install pinecone-client import pinecone pc = pinecone.Pinecone(api_key=’key’) pc.create_index(name=’docs’, dimension=1536, metric=’cosine’, spec=pinecone.ServerlessSpec(cloud=’aws’, region=’us-east-1’))
Operace¶
index = pc.Index(‘docs’) index.upsert(vectors=[(‘d1’,[0.1,0.2,…],{‘text’:’PG guide’})]) results = index.query(vector=[0.1,…], top_k=5, include_metadata=True)
- Zero ops
- Serverless
- Metadata filtering
- LangChain integrace
Praktické nasazení s RAG¶
Pinecone se nejčastěji používá jako vektorová databáze pro RAG (Retrieval-Augmented Generation) pipeline. Typický workflow: dokumenty rozřežete na chunky, vygenerujete embeddingy pomocí OpenAI nebo jiného modelu a uložíte je do Pinecone s metadaty (zdroj, datum, kategorie).
Při dotazování kombinujete vektorový similarity search s metadata filtrováním — například hledáte podobné dokumenty, ale pouze z posledních 30 dní. Pinecone serverless model znamená, že neplatíte za idle kapacitu a škálování je automatické. Integrace s LangChain a LlamaIndex zjednodušuje nasazení na několik řádků kódu. Pro citlivá data zvažte Pinecone s dedikovaným prostředím a šifrováním.
Pinecone pro produkci¶
Nejjednodušší managed řešení.