AI & Agentic Systems

RAG & Knowledge Base

AI odpovídá z vašich dokumentů — přesně, s citacemi, bez halucinací. Stavíme retrieval pipeline s hybridním vyhledáváním, re-rankingem a chunk strategiemi optimalizovanými na vaši doménu.

Proč na RAG záleží: Většina firemních znalostí leží v nestrukturovaných dokumentech — smlouvy, interní wiki, tickety, emaily. Klasické full-text vyhledávání selhává na sémantické dotazy. RAG spojuje sílu LLM s přesnými daty z vašich zdrojů.

Jak to děláme: Používáme hybridní retrieval (dense embeddings + sparse BM25), multi-stage re-ranking a domain-specific chunk strategie. Pro každý projekt testujeme 3-5 chunk konfigurací na reálných dotazech a měříme recall@k. Typicky dosahujeme 92-97% recall na top-10 výsledcích.

Architektura v praxi: Ingestion pipeline → chunking (semantic splitting, ne naivní fixed-size) → embedding (model volíme podle jazyka a domény) → vector DB (Qdrant/Weaviate) + BM25 index → retrieval → re-ranking (cross-encoder) → LLM s citacemi. Každý krok je měřený a debugovatelný.

Časté chyby, kterým se vyhýbáme: Naivní chunking po 512 tokenech (rozbíjí kontext), chybějící re-ranking (precision klesne o 15-25%), žádná evaluace retrieval kvality, ignorování metadat (datum, autor, verze dokumentu). Viděli jsme RAG systémy s 60% accuracy — po optimalizaci jsme je dostali na 94%.

ragvector-dbcitacere-rankingembeddings

Detail →

Agentní workflow

Agent provádí kroky v systému — čte, zapisuje, rozhoduje, eskaluje. Orchestrujeme multi-step workflow s tool-use, paralelním zpracováním a human-in-the-loop eskalací.

Co je agentní workflow: Na rozdíl od jednoduchého prompt → odpověď, agent plánuje sekvenci kroků, volá nástroje (API, databáze, soubory), vyhodnocuje výsledky a rozhoduje o dalším postupu. Je to programovatelný pracovník s definovaným mandátem.

Orchestrace: Používáme graph-based orchestraci (LangGraph, custom DAG engine), kde každý node je izolovaný krok s definovaným vstupem, výstupem a error handling. Agent může paralelně volat více nástrojů, agregovat výsledky a rozhodovat na základě business pravidel.

Bezpečnost a kontrola: Každý tool-call je logovaný s plným kontextem. Definujeme permission boundary — agent smí číst z CRM, ale zápis vyžaduje human approval. Kill-switch zastaví agenta v libovolném kroku. Eskalační pravidla jsou konfigurovatelná per-use-case.

Reálný příklad: Agent pro zpracování faktur — přijme PDF, extrahuje data (OCR + LLM), validuje proti objednávce v ERP, kontroluje duplicity, zapíše do účetního systému, notifikuje účetní o nesrovnalostech. Zpracuje 200+ faktur/den s 98.5% accuracy. Člověk řeší jen edge cases.

orchestracetool-useaudithuman-in-the-loopDAG

Detail →

Evaluace & monitoring

Měříme kvalitu odpovědí, latenci, náklady a drift. Produkční AI bez evaluace je časovaná bomba — stavíme observability stack od prvního dne.

Proč je evaluace kritická: LLM se mění (nové verze modelů), data se mění, uživatelské dotazy se mění. Bez kontinuální evaluace nevíte, jestli váš systém funguje — víte jen, že fungoval minulý měsíc. Viděli jsme systémy, kde upgrade modelu zhoršil kvalitu o 20% a nikdo si toho týden nevšiml.

Náš evaluační stack: Automatické eval sady (golden dataset 200-500 párů per use-case), LLM-as-judge pro subjektivní kvalitu, deterministické metriky (faithfulness, answer relevance, context precision), A/B testing pro prompt změny. Vše běží v CI/CD — každý deploy projde eval suite.

Monitoring v produkci: Sledujeme latenci (P50/P95/P99), token consumption, cost per query, error rate, retrieval quality (NDCG), user satisfaction (thumbs up/down + feedback loop). Alerty na anomálie — pokud accuracy klesne pod threshold, okamžitě víme.

Co měříme a jak: Faithfulness (odpověď je podložená kontextem), completeness (odpověď pokrývá dotaz), hallucination rate, toxicity, cost efficiency (cost per successful resolution). Dashboard s denním reportem pro stakeholdery.

evaluacemetrikyalertingobservabilityCI/CD

Detail →

Governance & bezpečnost

RBAC, audit trail, kill-switch, eskalace na člověka, prompt injection ochrana. AI v produkci vyžaduje stejnou governance jako každý jiný kritický systém.

AI governance není nice-to-have: V regulovaných odvětvích (finance, zdravotnictví, veřejná správa) je governance podmínka nasazení. Ale i mimo regulaci — AI agent s přístupem do produkčních systémů bez governance je bezpečnostní riziko.

Co implementujeme: Role-based access control (kdo smí co), audit trail (každá akce logovaná s kontextem), kill-switch (okamžité zastavení agenta), eskalační pravidla (kdy se ptá člověka), rate limiting, input/output guardrails, prompt injection detection, PII redaction.

Prompt injection ochrana: Vícevrstvá obrana — input sanitization, system prompt hardening, output validation, canary tokens v kontextu. Testujeme každý deployment proti známým attack vektorům. Žádný systém není 100% bezpečný, ale snižujeme riziko o řády.

Compliance a audit: Generujeme audit reporty kompatibilní s ISO 27001, SOC 2, GDPR. Každé rozhodnutí agenta je reprodukovatelné — logujeme prompt, kontext, model response, tool calls. Pro regulované sektory implementujeme model cards a AI impact assessment.

rbacauditcomplianceprompt-injectionguardrails

Detail →

Fine-tuning & optimalizace

Ladíme modely na vaše data — menší, rychlejší, levnější. Distillation z velkých modelů do produkčních, domain-adapted embeddings, prompt engineering na míru.

Kdy fine-tunovat: Když prompt engineering nestačí (specifická doména, formát výstupu, konzistence), když potřebujete snížit latenci/náklady (menší model = rychlejší + levnější), nebo když potřebujete model běžící on-premise (regulace, data residency).

Náš přístup: Začínáme analýzou — opravdu potřebujete fine-tuning, nebo stačí lepší prompt? Pokud ano: sbíráme training data (syntetická + reálná), fine-tunujeme s LoRA/QLoRA, evaluujeme proti baseline. Typicky dosahujeme 85-95% kvality GPT-4 s modelem 10x menším a 5x levnějším.

Knowledge distillation: Velký model (GPT-4, Claude) generuje training data pro menší model (Llama 8B, Mistral 7B). Menší model se naučí domain-specific chování bez nutnosti obřích datasetů. Výsledek: produkční model s latencí <200ms a cenou <$0.001 per query.

Optimalizace inference: Quantization (INT8/INT4), batching, KV-cache optimalizace, speculative decoding. Pro high-throughput scénáře (1000+ queries/min) navrhujeme inference stack s autoscalingem a intelligent routing mezi modely.

fine-tuningdistillationinferenceLoRAquantization

Detail →

Integrace do procesů

AI není ostrov. Napojíme na ERP, CRM, ticketing, email, interní systémy. Stavíme robustní integrační vrstvu s retry logikou, circuit breakery a monitoring.

Proč je integrace kritická: AI agent bez napojení na reálné systémy je jen chatbot. Hodnota vzniká, když agent čte z CRM, zapisuje do ERP, vytváří tickety, posílá notifikace — když je součástí procesu, ne jen přívěškem.

Jak integrujeme: REST/GraphQL API adaptéry, webhook listenery, message queue consumers (RabbitMQ, Kafka), database connectors. Každá integrace má retry logiku, circuit breaker, timeout handling a dead letter queue. Monitoring na úrovni každého spojení.

Typické integrace: SAP/ERP (faktury, objednávky, sklady), Salesforce/CRM (kontakty, příležitosti, aktivity), Jira/ServiceNow (tickety, incidenty), Email/Teams/Slack (notifikace, eskalace), DMS (SharePoint, Confluence, interní wiki). Většinu napojíme za 1-2 týdny.

Change management: Technická integrace je polovina práce. Druhá polovina je adopce — školení uživatelů, postupný rollout (shadow mode → pilot → production), měření dopadu na procesy, iterace na základě feedbacku. Bez adopce je i nejlepší AI systém zbytečný.

apiwebhookserpcrmintegracechange-management

Detail →

AI Agent

Autonomní AI pracovník s definovaným cílem, kontextem, nástroji a oprávněními. Na rozdíl od chatbotu agent aktivně jedná v systémech.

Příklad z praxe: Agent zpracuje příchozí fakturu: přečte PDF, extrahuje data, validuje proti objednávce, zapíše do IS a upozorní účetní na nesrovnalosti.

✓ Má definované oprávnění (co smí a co nesmí)
✓ Loguje každou akci (audit trail)
✓ Má kill-switch a eskalaci na člověka
✓ Je měřený (success rate, latence, náklady)

>95%

Úspěšnost úloh

<2s

Latence P95

-40%

Provozní náklady

8 týdnů

Doba nasazení

Jak to děláme

1

Discovery Workshop

Zmapujeme procesy, identifikujeme use-casy pro AI agenty a definujeme metriky úspěchu.

2

PoC na reálných datech

Postavíme funkční prototyp agenta na vašich datech a ověříme přínos v praxi.

3

Governance & integrace

Napojíme agenta na vaše systémy, nastavíme pravidla, bezpečnost a audit trail.

4

Shadow mode & rollout

Agent běží paralelně s lidmi, ladíme přesnost a postupně přebírá rutinní úlohy.

5

Provoz & optimalizace

Kontinuální monitoring, retraining modelů a rozšiřování na další use-casy.

Kdy AI agent dává smysl¶

AI agent se vyplatí tam, kde máte opakující se proces s jasně definovanými pravidly, ale příliš komplexní na jednoduchou automatizaci. Klíčový indikátor: proces vyžaduje porozumění nestrukturovaným datům (text, dokumenty, emaily) a rozhodování v kontextu.

Rozhodovací matice¶

Kritérium	Klasická automatizace	AI Agent	Člověk
Strukturovaná data, jasná pravidla	✅ Ideální	❌ Overkill	❌ Drahé
Nestrukturovaná data, jasná pravidla	⚠️ Obtížné	✅ Ideální	⚠️ Pomalé
Strukturovaná data, komplexní rozhodování	⚠️ Limitované	✅ Vhodné	✅ Vhodné
Nestrukturovaná data, kreativní rozhodování	❌ Nemožné	⚠️ S dohledem	✅ Nutné

Typické use-cases¶

1. Zpracování dokumentů Faktury, smlouvy, reklamace, objednávky. Agent přečte dokument (PDF, scan, email), extrahuje strukturovaná data, validuje proti business pravidlům, zapíše do cílového systému. Typický výsledek: 85-95% dokumentů zpracováno plně automaticky, zbytek eskalován s pre-filled daty.

2. Customer support L1/L2 Agent odpovídá z knowledge base, řeší standardní požadavky (změna adresy, stav objednávky, reklamace), eskaluje složité případy s plným kontextem. Typický výsledek: 60-70% ticketů vyřešeno bez lidského zásahu, průměrná doba odpovědi z hodin na sekundy.

3. Data enrichment & research Agent prochází interní i externí zdroje, obohacuje CRM/ERP záznamy, připravuje rešerše, monitoruje konkurenci. Typický výsledek: úspora 15-20 hodin/týden na manuálním research.

4. Monitoring & anomaly detection Agent analyzuje logy, metriky, tickety, finanční transakce. Detekuje anomálie, klasifikuje severity, notifikuje správné lidi s kontextem. Typický výsledek: MTTD (mean time to detect) z hodin na minuty.

5. Interní asistent / knowledge management Agent zná vaše procesy, dokumentaci, historii rozhodnutí. Odpovídá zaměstnancům, pomáhá s onboardingem, vyhledává v interní knowledge base. Typický výsledek: 40-60% redukce času stráveného hledáním informací.

6. Compliance & audit automation Agent kontroluje transakce, dokumenty, procesy proti regulatorním požadavkům. Generuje compliance reporty, detekuje porušení, eskaluje. Typický výsledek: 80% redukce manuální compliance práce.

Jak postupujeme¶

┌─────────────────────────────────────────────────────────────┐
│  DISCOVERY WORKSHOP (1 den)                                  │
│  → Identifikace top 3 use-cases s nejvyšším ROI             │
│  → Analýza dat, systémů, procesů                            │
│  → Definice success metrics                                  │
└──────────────────────┬──────────────────────────────────────┘
                       │
                       ▼
┌─────────────────────────────────────────────────────────────┐
│  PoC (4 týdny)                                               │
│  → Funkční prototyp na reálných datech                      │
│  → Evaluace: accuracy, latence, náklady                     │
│  → Go/no-go rozhodnutí s tvrdými čísly                      │
└──────────────────────┬──────────────────────────────────────┘
                       │
                       ▼
┌─────────────────────────────────────────────────────────────┐
│  PRODUKCE (4-8 týdnů)                                        │
│  → Governance: RBAC, audit trail, kill-switch               │
│  → Integrace do cílových systémů                            │
│  → Monitoring & alerting stack                               │
│  → Shadow mode → pilot (10% traffic) → full rollout         │
└──────────────────────┬──────────────────────────────────────┘
                       │
                       ▼
┌─────────────────────────────────────────────────────────────┐
│  PROVOZ & OPTIMALIZACE (ongoing)                             │
│  → Kontinuální evaluace a monitoring                        │
│  → Prompt/model optimalizace na základě dat                 │
│  → Rozšiřování scope (nové use-cases, nové zdroje)          │
│  → Měsíční reporting pro stakeholdery                       │
└─────────────────────────────────────────────────────────────┘

Technologický stack¶

Vrstva	Technologie
LLM	Claude, GPT-4, Llama, Mistral (volíme per use-case)
Orchestrace	LangGraph, custom DAG engine, event-driven
Vector DB	Qdrant, Weaviate, pgvector
Embeddings	OpenAI, Cohere, domain-tuned open-source
Monitoring	LangSmith, custom dashboards, Grafana
Infra	Kubernetes, serverless (AWS Lambda/Azure Functions)
Integrace	REST, GraphQL, webhooks, message queues

Co nedělá smysl¶

Buďme upřímní — AI agent není řešení na všechno:

Jednoduché if/then pravidla → klasická automatizace je levnější a spolehlivější
Kreativní rozhodování s vysokým rizikem → člověk musí rozhodnout, AI může připravit podklady
Procesy bez dat → agent potřebuje kontext, bez kvalitních dat nemá z čeho čerpat
One-off úlohy → ROI se vrátí až při opakovaném zpracování (typicky 100+ případů/měsíc)

Časté otázky

Ano. Produkční AI v regulovaném prostředí = přístupy, audit, evaluace, provoz. Máme zkušenosti s nasazením v bankovním sektoru.

Retrieval-Augmented Generation. Způsob, jak AI odpovídá z vašich dat — bez halucinací, s citacemi zdrojů.

Závisí na komplexitě. Typický projekt: workshop (1 den) → PoC (4 týdny) → produkce (4-8 týdnů). Cena od 500K CZK.

Kombinujeme komerční (Claude, GPT-4) a open-source (Llama, Mistral). Volíme podle use-case, regulace a nákladů.

Ne nutně. Většina agentů běží na API. Pro citlivá data nabízíme on-premise nasazení s open-source modely.

Typicky 8-12 týdnů od kickoffu. Discovery workshop (1 den) → PoC na reálných datech (4 týdny) → produkční nasazení s governance (4-8 týdnů). Iterujeme v 2-týdenních sprintech.

Halucinace jsou vlastnost, ne bug — každý LLM je generuje. Proto stavíme vícevrstvou obranu: RAG s citacemi, output validation, faithfulness scoring, confidence thresholds a human-in-the-loop eskalaci. Měříme hallucination rate a kontinuálně optimalizujeme.

Každý agent má definovaný permission boundary — co smí číst, kam smí psát, kdy musí eskalovat. Implementujeme RBAC, audit trail, prompt injection ochranu, PII redaction. Pro regulované sektory dodáváme compliance reporty.

Souvisí s

Bezpečnost & compliance Zero Trust, IAM, audit, compliance.

Datová platforma & integrace ETL/ELT, data lakehouse, real-time pipelines.

Bankovnictví & finance Core banking, compliance, real-time zpracování

Logistika & e-commerce Supply chain, WMS, fulfillment automatizace

RAG & Knowledge Base

Agentní workflow

Evaluace & monitoring

Governance & bezpečnost

Fine-tuning & optimalizace

Integrace do procesů

AI Agent

Jak to děláme

Discovery Workshop

PoC na reálných datech

Governance & integrace

Shadow mode & rollout

Provoz & optimalizace

Kdy AI agent dává smysl¶

Rozhodovací matice¶

Typické use-cases¶

Jak postupujeme¶

Technologický stack¶

Co nedělá smysl¶

Časté otázky

Souvisí s

Máte projekt?

Odcházíte?