Agentische Workflows
Agent plant, handelt, evaluiert. Sie kontrollieren.
Wir bauen mehrstufige KI-Agenten mit graphbasierter Orchestrierung, Tool-Use und sicherer menschlicher Eskalation.
Vom Chatbot zum autonomen Mitarbeiter¶
Ein klassischer Chatbot beantwortet Fragen — Prompt rein, Text raus. Ein KI-Agent ist grundlegend anders: Er plant eine Abfolge von Schritten, handelt in realen Systemen (APIs, Datenbanken, Dateien), evaluiert Ergebnisse und entscheidet über nächste Schritte. Es ist ein programmierbarer Mitarbeiter mit definiertem Mandat und Berechtigungen.
Anatomie eines agentischen Workflows¶
┌─────────────────────────────────────────────────────────┐
│ TRIGGER (E-Mail, Ticket, API-Aufruf, Zeitplan) │
└────────────────────────┬────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ PLANUNG │
│ Agent analysiert Aufgabe, zerlegt sie in Schritte, │
│ identifiziert benötigte Tools und Daten │
└────────────────────────┬────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ AUSFÜHRUNGSSCHLEIFE │
│ ┌─────────────┐ ┌──────────────┐ ┌───────────────┐ │
│ │ Tool-Aufruf │→ │ Ergebnis- │→ │ Entscheidung │ │
│ │ (API, DB, │ │ Bewertung │ │ (nächster │ │
│ │ Datei) │ │ │ │ Schritt / │ │
│ └─────────────┘ └──────────────┘ │ Eskalation / │ │
│ │ Abschluss) │ │
│ └───────────────┘ │
│ ← wiederholt sich bis Aufgabe abgeschlossen ───────→ │
└────────────────────────┬────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ AUSGABE (Ergebnis, Report, Benachrichtigung, Schreiben)│
└─────────────────────────────────────────────────────────┘
Orchestrierung — wie wir Agenten steuern¶
Graphbasierte Orchestrierung¶
Wir modellieren Workflows als gerichtete azyklische Graphen (DAG), wobei jeder Knoten ein isolierter Schritt mit definierten Eigenschaften ist: - Input — was der Knoten benötigt (Daten, Kontext, Ergebnisse vorheriger Schritte) - Output — was er produziert - Fehlerbehandlung — was bei einem Fehler passiert (Retry, Fallback, Eskalation) - Timeout — maximale Ausführungszeit
Vorteile des DAG-Ansatzes: - Parallele Verarbeitung unabhängiger Schritte - Deterministisches Verhalten (gleicher Input = gleicher Graph-Durchlauf) - Einfaches Debugging (Sie sehen genau, wo der Workflow fehlgeschlagen ist) - Testbarkeit (jeder Knoten kann isoliert getestet werden)
Tool-Use — die Hände des Agenten¶
Der Agent handelt durch Tools — definierte Funktionen mit klarer Schnittstelle:
Tool: create_jira_ticket
Input: { project, summary, description, priority }
Output: { ticket_id, url }
Berechtigungen: agent_service_account (write: project_SUPPORT)
Rate-Limit: 10/min
Jedes Tool hat: - Schema — Input-/Output-Validierung - Berechtigungen — wer es aufrufen darf - Rate-Limiting — Schutz vor außer Kontrolle geratenen Agenten - Logging — vollständiger Audit-Trail - Retry-Logik — exponentieller Backoff, Circuit Breaker
Human-in-the-Loop¶
Nicht alles sollte der Agent allein erledigen. Wir definieren Eskalationsregeln:
- Konfidenzschwellenwert — wenn Agent unsicher ist (< 80 % Konfidenz), eskalieren
- Hochrisikoaktionen — Zahlungen, Löschungen, Kundenkommunikation → menschliche Genehmigung
- Anomalien — unerwartete Eingabe, Grenzfall → Eskalation mit Kontext
- Regulatorische Anforderungen — manche Entscheidungen müssen von Menschen getroffen werden (AML, KYC)
Eskalation ist kein Versagen — es ist ein geplanter Mechanismus. Agent bereitet Materialien, Kontext, Empfehlungen vor. Mensch entscheidet. Agent fährt fort.
Praxisbeispiele¶
Automatisierung der Rechnungsverarbeitung¶
Vorher: Buchhalter verarbeitet manuell ~50 Rechnungen/Tag. Liest PDF, überträgt Daten ins ERP, prüft gegen Bestellungen. 3-4 Stunden täglich.
Nachher: Agent empfängt Rechnung (E-Mail-Anhang, DMS-Upload), extrahiert Daten (OCR + LLM), validiert gegen Bestellung im ERP, prüft auf Duplikate, schreibt ins Buchhaltungssystem. Eskaliert Abweichungen mit vorausgefüllten Daten.
Ergebnisse: - 200+ Rechnungen/Tag automatisch verarbeitet - 98,5 % Genauigkeit (validiert gegen manuelle Verarbeitung) - 85 % Reduktion manueller Arbeit - Buchhalter bearbeitet nur Grenzfälle und Ausnahmen
Kundensupport-Triage¶
Vorher: Support-Team liest manuell Tickets, klassifiziert, weist zu. 30 % der Zeit geht für Routing drauf, nicht für Lösung.
Nachher: Agent analysiert eingehendes Ticket (Text + Metadaten), klassifiziert (Kategorie, Schweregrad, Produkt), reichert mit Kontext an (Kundenhistorie, Wissensbasis), leitet an das richtige Team weiter. Löst einfache Anfragen autonom.
Ergebnisse: - 95 % Klassifizierungsgenauigkeit (vs. 87 % manuell) - 65 % der Tickets ohne menschliches Eingreifen gelöst - MTTR (Mean Time to Resolve) -40 %
Datenanreicherungspipeline¶
Vorher: Vertriebsteam recherchiert manuell Unternehmen — Web, Register, LinkedIn. 2 Stunden pro Lead.
Nachher: Agent empfängt Firmennamen, lädt automatisch Daten aus öffentlichen Registern herunter, analysiert Website, extrahiert Schlüsselinformationen (Größe, Branche, Technologien), reichert CRM-Datensatz an.
Ergebnisse: - 5 Minuten pro Lead (vs. 2 Stunden) - Konsistentere Daten (standardisiertes Format) - Vertriebsmitarbeiter konzentrieren sich auf Beziehungen, nicht auf Recherche
Sicherheit und Kontrolle¶
Berechtigungsgrenze¶
Jeder Agent hat explizit definierte Berechtigungen:
| Aktion | Berechtigung | Bedingung |
|---|---|---|
| CRM lesen | ✅ Erlaubt | — |
| CRM schreiben | ⚠️ Mit Genehmigung | Wert > 100K EUR |
| ERP lesen | ✅ Erlaubt | Nur-Lese |
| ERP schreiben | ⚠️ Mit Genehmigung | Immer |
| Kunden-E-Mail | ⚠️ Mit Genehmigung | Immer |
| Interne Benachrichtigung | ✅ Erlaubt | — |
| Daten löschen | ❌ Verboten | Nie |
Kill-Switch¶
Sofortiges Agent-Herunterfahren — implementiert auf drei Ebenen: 1. Pro Aufgabe — stoppt eine bestimmte laufende Aufgabe 2. Pro Agent — stoppt alle Aufgaben eines Agenten 3. Global — stoppt alle Agenten (Notfallstopp)
Audit-Trail¶
Jede Agent-Aktion wird protokolliert: - Zeitstempel, Agent-ID, Aufgaben-ID - Input (was der Agent erhalten hat) - Reasoning (warum er so entschieden hat) - Tool-Aufruf (was er aufgerufen hat, mit welchen Parametern) - Output (was er zurückbekommen hat) - Dauer, Kosten (Token, API-Aufrufe)
Audit-Trail ist unveränderlich, 12+ Monate archiviert, für Compliance-Audit verfügbar.
Technologie¶
Orchestrierungsframework¶
- LangGraph — für komplexe, zustandsbehaftete Workflows mit Bedingungen und Schleifen
- Custom DAG Engine — für hochperformante, deterministische Workflows
- Event-Driven-Architektur — für reaktive Echtzeitverarbeitung
Deployment¶
- Kubernetes — containerisierte Agenten mit Autoscaling
- Serverless — für event-getriebene, niederfrequente Workflows
- Queue-basiert — RabbitMQ/Kafka für Hochdurchsatz-Szenarien
Monitoring¶
- Distributed Tracing — wir verfolgen jeden Workflow-Schritt end-to-end
- Metriken — Erfolgsrate, Latenz, Kosten pro Aufgabe
- Alarmierung — automatische Alarme bei Anomalien, Ausfällen, Verschlechterung
Häufig gestellte Fragen
Ein Chatbot beantwortet Fragen. Ein Agent handelt — ruft APIs auf, liest und schreibt in Systeme, entscheidet über nächste Schritte, eskaliert. Ein Chatbot ist reaktiv, ein Agent ist proaktiv mit definiertem Mandat.
Jeder Agent hat eine Berechtigungsgrenze — eine explizite Liste erlaubter Aktionen. Kritische Aktionen (Schreiben, Löschen, Zahlung) erfordern menschliche Genehmigung. Kill-Switch stoppt den Agenten sofort. Audit-Trail protokolliert jeden Schritt.
Typischerweise 4-8 Schritte für Standard-Workflows. Komplexe Szenarien (Multi-System-Orchestrierung) können 15-20 Schritte haben. Entscheidend ist, dass jeder Schritt atomar, protokolliert und rückgängig machbar ist.
Ja, wir empfehlen einen inkrementellen Ansatz. Shadow-Modus (Agent läuft parallel, handelt aber nicht), Pilot (10 % der Fälle), vollständiger Rollout. In jeder Phase messen und vergleichen wir mit der menschlichen Leistung.