Zum Inhalt springen
K Krynex Labs
Praxis & Mittelstand

Was kostet ein produktiver AI Agent realistisch?

Die ehrliche Kurzantwort

AI-Agent-Kosten zerfallen in vier Blöcke:

  1. Einmal-Setup (Implementierung, Integration, Eval-Setup)
  2. Inferenz-Kosten (LLM-API oder Hardware)
  3. Infrastruktur-Kosten (Hosting, Datenbank, Monitoring)
  4. Wartung und Weiterentwicklung (Updates, neue Prompts, Bug-Fixes)

Typische Spannen für Mittelstandsprojekte 2026:

KomplexitätSetup einmaligLaufend pro Monat
Einfacher Chatbot mit RAG5.000–15.000 €200–800 €
ERP-/CRM-Integration15.000–40.000 €500–2.000 €
Multi-Step-Agent mit Tool-Use25.000–80.000 €1.000–4.000 €
Multi-Agent-System mit Memory50.000–150.000 €2.000–8.000 €

Diese Zahlen sind echt — kein Marketing-Anker, kein “Investment-needs-to-be-five-figures”-Push. Wir bauen Agents in diesen Größenordnungen 2026 für Mittelständler.

Was die Komplexität wirklich treibt

Nicht das LLM-Modell. Claude Sonnet 4.6 kostet 3 €/M Input-Tokens. Bei 50.000 Anfragen/Monat mit 2.000 Token Input + 500 Token Output landest du bei ~75 € Inferenz-Kosten. Das ist nicht der Faktor.

Was wirklich teuer ist:

Anbindungen an Bestandssysteme. ERP, CRM, Ticketing, E-Mail, Telefon — jede Integration ist eigene Arbeit. Eine saubere Odoo-Anbindung mit Schreib- und Leserechten, Audit-Log und Rollback-Logik ist 2–5 Tage. SAP-Anbindung mit RFC-Calls ist 5–15 Tage. Mehrere Systeme zu einem orchestrieren: Multiplikator 2–3×.

Eval-Setup und Regression-Tests. Ein Agent ohne Eval-Set ist ein Glücksspiel. Eval-Set bedeutet: 100–500 Test-Cases mit erwarteten Outputs, Pipeline für automatische Re-Tests bei jeder Änderung. Initial 5–10 Tage, dann laufende Pflege.

Compliance-Layer. DSFA, AVV-Stack, Audit-Logging, PII-Detection, Mitarbeiter-Schulung — kein Stundenfresser im klassischen Sinne, aber pro Punkt 1–3 Tage. Bei Hochrisiko-KI deutlich mehr.

Frontend / UX. Wenn der Agent ein Custom-UI braucht (statt nur API oder Slack-Bot), wird das eigenes Projekt: 5–20 Tage.

Monitoring und Observability. Anständige Setups mit OpenTelemetry, Grafana, Cost-Dashboards: 2–5 Tage initial.

Drei realistische Beispiel-Kalkulationen

Beispiel 1: Customer-Support-Chatbot mit RAG (Klein)

Use-Case: Webseiten-Chatbot mit Zugriff auf FAQs und Produktdatenbank, ~500 Anfragen/Tag.

Setup-Aufwand (15 Tage à 1.200 €):

  • Anforderungsanalyse + Daten-Aufbereitung: 2 Tage
  • RAG-Pipeline mit Embeddings und Re-Ranking: 3 Tage
  • Frontend-Widget (Chat-UI für Webseite): 2 Tage
  • Compliance (DSFA, Datenschutzerklärung-Update, AVV): 2 Tage
  • Eval-Set mit 100 Test-Cases: 2 Tage
  • Monitoring + Logging: 1 Tag
  • Live-Deployment + 3 Iterations-Runden: 3 Tage
  • Summe: 18.000 €

Monatlich:

  • Anthropic Claude Sonnet 4.6 API: ~150 €
  • Vector-DB (Qdrant Cloud): ~50 €
  • Hosting + Monitoring: ~80 €
  • Wartung (1 Tag/Monat): 1.200 €
  • Summe: ~1.480 €/Monat

Beispiel 2: ERP-Agent für Backoffice (Mittel)

Use-Case: Agent in Odoo, der eingehende Mails klassifiziert, Tickets anlegt, Stammdaten ergänzt und Standard-Antworten generiert.

Setup-Aufwand (35 Tage):

  • Anforderungsanalyse + Stakeholder-Interviews: 3 Tage
  • Odoo-Anbindung (Lesen + Schreiben mit Audit-Trail): 5 Tage
  • Mail-Pipeline (IMAP, Klassifikation, Anhang-Verarbeitung): 4 Tage
  • LLM-Logik für Klassifikation und Entwurf: 4 Tage
  • Eval-Set + Bias-Checks: 4 Tage
  • Compliance (DSFA, AI-Act-Klassifizierung, AVV): 3 Tage
  • Audit-Logging + Monitoring: 3 Tage
  • Human-in-the-Loop-UI für Mitarbeitende: 5 Tage
  • Live-Deployment + Iteration: 4 Tage
  • Summe: 42.000 €

Monatlich:

  • LLM-API (höhere Last): ~600 €
  • Embedding + Vector-DB: ~150 €
  • Hosting + Monitoring: ~200 €
  • Wartung + neue Use-Cases: ~1.500–2.500 €
  • Summe: ~2.500–3.500 €/Monat

Beispiel 3: Multi-Agent-System für Lead-Qualifizierung (Groß)

Use-Case: Mehrstufige Pipeline: Lead aus Webformular → Anreicherung über Firmen-DB → Bonitätsprüfung → Qualifikations-Interview per Chat → Übergabe an Sales mit Score und Empfehlung.

Setup-Aufwand (75 Tage):

  • Architektur-Design + Compliance-Klärung (AI-Act-Risikoeinstufung): 5 Tage
  • 4 spezialisierte Sub-Agents bauen: 30 Tage
  • Orchestrator + State-Management: 10 Tage
  • Integration in HubSpot/Salesforce/Pipedrive: 8 Tage
  • Externe DB-Anbindungen (NorthData, Schufa-API, eigene CRM-Quellen): 8 Tage
  • DSFA + AI-Act-Konformitätspaket: 6 Tage
  • Eval-Set für jeden Sub-Agent: 5 Tage
  • Audit-Trail + Monitoring + Cost-Dashboards: 3 Tage
  • Summe: 90.000 €

Monatlich:

  • LLM-API (Multi-Step, höhere Token-Last): ~1.500–3.000 €
  • Externe DB-Calls (Bonität, Firmen-Lookup): ~500–1.500 €
  • Hosting + Monitoring: ~400 €
  • Wartung + neue Edge-Cases: ~2.500–4.000 €
  • Summe: ~5.000–8.000 €/Monat

Was bei Billig-Angeboten fehlt

Wenn jemand “AI Agent für 2.500 €” anbietet, fehlen typischerweise:

  • Eval-Set. Du weißt nicht, ob der Agent in 1 % oder 30 % der Fälle Mist baut. Beim ersten Fehlerfall hast du kein Diagnose-Tool.
  • Audit-Logging. Bei einer Datenschutz-Anfrage oder einem Streit kannst du nicht belegen, was passiert ist.
  • Compliance. DSFA, AVV, AI-Act-Klassifizierung sind nicht eingepreist. Wenn die Aufsichtsbehörde fragt, gehst du nackt da hin.
  • Monitoring. Cost-Explosion, Modell-Drift, Verfügbarkeits-Probleme bemerkst du erst nach Wochen.
  • Übergabe. Workflow lebt im n8n-Account des Anbieters. Bei Vertragsende — oder bei Streit — bist du raus.
  • Modell-Wartung. Modelle werden deprecated. Wer kümmert sich um den Upgrade-Pfad?

Diese Posten sind nicht “Premium-Aufschlag”, sondern Grundausstattung für produktive Systeme. Wer ohne sie startet, zahlt später drauf.

Was bei Enterprise-Angeboten zu viel ist

Wenn jemand “AI Agent ab 250.000 €” anbietet, sind das oft:

  • Architektur-Workshops und Design-Sprints, die für deinen einen Use-Case überdimensioniert sind
  • Eigene Modell-Layer (Fine-Tuning, RAG-Frameworks), die du nicht brauchst — Standard-Stack reicht
  • Premium-Compliance-Audits, die im Mittelstand selten den vollen Aufwand rechtfertigen
  • Skalierungs-Tools für 10.000+ User/Tag, wenn du 50/Tag hast

Diese Aufschläge sind für Konzerne mit anderen Risiko-Profilen. Im Mittelstand sind sie selten begründet.

Wo wir typischerweise landen

Für 2026er-Mittelstands-Projekte sind unsere Angebote meist:

  • Discovery + Prototyp: 5.000–8.000 € (2–3 Wochen, Go/No-Go-Entscheidung)
  • Produktion (Phase 1): 15.000–60.000 € (1–3 Monate, ein konkreter Use-Case live)
  • Betrieb + Erweiterung: 1.500–4.000 €/Monat (laufende Wartung, neue Use-Cases, Modell-Updates)

Wir empfehlen immer die Stufenweise: erst Discovery, dann Produktion, dann Betrieb. Niemand kauft ein 80.000-€-System, das er noch nicht erlebt hat — nach dem 8.000-€-Discovery-Schritt kennst du den Hebel und entscheidest informiert weiter.

Was du heute nicht tun solltest

Keine “AI Agent für 2.500 €“-Angebote ohne Eval-Set und Compliance-Layer. Keine “Enterprise-Architektur”-Angebote für einen einzelnen Use-Case. Und keine Investitionsentscheidung ohne Discovery — das ist die Phase, in der Aufwand und Nutzen ehrlich gemessen werden.

Pragmatischer Einstieg: 30-Minuten-Erstgespräch, in dem wir den Use-Case klassifizieren und eine grobe Spanne nennen. Wenn das passt: Discovery-Phase buchen. Wenn nicht: Du sparst dir das Budget für einen Use-Case, der realistischer ist.

Konkrete Frage zu eurem Setup?

Ein 30-Minuten-Erstgespräch klärt meistens schon, ob euer aktueller AI-Stack hält oder wo nachzuarbeiten ist. Kostenlos, ohne Verkaufsdruck.

Erstgespräch buchen