Mit welchen Kosten muss ich für einen produktiven AI Agent im Mittelstand rechnen?

Realistisch 15.000–80.000 € Einmal-Investition plus 500–4.000 €/Monat laufende Betriebskosten — abhängig von Komplexität, Anbindungen und Datenvolumen. Wer Angebote unter 5.000 € sieht, bekommt meist eine Workflow-Konfiguration ohne Wartung, Monitoring oder Compliance-Layer. Wer Angebote über 200.000 € sieht, zahlt Enterprise-Aufschlag, der im Mittelstand selten lohnt.

AI Agent Kosten 2026 — was Mittelstand realistisch einplanen muss

Die ehrliche Kurzantwort

AI-Agent-Kosten zerfallen in vier Blöcke:

Einmal-Setup (Implementierung, Integration, Eval-Setup)
Inferenz-Kosten (LLM-API oder Hardware)
Infrastruktur-Kosten (Hosting, Datenbank, Monitoring)
Wartung und Weiterentwicklung (Updates, neue Prompts, Bug-Fixes)

Typische Spannen für Mittelstandsprojekte 2026:

Komplexität	Setup einmalig	Laufend pro Monat
Einfacher Chatbot mit RAG	5.000–15.000 €	200–800 €
ERP-/CRM-Integration	15.000–40.000 €	500–2.000 €
Multi-Step-Agent mit Tool-Use	25.000–80.000 €	1.000–4.000 €
Multi-Agent-System mit Memory	50.000–150.000 €	2.000–8.000 €

Diese Zahlen sind echt — kein Marketing-Anker, kein “Investment-needs-to-be-five-figures”-Push. Wir bauen Agents in diesen Größenordnungen 2026 für Mittelständler.

Was die Komplexität wirklich treibt

Nicht das LLM-Modell. Claude Sonnet 4.6 kostet 3 €/M Input-Tokens. Bei 50.000 Anfragen/Monat mit 2.000 Token Input + 500 Token Output landest du bei ~75 € Inferenz-Kosten. Das ist nicht der Faktor.

Was wirklich teuer ist:

Anbindungen an Bestandssysteme. ERP, CRM, Ticketing, E-Mail, Telefon — jede Integration ist eigene Arbeit. Eine saubere Odoo-Anbindung mit Schreib- und Leserechten, Audit-Log und Rollback-Logik ist 2–5 Tage. SAP-Anbindung mit RFC-Calls ist 5–15 Tage. Mehrere Systeme zu einem orchestrieren: Multiplikator 2–3×.

Eval-Setup und Regression-Tests. Ein Agent ohne Eval-Set ist ein Glücksspiel. Eval-Set bedeutet: 100–500 Test-Cases mit erwarteten Outputs, Pipeline für automatische Re-Tests bei jeder Änderung. Initial 5–10 Tage, dann laufende Pflege.

Compliance-Layer. DSFA, AVV-Stack, Audit-Logging, PII-Detection, Mitarbeiter-Schulung — kein Stundenfresser im klassischen Sinne, aber pro Punkt 1–3 Tage. Bei Hochrisiko-KI deutlich mehr.

Frontend / UX. Wenn der Agent ein Custom-UI braucht (statt nur API oder Slack-Bot), wird das eigenes Projekt: 5–20 Tage.

Monitoring und Observability. Anständige Setups mit OpenTelemetry, Grafana, Cost-Dashboards: 2–5 Tage initial.

Drei realistische Beispiel-Kalkulationen

Beispiel 1: Customer-Support-Chatbot mit RAG (Klein)

Use-Case: Webseiten-Chatbot mit Zugriff auf FAQs und Produktdatenbank, ~500 Anfragen/Tag.

Setup-Aufwand (15 Tage à 1.200 €):

Anforderungsanalyse + Daten-Aufbereitung: 2 Tage
RAG-Pipeline mit Embeddings und Re-Ranking: 3 Tage
Frontend-Widget (Chat-UI für Webseite): 2 Tage
Compliance (DSFA, Datenschutzerklärung-Update, AVV): 2 Tage
Eval-Set mit 100 Test-Cases: 2 Tage
Monitoring + Logging: 1 Tag
Live-Deployment + 3 Iterations-Runden: 3 Tage
Summe: 18.000 €

Monatlich:

Anthropic Claude Sonnet 4.6 API: ~150 €
Vector-DB (Qdrant Cloud): ~50 €
Hosting + Monitoring: ~80 €
Wartung (1 Tag/Monat): 1.200 €
Summe: ~1.480 €/Monat

Beispiel 2: ERP-Agent für Backoffice (Mittel)

Use-Case: Agent in Odoo, der eingehende Mails klassifiziert, Tickets anlegt, Stammdaten ergänzt und Standard-Antworten generiert.

Setup-Aufwand (35 Tage):

Anforderungsanalyse + Stakeholder-Interviews: 3 Tage
Odoo-Anbindung (Lesen + Schreiben mit Audit-Trail): 5 Tage
Mail-Pipeline (IMAP, Klassifikation, Anhang-Verarbeitung): 4 Tage
LLM-Logik für Klassifikation und Entwurf: 4 Tage
Eval-Set + Bias-Checks: 4 Tage
Compliance (DSFA, AI-Act-Klassifizierung, AVV): 3 Tage
Audit-Logging + Monitoring: 3 Tage
Human-in-the-Loop-UI für Mitarbeitende: 5 Tage
Live-Deployment + Iteration: 4 Tage
Summe: 42.000 €

Monatlich:

LLM-API (höhere Last): ~600 €
Embedding + Vector-DB: ~150 €
Hosting + Monitoring: ~200 €
Wartung + neue Use-Cases: ~1.500–2.500 €
Summe: ~2.500–3.500 €/Monat

Beispiel 3: Multi-Agent-System für Lead-Qualifizierung (Groß)

Use-Case: Mehrstufige Pipeline: Lead aus Webformular → Anreicherung über Firmen-DB → Bonitätsprüfung → Qualifikations-Interview per Chat → Übergabe an Sales mit Score und Empfehlung.

Setup-Aufwand (75 Tage):

Architektur-Design + Compliance-Klärung (AI-Act-Risikoeinstufung): 5 Tage
4 spezialisierte Sub-Agents bauen: 30 Tage
Orchestrator + State-Management: 10 Tage
Integration in HubSpot/Salesforce/Pipedrive: 8 Tage
Externe DB-Anbindungen (NorthData, Schufa-API, eigene CRM-Quellen): 8 Tage
DSFA + AI-Act-Konformitätspaket: 6 Tage
Eval-Set für jeden Sub-Agent: 5 Tage
Audit-Trail + Monitoring + Cost-Dashboards: 3 Tage
Summe: 90.000 €

Monatlich:

LLM-API (Multi-Step, höhere Token-Last): ~1.500–3.000 €
Externe DB-Calls (Bonität, Firmen-Lookup): ~500–1.500 €
Hosting + Monitoring: ~400 €
Wartung + neue Edge-Cases: ~2.500–4.000 €
Summe: ~5.000–8.000 €/Monat

Was bei Billig-Angeboten fehlt

Wenn jemand “AI Agent für 2.500 €” anbietet, fehlen typischerweise:

Eval-Set. Du weißt nicht, ob der Agent in 1 % oder 30 % der Fälle Mist baut. Beim ersten Fehlerfall hast du kein Diagnose-Tool.
Audit-Logging. Bei einer Datenschutz-Anfrage oder einem Streit kannst du nicht belegen, was passiert ist.
Compliance. DSFA, AVV, AI-Act-Klassifizierung sind nicht eingepreist. Wenn die Aufsichtsbehörde fragt, gehst du nackt da hin.
Monitoring. Cost-Explosion, Modell-Drift, Verfügbarkeits-Probleme bemerkst du erst nach Wochen.
Übergabe. Workflow lebt im n8n-Account des Anbieters. Bei Vertragsende — oder bei Streit — bist du raus.
Modell-Wartung. Modelle werden deprecated. Wer kümmert sich um den Upgrade-Pfad?

Diese Posten sind nicht “Premium-Aufschlag”, sondern Grundausstattung für produktive Systeme. Wer ohne sie startet, zahlt später drauf.

Was bei Enterprise-Angeboten zu viel ist

Wenn jemand “AI Agent ab 250.000 €” anbietet, sind das oft:

Architektur-Workshops und Design-Sprints, die für deinen einen Use-Case überdimensioniert sind
Eigene Modell-Layer (Fine-Tuning, RAG-Frameworks), die du nicht brauchst — Standard-Stack reicht
Premium-Compliance-Audits, die im Mittelstand selten den vollen Aufwand rechtfertigen
Skalierungs-Tools für 10.000+ User/Tag, wenn du 50/Tag hast

Diese Aufschläge sind für Konzerne mit anderen Risiko-Profilen. Im Mittelstand sind sie selten begründet.

Wo wir typischerweise landen

Für 2026er-Mittelstands-Projekte sind unsere Angebote meist:

Discovery + Prototyp: 5.000–8.000 € (2–3 Wochen, Go/No-Go-Entscheidung)
Produktion (Phase 1): 15.000–60.000 € (1–3 Monate, ein konkreter Use-Case live)
Betrieb + Erweiterung: 1.500–4.000 €/Monat (laufende Wartung, neue Use-Cases, Modell-Updates)

Wir empfehlen immer die Stufenweise: erst Discovery, dann Produktion, dann Betrieb. Niemand kauft ein 80.000-€-System, das er noch nicht erlebt hat — nach dem 8.000-€-Discovery-Schritt kennst du den Hebel und entscheidest informiert weiter.

Was du heute nicht tun solltest

Keine “AI Agent für 2.500 €“-Angebote ohne Eval-Set und Compliance-Layer. Keine “Enterprise-Architektur”-Angebote für einen einzelnen Use-Case. Und keine Investitionsentscheidung ohne Discovery — das ist die Phase, in der Aufwand und Nutzen ehrlich gemessen werden.

Pragmatischer Einstieg: 30-Minuten-Erstgespräch, in dem wir den Use-Case klassifizieren und eine grobe Spanne nennen. Wenn das passt: Discovery-Phase buchen. Wenn nicht: Du sparst dir das Budget für einen Use-Case, der realistischer ist.

Was kostet ein produktiver AI Agent realistisch?

Die ehrliche Kurzantwort

Was die Komplexität wirklich treibt

Drei realistische Beispiel-Kalkulationen

Beispiel 1: Customer-Support-Chatbot mit RAG (Klein)

Beispiel 2: ERP-Agent für Backoffice (Mittel)

Beispiel 3: Multi-Agent-System für Lead-Qualifizierung (Groß)

Was bei Billig-Angeboten fehlt

Was bei Enterprise-Angeboten zu viel ist

Wo wir typischerweise landen

Was du heute nicht tun solltest

Konkrete Frage zu eurem Setup?