Was kostet ein produktiver AI Agent realistisch?
Die ehrliche Kurzantwort
AI-Agent-Kosten zerfallen in vier Blöcke:
- Einmal-Setup (Implementierung, Integration, Eval-Setup)
- Inferenz-Kosten (LLM-API oder Hardware)
- Infrastruktur-Kosten (Hosting, Datenbank, Monitoring)
- Wartung und Weiterentwicklung (Updates, neue Prompts, Bug-Fixes)
Typische Spannen für Mittelstandsprojekte 2026:
| Komplexität | Setup einmalig | Laufend pro Monat |
|---|---|---|
| Einfacher Chatbot mit RAG | 5.000–15.000 € | 200–800 € |
| ERP-/CRM-Integration | 15.000–40.000 € | 500–2.000 € |
| Multi-Step-Agent mit Tool-Use | 25.000–80.000 € | 1.000–4.000 € |
| Multi-Agent-System mit Memory | 50.000–150.000 € | 2.000–8.000 € |
Diese Zahlen sind echt — kein Marketing-Anker, kein “Investment-needs-to-be-five-figures”-Push. Wir bauen Agents in diesen Größenordnungen 2026 für Mittelständler.
Was die Komplexität wirklich treibt
Nicht das LLM-Modell. Claude Sonnet 4.6 kostet 3 €/M Input-Tokens. Bei 50.000 Anfragen/Monat mit 2.000 Token Input + 500 Token Output landest du bei ~75 € Inferenz-Kosten. Das ist nicht der Faktor.
Was wirklich teuer ist:
Anbindungen an Bestandssysteme. ERP, CRM, Ticketing, E-Mail, Telefon — jede Integration ist eigene Arbeit. Eine saubere Odoo-Anbindung mit Schreib- und Leserechten, Audit-Log und Rollback-Logik ist 2–5 Tage. SAP-Anbindung mit RFC-Calls ist 5–15 Tage. Mehrere Systeme zu einem orchestrieren: Multiplikator 2–3×.
Eval-Setup und Regression-Tests. Ein Agent ohne Eval-Set ist ein Glücksspiel. Eval-Set bedeutet: 100–500 Test-Cases mit erwarteten Outputs, Pipeline für automatische Re-Tests bei jeder Änderung. Initial 5–10 Tage, dann laufende Pflege.
Compliance-Layer. DSFA, AVV-Stack, Audit-Logging, PII-Detection, Mitarbeiter-Schulung — kein Stundenfresser im klassischen Sinne, aber pro Punkt 1–3 Tage. Bei Hochrisiko-KI deutlich mehr.
Frontend / UX. Wenn der Agent ein Custom-UI braucht (statt nur API oder Slack-Bot), wird das eigenes Projekt: 5–20 Tage.
Monitoring und Observability. Anständige Setups mit OpenTelemetry, Grafana, Cost-Dashboards: 2–5 Tage initial.
Drei realistische Beispiel-Kalkulationen
Beispiel 1: Customer-Support-Chatbot mit RAG (Klein)
Use-Case: Webseiten-Chatbot mit Zugriff auf FAQs und Produktdatenbank, ~500 Anfragen/Tag.
Setup-Aufwand (15 Tage à 1.200 €):
- Anforderungsanalyse + Daten-Aufbereitung: 2 Tage
- RAG-Pipeline mit Embeddings und Re-Ranking: 3 Tage
- Frontend-Widget (Chat-UI für Webseite): 2 Tage
- Compliance (DSFA, Datenschutzerklärung-Update, AVV): 2 Tage
- Eval-Set mit 100 Test-Cases: 2 Tage
- Monitoring + Logging: 1 Tag
- Live-Deployment + 3 Iterations-Runden: 3 Tage
- Summe: 18.000 €
Monatlich:
- Anthropic Claude Sonnet 4.6 API: ~150 €
- Vector-DB (Qdrant Cloud): ~50 €
- Hosting + Monitoring: ~80 €
- Wartung (1 Tag/Monat): 1.200 €
- Summe: ~1.480 €/Monat
Beispiel 2: ERP-Agent für Backoffice (Mittel)
Use-Case: Agent in Odoo, der eingehende Mails klassifiziert, Tickets anlegt, Stammdaten ergänzt und Standard-Antworten generiert.
Setup-Aufwand (35 Tage):
- Anforderungsanalyse + Stakeholder-Interviews: 3 Tage
- Odoo-Anbindung (Lesen + Schreiben mit Audit-Trail): 5 Tage
- Mail-Pipeline (IMAP, Klassifikation, Anhang-Verarbeitung): 4 Tage
- LLM-Logik für Klassifikation und Entwurf: 4 Tage
- Eval-Set + Bias-Checks: 4 Tage
- Compliance (DSFA, AI-Act-Klassifizierung, AVV): 3 Tage
- Audit-Logging + Monitoring: 3 Tage
- Human-in-the-Loop-UI für Mitarbeitende: 5 Tage
- Live-Deployment + Iteration: 4 Tage
- Summe: 42.000 €
Monatlich:
- LLM-API (höhere Last): ~600 €
- Embedding + Vector-DB: ~150 €
- Hosting + Monitoring: ~200 €
- Wartung + neue Use-Cases: ~1.500–2.500 €
- Summe: ~2.500–3.500 €/Monat
Beispiel 3: Multi-Agent-System für Lead-Qualifizierung (Groß)
Use-Case: Mehrstufige Pipeline: Lead aus Webformular → Anreicherung über Firmen-DB → Bonitätsprüfung → Qualifikations-Interview per Chat → Übergabe an Sales mit Score und Empfehlung.
Setup-Aufwand (75 Tage):
- Architektur-Design + Compliance-Klärung (AI-Act-Risikoeinstufung): 5 Tage
- 4 spezialisierte Sub-Agents bauen: 30 Tage
- Orchestrator + State-Management: 10 Tage
- Integration in HubSpot/Salesforce/Pipedrive: 8 Tage
- Externe DB-Anbindungen (NorthData, Schufa-API, eigene CRM-Quellen): 8 Tage
- DSFA + AI-Act-Konformitätspaket: 6 Tage
- Eval-Set für jeden Sub-Agent: 5 Tage
- Audit-Trail + Monitoring + Cost-Dashboards: 3 Tage
- Summe: 90.000 €
Monatlich:
- LLM-API (Multi-Step, höhere Token-Last): ~1.500–3.000 €
- Externe DB-Calls (Bonität, Firmen-Lookup): ~500–1.500 €
- Hosting + Monitoring: ~400 €
- Wartung + neue Edge-Cases: ~2.500–4.000 €
- Summe: ~5.000–8.000 €/Monat
Was bei Billig-Angeboten fehlt
Wenn jemand “AI Agent für 2.500 €” anbietet, fehlen typischerweise:
- Eval-Set. Du weißt nicht, ob der Agent in 1 % oder 30 % der Fälle Mist baut. Beim ersten Fehlerfall hast du kein Diagnose-Tool.
- Audit-Logging. Bei einer Datenschutz-Anfrage oder einem Streit kannst du nicht belegen, was passiert ist.
- Compliance. DSFA, AVV, AI-Act-Klassifizierung sind nicht eingepreist. Wenn die Aufsichtsbehörde fragt, gehst du nackt da hin.
- Monitoring. Cost-Explosion, Modell-Drift, Verfügbarkeits-Probleme bemerkst du erst nach Wochen.
- Übergabe. Workflow lebt im n8n-Account des Anbieters. Bei Vertragsende — oder bei Streit — bist du raus.
- Modell-Wartung. Modelle werden deprecated. Wer kümmert sich um den Upgrade-Pfad?
Diese Posten sind nicht “Premium-Aufschlag”, sondern Grundausstattung für produktive Systeme. Wer ohne sie startet, zahlt später drauf.
Was bei Enterprise-Angeboten zu viel ist
Wenn jemand “AI Agent ab 250.000 €” anbietet, sind das oft:
- Architektur-Workshops und Design-Sprints, die für deinen einen Use-Case überdimensioniert sind
- Eigene Modell-Layer (Fine-Tuning, RAG-Frameworks), die du nicht brauchst — Standard-Stack reicht
- Premium-Compliance-Audits, die im Mittelstand selten den vollen Aufwand rechtfertigen
- Skalierungs-Tools für 10.000+ User/Tag, wenn du 50/Tag hast
Diese Aufschläge sind für Konzerne mit anderen Risiko-Profilen. Im Mittelstand sind sie selten begründet.
Wo wir typischerweise landen
Für 2026er-Mittelstands-Projekte sind unsere Angebote meist:
- Discovery + Prototyp: 5.000–8.000 € (2–3 Wochen, Go/No-Go-Entscheidung)
- Produktion (Phase 1): 15.000–60.000 € (1–3 Monate, ein konkreter Use-Case live)
- Betrieb + Erweiterung: 1.500–4.000 €/Monat (laufende Wartung, neue Use-Cases, Modell-Updates)
Wir empfehlen immer die Stufenweise: erst Discovery, dann Produktion, dann Betrieb. Niemand kauft ein 80.000-€-System, das er noch nicht erlebt hat — nach dem 8.000-€-Discovery-Schritt kennst du den Hebel und entscheidest informiert weiter.
Was du heute nicht tun solltest
Keine “AI Agent für 2.500 €“-Angebote ohne Eval-Set und Compliance-Layer. Keine “Enterprise-Architektur”-Angebote für einen einzelnen Use-Case. Und keine Investitionsentscheidung ohne Discovery — das ist die Phase, in der Aufwand und Nutzen ehrlich gemessen werden.
Pragmatischer Einstieg: 30-Minuten-Erstgespräch, in dem wir den Use-Case klassifizieren und eine grobe Spanne nennen. Wenn das passt: Discovery-Phase buchen. Wenn nicht: Du sparst dir das Budget für einen Use-Case, der realistischer ist.
Konkrete Frage zu eurem Setup?
Ein 30-Minuten-Erstgespräch klärt meistens schon, ob euer aktueller AI-Stack hält oder wo nachzuarbeiten ist. Kostenlos, ohne Verkaufsdruck.
Erstgespräch buchen