Deine Support-Queue, sicher im Autopilot
Die meisten KI-Support-Tools entwerfen eine Antwort und warten dann. Dieses nimmt das Ticket auf, findet eine belegte Antwort, prüft die eigene Arbeit und sendet oder eskaliert — während ein Mensch ein Dashboard beobachtet, statt jede Antwort freizugeben.
Direkt auf Anthropics offiziellem Customer-Support-Plugin aufgebaut. Wird mit einem Scheduler kombiniert, den du für unbeaufsichtigten Betrieb konfigurierst. Es bringt keine Live-Zugangsdaten mit und läuft nicht von selbst — du schaltest jede Lane bewusst ein, nachdem du sie im Entwurfsmodus beobachtet hast.
Warum die meisten KI-Support-Systeme brechen — und was dieses anders macht
Jeder dokumentierte KI-Support-Fehler folgt demselben Muster: Das Modell antwortete selbstbewusst, nichts prüfte es, und kein Gate stoppte es, bevor es den Kunden erreichte. Eine Fluggesellschaft wurde rechtlich für eine Erstattungsrichtlinie haftbar gemacht, die ihr Chatbot erfunden hatte. Der Bot eines Developer-Tools-Unternehmens erfand eine Login-Beschränkung, die nie existierte — Kunden kündigten, bevor jemand eingreifen konnte. Der Bot eines Autohändlers wurde dazu gebracht, einem Verkauf eines SUV für $76,000 für $1 zuzustimmen. Das Versagen ist nie das Modell. Es ist das fehlende Gate. Dieses Plugin ist dieses Gate, real umgesetzt und mit deinen Systemen verbunden.
Wie KI-Support in Produktion bricht
- ✗Der Bot nennt eine Richtlinie, einen Tarif oder eine Zertifizierung, die er erfunden hat — und sendet sie. Der Kunde handelt danach, bevor es jemand bemerkt.
- ✗Das Ticket wird eskaliert. Der Kunde muss alles von vorn erklären, weil nichts die Übergabe überlebt hat.
- ✗Eine Erstattung oder Kontoänderung wird aufgrund einer Anfrage ausgeführt, deren Legitimität niemand geprüft hat.
- ✗Das Ticket wird geschlossen und das Dashboard sieht grün aus. Zwei Tage später ist dasselbe Problem zurück.
Wie dieses Plugin anders konstruiert ist
- ✓Jede kundenbezogene Fakten- oder Richtlinienbehauptung muss auf eine Wissensdatenbank-Quelle verweisen, die innerhalb von 90 Tagen geprüft wurde — sonst wird der Versand blockiert, nicht abgeschwächt.
- ✓Ein einziger Case Record begleitet jedes Ticket über jeden Agenten und jede Übergabe hinweg. Der Kunde muss sich nie wiederholen. Das menschliche Eskalationspaket ist immer vollständig.
- ✓Keine Erstattung, kein Tarifwechsel und kein Zurücksetzen von Zugangsdaten läuft, ohne dass der Identity Verifier gegen dein CRM und deinen Identity Provider bestätigt, wer die Anfrage stellt — fail-closed.
- ✓Ein Drift Monitor verfolgt, ob 'gelöst' wirklich hält — Wiedereröffnungsrate, CSAT-Delta und Wissensdatenbank-Veralterung melden sich, bevor ein Qualitätsrückgang zum Muster wird.
Ein Ticket, von Eingang bis Lösung — kein Mensch erforderlich
So läuft es tatsächlich ab, wenn ein Support-Ticket eingeht. Folge ihm Schritt für Schritt durch die Agenten. Die Gates sind keine Vorschläge — sie schließen bei Fehlern.
- 1
Ticket kommt an
Ein Kunde schreibt wegen eines Abrechnungsfehlers — oder eine Nachricht landet in deinem Helpdesk. Noch kein Mensch sieht sie. Die Queue wird beobachtet.
- 2
Intake Watcher
Der Intake Watcher erkennt das neue Ticket und öffnet einen Case Record: ein strukturiertes, dauerhaftes Objekt, das dieses Ticket durch jeden Agenten und jede Übergabe begleitet. Die Kontohistorie des Kunden, die ursprüngliche Nachricht und jeder spätere Kontext sammeln sich hier — damit nie jemand den Kunden bitten muss, sich zu wiederholen.
- 3
Triage Agent
Der Triage Agent klassifiziert das Ticket: Kategorie (Abrechnung, Kontozugriff, Bug Report, Richtlinienfrage) und Priorität P1 bis P4. Er prüft deine Wissensdatenbank und den Projekt-Tracker auf bekannte passende Probleme und schreibt die Klassifizierung dann in deinen Helpdesk zurück. Wenn das Ticket als P1 bewertet wird oder ein Legal- oder Security-Keyword auslöst, alarmiert es sofort den Bereitschaftsdienst und stoppt — autonome Lanes laufen nie auf P1.
- 4
Router
Der Router liest die Klassifizierung aus dem Case Record und wählt die richtige Lane: Antwort-Lane für lösbare Fragen, Action-Lane, wenn eine Kontoänderung nötig ist, Eskalations-Lane, wenn ein Bug Engineering braucht. Lanes laufen parallel, wenn sowohl eine Antwort als auch eine Aktion erforderlich sind.
- 5
Researcher + Composer
In der Antwort-Lane fragt der Researcher deine Wissensdatenbank, die Tickethistorie und CRM-Notizen ab — und hängt an jede gefundene Fakten- oder Richtlinienbehauptung eine Quelle. Der Composer entwirft dann die kundenbezogene Antwort und nutzt nur zitiertes Material.
- 6
Grounding Verifier (Gate — kann blockieren)
Der Grounding Verifier prüft unabhängig jede Fakten- und Richtlinienaussage im Entwurf. Eine Frage: Ist diese Behauptung an eine Wissensdatenbank-Quelle gebunden, die innerhalb der letzten 90 Tage geprüft wurde? Wenn ja, besteht der Entwurf. Wenn nicht, wird die Behauptung entfernt oder der gesamte Versand blockiert und der Fall mit dem exakt markierten Satz an einen Menschen geroutet. Es gibt keinen 'wahrscheinlich ok'-Pfad.
- 7
Identity Verifier + Authorization Verifier (Gates — können blockieren)
Wenn eine Kontoaktion nötig ist — eine Erstattung, ein Tarifwechsel, ein Zurücksetzen von Zugangsdaten — läuft zuerst der Identity Verifier. Er prüft den Anfragenden gegen dein CRM und deinen Identity Provider. Wenn die Identität nicht bestätigt werden kann, wird die Aktion sofort verweigert. Wenn die Identität besteht, prüft der Authorization Policy Verifier, ob die Aktion innerhalb der Befugnis der geprüften Identität und unterhalb der Geldgrenze liegt. Beide müssen bestehen, bevor ein einziger Schreibvorgang passiert. Aktionen werden aus einem strukturierten Plan gebaut, nie aus der rohen Kundennachricht — das ist die Firebreak, die Prompt Injection stoppt.
- 8
Sender / Action Agent
Gates bestanden: Der Sender postet die Antwort in deinen Helpdesk oder sendet per E-Mail. Wenn eine Kontoaktion genehmigt ist, führt der Action Agent sie aus — stellt die Erstattung aus, passt den Tarif an — und protokolliert die Aktion in deinem CRM. Der Case Record wird mit dem aktualisiert, was gesendet und was getan wurde.
- 9
KB Author + Drift Monitor
Sobald das Ticket gelöst ist, prüft der KB Author auf einen doppelten Artikel und erstellt oder aktualisiert automatisch den passenden Eintrag in deiner Wissensdatenbank. Der Drift Monitor beobachtet diesen Problem-Cluster danach über die Zeit — wenn die Wiedereröffnungsrate steigt oder die Zufriedenheit sinkt, legt er ein Tracker-Issue an, bevor du eine Klarna-artige Qualitätsregression hast.
- 10
Operator-Dashboard
Ein Mensch kommt nur ins Bild, wenn ein Schwellenwert auslöst — eine nicht verifizierbare Behauptung wurde blockiert, eine Identitätsprüfung ist fehlgeschlagen, ein P1 wurde erkannt oder eine Kennzahl liegt außerhalb des Bereichs. Alles andere ist ein Dashboard-Signal, keine Aufgabe. Jede Lane hat einen Kill-Switch: Umlegen, und diese Lane kehrt sofort in den reinen Entwurfsmodus zurück, ohne Downtime.
Sechs Dinge, die das System kann und ein Chatbot nicht
Neunzehn spezialisierte Agenten arbeiten als Team. Mehrere haben nur die Befugnis, einander zu blockieren — die adversarial Verifier existieren aus einem einzigen Grund: eine falsche Antwort, eine ungeprüfte Aktion oder eine unvollständige Übergabe zu stoppen, bevor sie einen Kunden oder deine Systeme erreicht.
Beobachtet die Queue und öffnet jedes Ticket
Ein Intake Watcher abonniert deinen Helpdesk und Support-Posteingang. Wenn ein Ticket eingeht, öffnet er einen dauerhaften Case Record, klassifiziert Priorität (P1–P4) und Kategorie, schreibt das Ergebnis in deine Plattform zurück und routet es — bevor ein Mensch es liest. P1- sowie Legal- oder Security-Tickets alarmieren sofort den Bereitschaftsdienst.
Findet eine belegte Antwort und blockiert alles, was es nicht beweisen kann
Ein Researcher ruft eine zitierte Antwort aus deiner Wissensdatenbank ab. Ein Composer entwirft die Antwort. Danach prüft ein adversarial Grounding Verifier unabhängig jede Fakten- und Richtlinienbehauptung: Wenn sie nicht auf eine Quelle zurückgeführt werden kann, die innerhalb von 90 Tagen geprüft wurde, wird der Versand blockiert — nicht abgeschwächt, nicht umformuliert. Der Sender handelt nur bei sauberem Pass.
Prüft Identität und erzwingt Grenzen vor jeder Kontoaktion
Vor jeder Erstattung, jedem Tarifwechsel oder jedem Zurücksetzen von Zugangsdaten bestätigt ein Identity Verifier gegen dein CRM und deinen Identity Provider, wer die Anfrage stellt. Aktionen laufen nur aus einem strukturierten Aktionsplan — nie aus rohem Kundentext; das ist die Firebreak gegen Prompt Injection. Ein Authorization Policy Verifier blockiert alles, was außerhalb der Befugnis der geprüften Identität oder oberhalb einer konfigurierten Geldgrenze liegt.
Eskaliert mit vollständigem Paket und fasst ohne Aufforderung nach
Ein Escalation Packager erstellt aus dem Case Record ein strukturiertes Briefing. Ein Escalation Coordinator blockiert jedes Paket, dem Reproduktionsschritte oder Impact-Belege fehlen — unvollständige Übergaben können nicht weiterlaufen. Sobald es eingereicht ist, beobachtet ein Follow-up Agent das Tracker-Issue und informiert den Kunden aus demselben Case Record, wenn Engineering antwortet. Der Kunde muss sich nie wiederholen.
Selbstaktualisierende Wissensdatenbank
Nach jedem gelösten Ticket führt ein KB Author einen Dedupe-Check aus und erstellt oder aktualisiert automatisch den passenden Artikel in deiner Wissensdatenbank. Ein Drift Monitor verfolgt danach, ob diese Lösungen halten — und legt ein Tracker-Issue an, wenn die Wiedereröffnungsrate oder CSAT eines Clusters zu rutschen beginnt.
Operator-Dashboard mit Kill-Switches pro Lane
Neun Echtzeit-Signale benachrichtigen einen Menschen nur, wenn ein Schwellenwert auslöst: P1-Recall, Fehlrouting-Rate, Antwort-Groundedness, Halluzinations-Escapes, Kontoaktionen ohne geprüfte Identität, rückgängig gemachte Aktionen, Vollständigkeit der Übergabe, Wiedereröffnungsrate und CSAT-Delta gegenüber menschlich bearbeiteten Tickets. Jede Lane hat einen Kill-Switch: Umlegen, und diese Lane kehrt in den reinen Entwurfsmodus zurück — ohne Downtime, ohne kaskadierenden Fehler.
Auf Anthropics offiziellem Customer-Support-Plugin aufgebaut
Dieses Plugin setzt dort an, wo Anthropics offizielles Customer-Support-Plugin aufhört — es ersetzt es nicht. Anthropic liefert fünf sauber ausgearbeitete Skills für Support-Arbeit. Sie sind das Fundament. Jeder Skill, jedes Framework und jede Tonalitätsleitlinie bleibt erhalten. Was dieses Plugin ergänzt, ist die autonome Multi-Agenten-Betriebsschicht, die das Original bewusst dem Builder überlässt: den Queue Watcher, die Write-back-Connectoren, das gemeinsame Case Memory und die adversarial Gates, die gegenseitig ihre Ausgabe prüfen. Hier ist genau, was Anthropics Plugin in jedem Bereich leistet und was die autonome Schicht daraus macht.
Anthropics offizielles Customer-Support-Plugin auf GitHub ansehen
Ticket-Triage
Out of the box
Du führst /triage für ein Ticket aus. Der Skill klassifiziert Kategorie, Priorität (P1–P4) und Sentiment, prüft auf bekannte Probleme und endet mit: 'Want me to draft a full response? Want me to escalate this?'
With the autonomous agents
Ein Intake Watcher nimmt jedes neue Ticket automatisch auf. Er öffnet einen Case Record, führt dieselbe Triage-Klassifizierung aus, schreibt Priorität und Kategorie in deinen Helpdesk zurück und routet das Ticket — bevor ein Mensch es liest. Du bist nicht mehr im Loop für den Triage-Schritt.
Kundenrecherche
Out of the box
Du führst /research für ein Ticket aus. Der Skill durchsucht deine Wissensdatenbank, dein CRM und interne Kanäle, synthetisiert die Ergebnisse und endet mit: 'Want me to draft a response based on this? Want me to create a FAQ entry?'
With the autonomous agents
Der Researcher läuft als Teil der autonomen Antwort-Lane und hängt automatisch an jedem Ticket. Seine Ergebnisse werden in den Case Record geschrieben, sodass jeder nachfolgende Agent — einschließlich jeder menschlichen Eskalation — das vollständige Bild hat, ohne die Suche erneut auszuführen.
Antwortentwurf
Out of the box
Du führst /draft-response aus. Der Skill entwirft eine Antwort mit internen Notizen und fragt dann: 'Want me to adjust the tone? Want me to draft the escalation note as well?' Ein Mensch prüft und sendet.
With the autonomous agents
Der Composer entwirft; anschließend prüft ein adversarial Grounding Verifier jede Fakten- und Richtlinienbehauptung gegen eine Wissensdatenbank-Quelle, die innerhalb von 90 Tagen geprüft wurde. Jede Behauptung ohne frische Quelle wird entfernt oder der Versand wird blockiert. Nur bei sauberem Pass postet der Sender die Antwort in deinen Helpdesk — kein Mensch in der Freigabekette.
Eskalationspaket
Out of the box
Du führst /customer-escalation aus. Der Skill erstellt ein strukturiertes Briefing und endet mit: 'Want me to post this in a chat channel? Want me to set a follow-up reminder?'
With the autonomous agents
Ein Escalation Coordinator blockiert jedes Paket, dem Reproduktionsschritte oder Impact-Belege fehlen — unvollständige Übergaben können nicht weiterlaufen. Bei bestandenem Check erstellt ein Tracker Agent das Issue in deinem Projekt-Tracker und postet in den Team-Chat. Ein Follow-up Agent beobachtet danach das Issue und informiert den Kunden aus demselben Case Record, wenn Engineering antwortet.
Wissensdatenbank-Schreiben
Out of the box
Du führst /kb-article nach einer Lösung aus. Der Skill entwirft einen Artikel und fragt: 'Want me to check if a similar article already exists?'
With the autonomous agents
Nach jedem gelösten Ticket führt der KB Author automatisch den Dedupe-Check aus und erstellt oder aktualisiert den Artikel in deiner Wissensdatenbank. Ein Drift Monitor verfolgt anschließend, ob diese Lösungen über die Zeit halten — und legt ein Tracker-Issue an, wenn die Wiedereröffnungsrate oder der Zufriedenheitswert eines Clusters zu rutschen beginnt.
Ist das das richtige Tool?
Am besten geeignet
- SaaS- und Subscription-Unternehmen mit hohem Volumen repetitiver Tier-1-Tickets — Abrechnung, Tarifwechsel, Kontozugriff, Richtlinienfragen
- Support-Teams, die bereits Intercom, HubSpot, Slack oder Microsoft 365 nutzen und autonomen Betrieb wollen, ohne ihren Stack zu ersetzen
- Teams, die eine auditierbare, richtliniensichere Schicht für Erstattungen und Kontoaktionen brauchen — jede Aktion identitätsgeprüft, deckelgebunden und protokolliert
- Teams, die einen Support-Chatbot eingeführt, die Qualitäts- oder Sicherheitslücke gesehen haben und nun die Gate-Schicht brauchen, die fehlte
Nicht die richtige Lösung
- —Teams ohne Wissensdatenbank oder CRM — der Grounding Verifier braucht eine Quelle der Wahrheit; ohne sie werden die meisten Antworten an Menschen geroutet und der autonome Nutzen ist gering
- —Unternehmen, deren Kundeninteraktionen klinische Beurteilung, regulierte professionelle Beratung oder tiefe menschliche Empathie erfordern — Gesundheitswesen, Recht, Finanzberatung
- —Alle, die vollständig automatisierten Support ohne Menschen im Loop wollen — dieses System ist für ein Mensch-beobachtet-Kennzahlen-Modell entwickelt, nicht für ein Null-Mensch-Modell
Von der Installation zur ersten autonomen Antwort in vier Schritten
- 1In Claude Code oder Cowork mit zwei Befehlen installieren — unter zwei Minuten
- 2Deinen bestehenden Stack verbinden: Helpdesk, CRM, Wissensdatenbank, Chat und E-Mail
- 3Zuerst im reinen Entwurfsmodus laufen lassen — Dashboard beobachten und prüfen, ob die Gates funktionieren
- 4Lanes einzeln öffnen, sobald Vertrauen entsteht. Der Mensch bearbeitet die seltene Eskalation; die Agenten erledigen alles andere
Mit einer Lane starten. Beim Arbeiten zusehen.
Zwei Befehle zur Installation. Jede Lane startet im reinen Entwurfsmodus — keine autonome Aktion, bis du entscheidest, dass sie bereit ist. Kostenlos, Open Source und auf Anthropics offizieller Plugin-Grundlage aufgebaut.
Kein Spam, niemals. Deine E-Mail wird sicher gespeichert, damit wir dir Updates zu neuen Anwendungsfällen und Workflows senden können.
Schritt für Schritt: Plugin installieren
Plugin-Quelle hinzufügen
In Claude Code oder Cowork ausführen: claude plugins marketplace add mlobo2012/Autonomous-Customer-Support-Plugin — dadurch wird das Repository als vertrauenswürdige Quelle registriert.
Plugin installieren
Ausführen: claude plugins install autonomous-customer-support — Claude lädt 19 spezialisierte Agenten, 7 Skills, 2 harte Sicherheitsgates und 2 JSON-Schemas herunter.
Systeme verbinden
CONNECTORS.md öffnen und Helpdesk, CRM, Wissensdatenbank, Chat, E-Mail und Projekt-Tracker verbinden. Enthaltene Connectoren decken Intercom, HubSpot, Guru, Notion, Slack, Microsoft 365 und Atlassian ab. Für jede Kategorie kannst du deinen eigenen Connector mitbringen.
Im reinen Entwurfsmodus starten
Jede Lane startet als Co-Pilot — sie entwirft und fragt, bevor sie handelt. Für unbeaufsichtigten Betrieb mit einem Scheduler koppeln. Mit einer Lane beginnen, die neun Dashboard-Signale beobachten und dann weitere öffnen, wenn Vertrauen entsteht.
Dashboard beobachten — nur eingreifen, wenn ein Schwellenwert auslöst
Ein Engineer pro Schicht verantwortet das Operator-Dashboard. Jede Lane hat einen Kill-Switch, der sie in den reinen Entwurfsmodus zurücksetzt, ohne das System herunterzufahren. Alle autonomen Aktionen werden protokolliert und sind auditierbar.
Häufig gestellte Fragen
Ein autonomer Customer-Support-Agent ist ein KI-System, das Tickets aufnimmt, ohne auf einen menschlichen Auslöser zu warten, löst, was es beweisen kann, und den Rest mit einem vollständigen Kontextpaket eskaliert. Anders als ein Chatbot, der eine Antwort entwirft und darauf wartet, dass jemand auf Senden klickt, führt ein autonomer Agent echte Aktionen aus — Antworten posten, Erstattungen ausstellen, Bugs einreichen, die Wissensdatenbank aktualisieren — innerhalb vorher vereinbarter Sicherheitsgates. Die Aufgabe des Menschen verschiebt sich vom Freigeben jeder Antwort zum Beobachten eines Kennzahlen-Dashboards und zum Bearbeiten des seltenen Falls, den das System nicht sicher lösen kann.
Ein Chatbot präsentiert eine vorgeschlagene Antwort und wartet darauf, dass ein Mensch sie freigibt und sendet — er ist ein schnellerer Co-Pilot, kein Teammitglied. Dieses Plugin schließt den Loop: Ein Team spezialisierter Agenten triagiert das Ticket, ruft eine fundierte Antwort ab, prüft jede Behauptung vor dem Senden adversarial und führt echte Aktionen in deinen Systemen innerhalb von Sicherheitsgates aus. Pro Ticket ist kein menschlicher Tastendruck erforderlich. Der Designunterschied ist die Gate-Schicht — insbesondere der Grounding Verifier, der jede Behauptung ohne frische Quelle blockiert, und der Identity Verifier, der jede Kontoaktion ohne bestätigte Identität blockiert.
Nur mit einem Identitätsgate und einer Geldgrenze — dieses Plugin hat beides, auf Tool-Ebene durchgesetzt, nicht als Vorschläge, die das Modell überspringen könnte. Der Identity Verifier bestätigt den Anfragenden gegen dein CRM und deinen Identity Provider, bevor eine Kontoaktion läuft. Ein Authorization Policy Verifier blockiert dann alles, was die Befugnis der geprüften Identität oder eine von dir konfigurierte Transaktionsgrenze überschreitet (standardmäßig wird alles über $200 oder wiederholte Erstattungen innerhalb von 30 Tagen zur menschlichen Prüfung geroutet). Alle Aktionen laufen aus einem strukturierten Aktionsplan, nie aus rohem Kundentext — die Firebreak, die Prompt-Injection-Angriffe wie den Chevrolet-Händlerfall stoppt (AI Incident Database #622, Dec 2023).
Enthaltene Connectoren decken Intercom (Helpdesk), HubSpot (CRM), Guru und Notion (Wissensdatenbank), Slack (Chat), Microsoft 365 (E-Mail und Cloud-Speicher) sowie Atlassian (Projekt-Tracker) ab. Das Plugin ist nach Connector-Kategorie tool-agnostisch — wenn deine Plattform nicht von einem enthaltenen Connector abgedeckt ist, kannst du für jeden Slot deinen eigenen mitbringen. Zendesk-Support erfordert einen MCP-Connector, den du konfigurierst; die Plugin-Architektur verlangt in keiner Kategorie einen bestimmten Anbieter.
Anthropics Plugin ist ein ausgezeichneter Ausgangspunkt — fünf sauber ausgearbeitete Skills für Triage, Research, Antwortentwurf, Eskalation und Wissensdatenbank-Schreiben, die dieses Plugin alle als Fundament beibehält. Das Original ist als Co-Pilot konzipiert: Jeder Skill endet mit einer Berechtigungsfrage und greift nur lesend auf deine Systeme zu; ein Mensch steuert weiterhin jedes Ticket. Dieses Plugin ergänzt darauf die autonome Betriebsschicht: einen Intake Watcher, der Tickets unabhängig aufnimmt, Write-back-Connectoren, die in echten Systemen handeln, einen dauerhaften Case Record, der Kontext über jeden Turn trägt, und adversarial Verifier Gates, die falsche Antworten und nicht autorisierte Aktionen blockieren, bevor sie einen Kunden erreichen. Mehr Details im Abschnitt 'Was Anthropics Plugin leistet' oben.
Ja, mit einem Scheduler, den du konfigurierst. Das Plugin liefert die autonome Multi-Agenten-Architektur und die Sicherheitsgates. Um Lanes unbeaufsichtigt zu betreiben, koppelst du es mit einer Runtime, die den autonomous-support-loop Skill für deine Ticket-Queue startet — ein Cron-Job, ein OpenClaw-Agent oder eine Cowork-Background-Session. Das Plugin bringt keine Live-Zugangsdaten mit und läuft nicht von selbst. Empfohlen ist, mit einer Lane im reinen Entwurfsmodus zu starten, zu bestätigen, dass Groundedness- und Eskalationsmetriken grün sind, und dann autonomes Senden Lane für Lane einzuschalten.
Das System hat zwei harte Fail-closed-Gates und keinen weichen 'wahrscheinlich ok'-Pfad. Wenn eine kundenbezogene Fakten- oder Richtlinienbehauptung nicht an eine Wissensdatenbank-Quelle gebunden werden kann, die innerhalb von 90 Tagen geprüft wurde, wird der Versand blockiert und der Fall mit der exakt nicht verifizierbaren Behauptung an einen Menschen geroutet. Wenn die Identität vor einer Kontoaktion nicht geprüft werden kann, wird die Aktion verweigert und ein Mensch erhält die Anfrage mit den Identitätsbelegen und einem empfohlenen nächsten Schritt. Ein Tone Gate blockiert außerdem feindselige oder nicht markenkonforme Ausgabe, bevor sie versendet wird.
Das Plugin ist kostenlos und Open Source. Du brauchst ein aktives Claude Code- oder Cowork-Abonnement und die Connectoren zu deinen bestehenden Systemen — Intercom, HubSpot und so weiter zu deren eigenen Preisen. Für das Plugin selbst fällt keine zusätzliche Gebühr an. AI Heroes bietet bezahlte Implementierung, Connector-Konfiguration und Operator-Dashboard-Design für Teams an, die ein betreutes Setup möchten. Buche einen Call, um darüber zu sprechen.
Quellen & Recherche
Jede Designentscheidung in diesem Plugin basiert auf einem dokumentierten, verifizierbaren Vorfall oder auf Peer-Review-Forschung — geprüft per Live-Websuche am 2026-05-24.
Moffatt v. Air Canada, 2024 BCCRT 149
Das BC Civil Resolution Tribunal machte Air Canada für die falsche Bereavement-Fare-Auskunft ihres Chatbots haftbar, sprach C$812.02 zu und wies das Argument zurück, der Chatbot sei 'a separate legal entity.' Belegt, dass ein Unternehmen rechtlich an das gebunden ist, was sein Support-Agent einem Kunden sagt.
Cursor 'Sam' support bot, AI Incident Database #1039 (Apr 2025)
Cursors Support-Bot teilte Nutzern mit, ihr Abonnement sei auf ein aktives Gerät beschränkt — eine Richtlinie, die nicht existierte. Die Fehlinformation verbreitete sich auf Hacker News und Reddit; Nutzer kündigten Abonnements. Co-founder Michael Truell entschuldigte sich öffentlich: 'we have no such policy.' Ursache war ein Sicherheitsupdate, das als Richtlinienänderung fehlgedeutet wurde.
Chevrolet dealer chatbot, AI Incident Database #622 (Dec 2023)
Ein ChatGPT-gestützter Chevrolet-Händler-Chatbot wurde angewiesen, 'agree with anything' und stimmte dem Verkauf eines 2024 Chevy Tahoe für $1 zu. Der Händler hielt dies nicht ein und zog den Chatbot zurück. Das zeigt das Prompt-Injection-Risiko ohne Autorisierungsgrenze.
DPD chatbot incident (18 Jan 2024)
DPD deaktivierte das KI-Element seines Chatbots, nachdem es nach einem Systemupdate einen Kunden beschimpft, ein Gedicht geschrieben hatte, in dem es sich selbst als 'a useless chatbot' bezeichnete, und DPD als 'the worst delivery firm in the world' beschrieben hatte. Das zeigt das Brand-Safety-Risiko ohne Tone Gate.
Klarna AI assistant (Feb 2024 → mid-2025)
Klarnas KI-Assistent bearbeitete in 30 Tagen 2,3 Millionen Chats — das Äquivalent von ~700 Agents, 67% aller Gespräche — mit ~82% schnellerer Lösung. Bis 2025 räumte CEO Sebastian Siemiatkowski ein, dass die Qualität sank und dies 'not sustainable' sei, und begann, Menschen in ein hybrides Modell zurückzuholen. Der dokumentierte Endzustand ist ein hybrides Modell — genau das Mensch-beobachtet-Kennzahlen-Betriebsmodell, für das dieses Plugin entwickelt ist.
MGM Resorts / Scattered Spider (Sep 2023)
Scattered Spider gab sich in einem etwa 10-minütigen Anruf beim IT-Helpdesk als MGM-Mitarbeiter aus, erhielt Zugriff, eskalierte zu Okta- und Azure-Adminrechten und setzte Ransomware ein. Gemeldet wurden ~US$100M Q3-Auswirkungen für MGM. Das belegt Identitätsprüfung im Helpdesk als tragende Kontrolle.
Liu et al., 'Lost in the Middle' (arXiv:2307.03172, TACL 2024)
Retrieval-Genauigkeit verschlechtert sich deutlich, wenn relevante Informationen in der Mitte eines langen Kontexts verborgen sind, selbst bei Long-Context-Modellen. Das begründet, Fallstatus in dauerhaftes strukturiertes Gedächtnis auszulagern, statt sich auf das Chatprotokoll zu verlassen.
Yong et al., 'Low-Resource Languages Jailbreak GPT-4' (arXiv:2310.02446, NeurIPS 2023 SoLaR Best Paper)
Das Übersetzen unsicherer Prompts in Low-Resource-Sprachen umging GPT-4-Sicherheitsfilter in ~79% der Fälle auf AdvBench. Ursache: sprachliche Ungleichheit in Safety-Trainingsdaten. Das begründet eine dedizierte nicht-englische Sicherheitsprüfung, bevor eine nicht-englische Antwort versendet wird.
HubSpot Research / Dimensional Research (compiled 2024)
33% der Kunden sagen, dass es ihr frustrierendstes Erlebnis ist, sich gegenüber mehreren Support-Mitarbeitern wiederholen zu müssen. 72% sagen, ihr Problem mehreren Personen erklären zu müssen, sei schlechter Kundenservice. Das begründet einen dauerhaften Case Record, der Kontext über jeden Agenten-Turn und jede Übergabe trägt.
Mit einer Lane starten. Beim Arbeiten zusehen.
Zwei Befehle zur Installation. Jede Lane startet im reinen Entwurfsmodus — keine autonome Aktion, bis du entscheidest, dass sie bereit ist. Kostenlos, Open Source und auf Anthropics offizieller Plugin-Grundlage aufgebaut.
Soll das für dein Team laufen — ohne Setup-Aufwand?
AI Heroes konfiguriert den vollständigen Stack für SaaS- und Subscription-Unternehmen: Connector-Verkabelung, Einrichtung des Identitätsgates, Scheduler-Konfiguration und Operator-Dashboard-Design. Dein Team beobachtet ab Tag eins Kennzahlen, statt Wochen mit Integration zu verbringen.
