Wie baut ein Unternehmen KI-Agenten mit Claude?

Starten Sie mit einem messbaren Workflow, kodieren Sie den Prozess als wiederverwendbaren Skill, verbinden Sie nur die Tools, die der Agent braucht, ergänzen Sie menschliche Freigabe-Gates für sensible Aktionen und messen Sie die Accepted-Output-Rate, bevor Sie ausweiten. Claude Cowork, Claude Code, MCP, Plugins und Skills sind nützliche Primitive, aber die Implementierungsschicht entscheidet, ob der Workflow skaliert.

Was ist eine Enterprise-KI-Agentenflotte?

Eine Enterprise-KI-Agentenflotte ist ein kontrollierter Satz rollenspezifischer Agenten, geteilter Skills, freigegebener Tools, eines Gedächtnisses, Logs, Evals und Freigabe-Gates, der teamübergreifend arbeitet. Das ist die Produktionsversion der Agent-Adoption: viele eng begrenzte Agenten arbeiten über ein gemeinsames Kontrollmodell statt eines generischen Assistenten.

Wann sollte ein Unternehmen einen Single-Agent statt eines Multi-Agent-Systems nutzen?

Nutzen Sie einen Single-Agent, wenn der Workflow eng begrenzt ist, einen Owner hat und über einen Freigabepfad geprüft werden kann. Wechseln Sie nur dann zu Multi-Agent-Workflows, wenn Zerlegung echten Mehrwert schafft, etwa um Recherche, Ausführung und Review zu trennen. Wechseln Sie zur Flotte, wenn Agenten über Abteilungen, Zeitpläne, Systeme und Governance-Kontrollen hinweg laufen müssen.

Was gehört in einen Claude-Skill für den Enterprise-Einsatz?

Ein Produktions-Skill sollte Operating Procedure, Referenzdateien, Tool-Kontrakt, Review-Regel, Eval-Set und Update-Loop enthalten. Der Skill soll institutionelles Urteilsvermögen wiederverwendbar machen, damit der Output-Standard nicht von der nutzenden Person abhängt.

Wie passt MCP in die Enterprise-KI-Agent-Architektur?

MCP gibt Agenten eine standardisierte Möglichkeit, sich mit externen Systemen wie Dateien, Datenbanken, CRMs, Kalendern, Suchtools und Workflows zu verbinden. In der Enterprise-Architektur gehört MCP in die Tool-Schicht: Berechtigungen, Logging, Freigaberegeln und klare Read/Write-Grenzen umgeben es.

Welche Governance braucht ein Enterprise-KI-Agent-Rollout?

Mindestens braucht jeder Agent Owner, Tool-Grenze, Freigabepfad, Logs, Evals, Cost-Tracking, Rollback-Regeln und Incident-Review. Sensible Aktionen sollten explizite Zustände durchlaufen: Entwurf vorbereitet, Beleg angehängt, menschlich freigegeben, Aktion ausgeführt.

Wie sollten Unternehmen ROI aus KI-Agenten messen?

Messen Sie ROI je Workflow. Tracken Sie Cycle-Time-Kompression, Accepted-Output-Rate, Human-Review-Time, Kosten je abgeschlossenem Workflow, Incident-Rate, Override-Gründe und die verknüpfte Geschäftsmetrik. Unternehmensweite Produktivitätsbehauptungen sind weniger nützlich als der Nachweis, dass ein konkreter Workflow schneller, sicherer oder wertvoller wurde.

Reicht Anthropics Enterprise-Agent-Playbook für die Implementierung im großen Maßstab?

Es ist ein starker strategischer Rahmen, aber kein vollständiger Implementierungsplan für jedes Unternehmen. Enterprises brauchen weiterhin ein eigenes Skill-Ownership-Modell, eine Gedächtnis-Schicht, MCP-Permissions, Beobachtbarkeit, Evals und Flotten-Governance, bevor sie breit ausrollen.

KI-Agenten Claude Enterprise-KI MCP Agent-Workflows OpenClaw

KI-Agenten im Unternehmen bauen: Implementierungsmuster für 2026

Marco Lobo

19. Mai 2026·Aktualisiert 19. Mai 2026·11 Min. Lesezeit

Auf den Punkt

Anthropic hat die Enterprise-Form richtig benannt: dauerhafte Agentenprogramme müssen Mitarbeiter, Prozesse und Produkte gleichzeitig verändern, nicht nur einen Chatbot ins Intranet stellen. Die Implementierungsfrage lautet: Wie wird aus diesem strategischen Rahmen wiederverwendbare Skills, kontrollierter Tool-Zugriff, Gedächtnis, Beobachtbarkeit und sicherer Agentenbetrieb?

Das Produktionsmuster ist eine Agentenflotte, nicht ein riesiger Assistent: Single-Agents sind nützlich für eng begrenzte Arbeit, Multi-Agent-Systeme sind nützlich für zerlegte Workflows, und Enterprise-Flotten sind nützlich, wenn viele kontrollierte Agenten über Teams, Tools, Zeitpläne und Freigabe-Gates hinweg laufen müssen.

Die gewinnende Schicht ist institutionelle Infrastruktur: Die Unternehmen, die mit zinseszinsartiger Wirkung skalieren, kodieren Urteilsvermögen in Skills, Plugins, Referenzdateien, Evals, Logs und Feedback-Loops. Bei AI Heroes bauen wir diese Schicht zuerst, denn sie entscheidet, ob Claude eine Demo bleibt oder zum Betriebssystem wird.

Anthropics Building AI agents for the enterprise-Playbook ist nützlich, weil es nicht so tut, als wäre Enterprise-KI eine Prompt-Schreibübung. Es rahmt das Problem rund um Mitarbeiter, Prozesse und Produkte; zitiert seinen Economic-Index-Befund vom September 2025, wonach 40 Prozent der US-Beschäftigten KI bei der Arbeit nutzen; und verweist Verantwortliche auf Claude Cowork, Plugins, Skills, MCP und Managed Agents als Rollout-Oberfläche.

Das ist der richtige Startpunkt. Es ist nicht das Ziel.

Was ein Implementierungspartner direkter als ein Modellanbieter sagen kann, ist das: Die meisten Enterprise-KI-Programme scheitern nicht, weil das Modell zu schwach ist. Sie scheitern, weil niemand die Operating-Schicht um das Modell herum gebaut hat. Die Berechtigungen sind vage. Die Skills sind persönlich statt institutionell. Die Gedächtnis-Schicht ist ein Ordner voller veralteter Docs. Die Beobachtbarkeit besteht aus Screenshots in Slack. Der Pilot funktioniert, weil drei außergewöhnliche Menschen ihn babysitten, und stockt dann, wenn die nächsten 997 Personen ihn nutzen sollen.

Dieser Leitfaden ist die Implementierungsschicht, die wir uns von mehr Enterprise-Teams wünschen würden, bevor sie ein weiteres Seat-Bundle kaufen.

Wie rahmt Anthropic den Bau von KI-Agenten im Unternehmen?

Anthropic rahmt Enterprise-Agenten als Wechsel von Punktlösungen zu agentischen Systemen, die mehrstufige Arbeit durchdenken, Tools nutzen und Domänenkontext anwenden können. Das Playbook sagt, der dauerhafte Vorteil entsteht aus drei gleichzeitigen Veränderungen: Mitarbeiter weiterbilden, Prozesse beschleunigen und Produkte transformieren.

Dieser Rahmen ist wichtig. Wenn ein Unternehmen Claude als Schreibassistent behandelt, bekommt es schnellere Entwürfe. Wenn es Claude als Operating-Schicht behandelt, fängt es an, andere Fragen zu stellen: Welche Arbeit sollte delegiert werden? Welche institutionellen Standards sollten zu wiederverwendbaren Skills werden? Welche Tools darf ein Agent anfassen? Wo muss eine menschliche Freigabe den Fluss unterbrechen? Welche Outputs werden zu Trainingsdaten für den nächsten Lauf?

Das Playbook nennt auch die praktischen Primitive: Claude Cowork für Wissensarbeiter, Claude Code für Engineering-Teams, MCP zur Anbindung externer Systeme, Plugins für gebündelte Team-Fähigkeiten und Skills für wiederholbare Workflows. Die Model-Context-Protocol-Dokumentation beschreibt MCP als offenen Standard zur Verbindung von KI-Anwendungen mit Datenquellen, Tools und Workflows. Das ist kein Nice-to-have. So hört Agentenarbeit auf, im Chatfenster gefangen zu sein.

McKinseys 2025-State-of-AI-Umfrage stützt dieselbe Richtung: 88 Prozent der Befragten sagten, ihre Organisationen nutzen regelmäßig KI in mindestens einer Geschäftsfunktion, aber nur etwa ein Drittel berichtet, KI-Programme organisationsweit skaliert zu haben, und 23 Prozent berichten, ein agentisches KI-System irgendwo im Unternehmen skaliert zu haben. Die Verbreitung ist breit; echte Agentenskalierung steht noch am Anfang.

Was lässt das Anthropic-Playbook für Implementierungsteams offen?

Anthropic kann die Plattform-Richtung glaubwürdig beschreiben. Es kann die unordentlichen Implementierungsentscheidungen in Ihrem Unternehmen nicht vollständig beschreiben, denn diese hängen von Ihrem Risikomodell, Ihrer Datenlandschaft, Ihrer politischen Realität, Ihrem Betriebsrhythmus und Ihrem Appetit auf Delegation ab.

Die fehlende Schicht ist nicht "welches Modell sollen wir nutzen?". Sie ist "was darf die Enterprise-Agentenflotte am Montagmorgen tun?"

Diese Schicht hat fünf Teile.

Erstens muss die Arbeit in agentengroße Jobs zerlegt werden. Ein Legal-Review-Agent, Renewal-Pack-Agent, Sales-Research-Agent, Support-Triage-Agent und Finance-Reconciliation-Agent sollten sich keinen riesigen Prompt teilen. Sie brauchen getrennte Scopes, getrennte Tools, getrennte Gedächtnisse und getrennte Freigaberegeln.

Zweitens muss institutionelles Urteilsvermögen portabel werden. Hier zählen institutionelle Skills. Ein Skill sollte Ausführungsverfahren, Referenzdateien, Beispiele, Edge Cases und deterministische Skripte enthalten, die einen Workflow wiederholbar machen. Das Ziel ist nicht ein cleverer Prompt. Das Ziel ist, dass ein neues Teammitglied, eine geplante Routine oder ein paralleler Agent dieselbe Fähigkeit abrufen und denselben Standard liefern kann.

Drittens braucht jeder Agent eine Vertrauensgrenze. Einige Tools sind read-only. Manche dürfen entwerfen, aber nicht senden. Manche dürfen in einen Branch schreiben, aber nicht mergen. Manche dürfen eine Zahlungsdatei vorbereiten, aber niemals eine Zahlung ausführen. Das Berechtigungsmodell ist das Produkt.

Viertens brauchen Sie Beobachtbarkeit vor Skalierung. Logs, Transkripte, Eval-Ergebnisse, Cost-Traces, Latenz-Traces, Tool-Call-Historie und Gründe für menschliche Overrides sollten ab dem Piloten existieren, nicht erst, nachdem das Procurement danach fragt.

Fünftens braucht Gedächtnis Eigentümerschaft. Wenn niemand die Referenzdateien verantwortet, wird der Agent schlechter, sobald sich das Geschäft ändert. Wenn jede Expertenkorrektur den Skill oder die Gedächtnisschicht aktualisiert, verzinst sich das System.

Wie sieht die wirkliche Architektur einer Enterprise-KI-Agentenflotte aus?

Eine Enterprise-Agentenflotte ist ein kontrollierter Satz rollenspezifischer Agenten, geteilter Skills, freigegebener Tools, Gedächtnissysteme, Evals, Logs und menschlicher Freigabe-Gates, die abteilungsübergreifend arbeiten. Sie ist näher an einem Operations-Stack als an einem Chatbot.

Die einfachste Architektur hat sechs Schichten:

Schicht	Welche Frage sie beantwortet	Implementierungsmuster	Häufiger Fehlerfall
Interface-Schicht	Wo kommt die Arbeit an?	Claude Cowork, Slack, Teams, Discord, Web-App, E-Mail, geplante Routine, API-Trigger	Piloten leben im Chat, kommen aber nie in den Workflow
Orchestrierungs-Schicht	Wer verantwortet den nächsten Schritt?	Agent-Router, Queue, Worktree-Lane, Event-Trigger, Handoff-Regel	Agenten treten sich auf die Füße oder verdoppeln Arbeit
Skill-Schicht	Wie soll dieser Job gemacht werden?	Institutionelle Skills mit Anweisungen, Referenzen, Skripten, Beispielen und Stopp-Regeln	Prompt-Bibliotheken hängen von der nutzenden Person ab
Tool-Schicht	Was darf der Agent anfassen?	MCP-Server, Connectors, lokale Dateien, CRMs, Docs, Browser, Code-Repo, Warehouse	Tool-Berechtigungen sind zu breit oder zu unscharf
Memory-Schicht	Was soll persistieren?	Referenzdateien, gbrain-artiges Retrieval, Feedback-Logs, freigegebene Beispiele, Entscheidungsprotokolle	Der Agent lernt jede Woche dieselbe Lektion neu
Governance-Schicht	Wie weisen wir Kontrolle nach?	Logs, Freigaben, Evals, Red-Team-Cases, Cost- und Latenz-Traces, Incident-Review	Der Pilot besteht weder Security- noch Audit-Review

Hier unterscheidet sich AI-Heroes-Arbeit oft von generischer KI-Beratung. Wir versuchen nicht, einen schönen Demo-Agenten zu bauen. Wir versuchen, die langweiligen Teile explizit zu machen: die Queue, den Hook, den Worktree, die Review-Lane, die Referenzdatei, die Eskalationsregel, das Failed-Run-Ledger. Genau das verhindert, dass der zehnte Agent die Arbeit des neunten korrumpiert.

Single-Agent vs Multi-Agent vs Agentenflotte: was passt im Unternehmen?

Die meisten Unternehmen sollten mit Single-Agents starten, nur dann zu Multi-Agent-Workflows wechseln, wenn Zerlegung echten Mehrwert schafft, und Flotten-Architektur für wiederholbare Arbeit reservieren, die Teams kreuzt oder nach Zeitplan läuft.

Muster	Typischer Use Case	Erforderliche Infrastruktur	Erforderliche Beobachtbarkeit	Governance-Last	Fehlerfall	AI-Heroes-Musterreferenz
Single-Agent	Renewal-Summary entwerfen, Support-Tickets klassifizieren, Meeting-Brief vorbereiten	Ein Skill, ein Tool-Set, ein Freigabepfad	Transkript- und Output-Review	Niedrig bis mittel	Der Agent wird zum persönlichen Assistenten statt zur wiederverwendbaren Fähigkeit	Skills und Referenzdateien
Multi-Agent-Workflow	Recherche, Entwurf, Review und Veröffentlichung einer Kampagne oder Code-Änderung	Router, Handoffs, Rollen-Prompts, geteilter Kontext	Pro-Agent-Logs plus Handoff-Trace	Mittel	Agenten widersprechen sich still oder überschreiben sich	Parallele Worktree-Orchestrierung
Agentenflotte	Operations auf Abteilungs- oder Unternehmensebene über Sales, Legal, Finance, Product, Support und Engineering	Gateway, Queues, Zeitpläne, MCP/Connectors, Memory, Evals, Kostenkontrollen	Zentrale Event-Logs, Eval-Dashboards, Incident-Review, Nutzungsanalysen	Hoch	Shadow-Automation breitet sich aus, bevor Kontrolle existiert	OpenClaw-artiger Flottenbetrieb

Die Entscheidung ist nicht ideologisch. Single-Agents werden unterschätzt, wenn die Arbeit eng begrenzt ist. Multi-Agent-Systeme werden überschätzt, wenn der Handoff mehr Koordinationskosten als Wert erzeugt. Flotten sind unvermeidlich, wenn Agenten Teil des Betriebsrhythmus eines 1.000-Personen-Unternehmens werden.

Wie scaffolde ich institutionelle Agent-Skills für ein Unternehmen?

Ein institutioneller Skill ist ein Workflow, den die Organisation verantwortet. Er ist nicht nur ein gespeicherter Prompt und nicht nur ein Vendor-Feature. Er ist die kodierte Version der Art, wie ein Team Arbeit erledigt haben will.

In der Praxis sollte der Skill sechs Assets enthalten.

Erstes Asset: das Operating Procedure — was der Agent in welcher Reihenfolge tun soll und wo er stoppt. Zweites Asset: das Referenzpaket — Policy, Brand Voice, Produkttaxonomie, Vertragsklauseln, Pricing-Regeln, Reporting-Standards oder Beispiele freigegebener Arbeit. Drittes Asset: der Tool-Kontrakt — welche Systeme der Agent lesen, schreiben, rufen oder niemals anfassen darf. Viertes Asset: die Review-Regel — welche Outputs ausgeliefert werden dürfen, welche Freigabe brauchen und welchen Beleg die reviewende Person sieht. Fünftes Asset: das Eval-Set — bekannte Aufgaben, erwartete Outputs, Edge Cases und Regressionschecks. Sechstes Asset: der Update-Loop — wie aus Expertenkorrekturen Änderungen am Skill werden, nicht Einzelkommentare in einem Chat-Thread.

Genau deshalb sprechen wir bei Skills von institutioneller Infrastruktur. Ein Skill fängt das Urteilsvermögen hinter der Arbeit ein. Ein Plugin verpackt diesen Skill mit Connectoren und Agenten, sodass ein Team ihn wiederholt nutzen kann. Ein MCP-Server verbindet ihn mit den Systemen, in denen die Fakten liegen. Eine Gedächtnis-Schicht lässt den Skill besser werden, ohne zur Müllschublade zu verkommen.

Wenn ein Skill gut gebaut ist, fragt das Unternehmen nicht mehr "wer weiß, wie man das macht?", sondern "welche kontrollierte Fähigkeit übernimmt das?"

Welche Governance braucht ein Enterprise-Agent-Rollout wirklich?

Enterprise-Agent-Governance ist kein Policy-PDF. Sie ist ein Satz Kontrollen im Arbeitspfad. Die Kontrollen müssen für den Agenten, den Nutzer, den Manager, Security und Audit sichtbar sein.

Empfehlung aus Anthropics Playbook	Was in der Praxis passiert	AI-Heroes-Verfeinerung
Mit spezifischen Piloten und Erfolgskriterien starten	Teams wählen gute Piloten und expandieren, bevor das Kontrollmodell bereit ist	Tool-Grenze, Freigabepfad, Owner, Eval-Set und Rollback-Pfad vor dem Piloten definieren
Organisationswissen in Plugins und Skills kodieren	Die erste Version fängt das Tacit Knowledge einer Expertin ein, aber niemand verantwortet Pflege	Jedem Skill Owner, Changelog, Referenzdatei-Review-Zyklus und Regressions-Eval zuweisen
MCP und Connectors zu Business-Systemen nutzen	Teams verbinden nützliche Tools und merken, dass Permissions nicht sauber auf Agentenaktionen mappen	Read-, Draft-, Write-, Send- und Delete-Berechtigungen in separate Capabilities zerlegen
Menschen bei sensibler Arbeit im Loop halten	Review wird zur vagen Zusage statt zur blockierenden Kontrolle	Freigabe als Tool-State-Übergang umsetzen: Entwurf vorbereitet, Beleg angehängt, menschlich freigegeben, Aktion ausgeführt
Adoption und Wirkung messen	Dashboards zählen Nutzung, aber nicht, ob die Arbeit besser wurde	Cycle Time, Accepted-Output-Rate, Override-Gründe, Incident-Rate, Kosten je abgeschlossenem Workflow und Bewegung in Geschäftsmetriken tracken

Die unbequeme Wahrheit: Governance verlangsamt die ersten zwei Wochen und beschleunigt die nächsten sechs Monate. Ohne sie verhandelt jeder neue Use Case Security, Permissions und Qualität neu. Mit ihr erbt das nächste Team ein Muster, das Kontakt mit Legal, Finance und IT bereits überlebt hat.

Wie misst man ROI bei einem Enterprise-Agent-Programm?

Messen Sie Agent-ROI zuerst auf Workflow-Ebene, dann auf Unternehmensebene. Eine unternehmensweite "KI-Produktivitätszahl" ist meist zu weich, um die Implementierung zu steuern. Ein Workflow-Level-Scorecard sagt Ihnen, ob ein konkreter Agent es verdient zu skalieren.

Starten Sie mit fünf Messgrößen.

Cycle-Time-Kompression zeigt, ob die Arbeit schneller wurde. Die Accepted-Output-Rate zeigt, ob Menschen dem Ergebnis genug vertrauen, um es zu verwenden. Human-Review-Time zeigt, ob der Agent Expertenlast reduziert oder lediglich Editierarbeit schafft. Kosten je abgeschlossenem Workflow halten Modell-, Tool- und Orchestrierungskosten ehrlich. Geschäftsbewegung verbindet den Agenten mit Umsatz, Marge, Risikoreduktion, Kundenzufriedenheit oder Produktgeschwindigkeit.

Ergänzen Sie dann drei Governance-Messgrößen: Incident-Rate, Override-Gründe und Stale-Reference-Alter. Das sind die Metriken, die Ihnen sagen, ob der Agent kontrollierbar bleibt, je mehr Menschen ihn nutzen.

Die stärksten ROI-Fälle sind selten reine Personalabbau-Geschichten. Es sind Kapazitätsgeschichten. Das Legal-Team bearbeitet mehr Verträge, ohne Review-Qualität zu senken. Das Support-Team löst mehr Fälle, ohne Mitarbeiter zu verbrennen. Das Produktteam liefert mehr forschungsgetriebene Entscheidungen, weil die Recherche immer läuft. Das Sales-Team verbringt weniger Zeit damit, Account-Kontext zu sammeln, und mehr Zeit im Gespräch.

Wie sollte ein 1.000-Personen-Unternehmen Claude-Agenten 2026 ausrollen?

Ein 1.000-Personen-Unternehmen sollte Enterprise-Agenten in vier Phasen ausrollen: zwei Workflow-Piloten wählen, den siegreichen Piloten in einen kontrollierten Skill verwandeln, ihn als wiederverwendbares Plugin oder interne Fähigkeit verpacken und dann über ein kontrolliertes Flottenmodell ausweiten.

In Monat eins wählen Sie Workflows, deren Schmerz offensichtlich und deren Ziel messbar ist. Gute Kandidaten sind Renewal-Summaries, First-Pass-Vertragsreview, Support-Triage, Sales-Account-Recherche, Finance-Abweichungsnotizen, Engineering-Backlog-Hygiene oder regulierte Dokumentenmontage. Schlechte Kandidaten sind vage Mandate wie "Marketing produktiver machen".

In Monat zwei bauen Sie den Skill richtig. Inklusive Referenzdateien, Tool-Grenze, Eval-Set, Freigabepfad, Logs und Owner. Behandeln Sie das als Produktionsprototypen, nicht als Demo.

In Monat drei und vier verpacken Sie den siegreichen Workflow zur Wiederverwendung. Wenn Claude Cowork die Oberfläche ist, bedeutet das meist Plugins und Connectors. Wenn der Workflow außerhalb von Cowork läuft, kann es ein interner Agent-Runner, OpenClaw-artige Orchestrierung, geplante Routines oder ein MCP-basierter Service sein. Der exakte Stack ist weniger wichtig als das Kontrollmodell.

In Monat fünf und sechs erweitern Sie von einem Workflow auf eine kleine Flotte. Nehmen Sie benachbarte Abteilungen erst dazu, wenn der erste Workflow Belege liefert: Accepted-Output-Rate, Cycle-Time-Reduktion, niedrige Incident-Rate und klarer Owner. Genau hier beginnt die Organisation zu verzinsen. Der zweite Skill borgt sich das Governance-Muster des ersten. Der dritte borgt sich das Eval-Harness. Der vierte borgt sich die Memory-Disziplin.

So wird aus Anthropics Enterprise-Playbook ein echtes Betriebssystem. Das Modell liefert die Argumentation. Das Unternehmen liefert das Urteil. Die Implementierungsschicht macht dieses Urteil wiederverwendbar.

Weiterführende Artikel zur Enterprise-Agent-Implementierung

Der Agent für genau diese Aufgabe

No. 13

Est. 2026

Richard

Forward Deployment

Richard

A forward-deployed AI agent that gets your software live and adopted inside every customer.

Richard kennenlernen

Häufig gestellte Fragen

KI-Agenten Claude Enterprise-KI MCP Agent-Workflows OpenClaw

Marco Lobo

Founder, AI Heroes

Ich baue KI-Unternehmen und die Systeme dahinter. Bei AI Heroes geben wir Unternehmen die funktionale Kapazität, zu wachsen — ohne den Headcount-Zuwachs, den Wachstum normalerweise verlangt: Vertrieb, der nachfasst, Marketing, das läuft, Content, der versendet wird, Operations, die sich selbst regelt. Wir auditieren, wo Sie Wachstum liegen lassen, bauen das Team, das es einsammelt, und übergeben es vollständig.

Ich habe das in Skalierung gemacht. Product und GTM bei SlideSpeak AI (1M+ monatliche Nutzer, profitabel, bootstrapped). CPO bei Disperse — der KI-Bauplattform, die von 3 auf 200+ Personen mit $35M Funding gewachsen ist. Mitgründer von LOBOMAR, einem Luxus-Fashion-Label, das in Elle, Cosmopolitan und der LA Times erschienen ist, mit Shows im London Design Museum, Wereldmuseum und auf der Amsterdam Fashion Week.

LinkedIn X / Twitter

So funktionieren Claude Managed Agents wirklich: Dreaming, Outcomes, Multiagent-Orchestrierung und Webhooks (2026)

Anthropic hat Claude Managed Agents bei Code w/ Claude vier neue Mechaniken gegeben: Dreaming, Outcomes, Multiagent-Orchestrierung und Webhooks. Die eine, die verändert, wie man baut, ist Outcomes — ein separater Grader, der den Agenten so lange schleifen lässt, bis eine Rubrik erfüllt ist. So funktioniert jede einzelne, und wann man sie einsetzt.

Marco Lobo·25. Mai 2026·9 Min. Lesezeit

Handgezeichnetes editoriales Diagramm zum Start mit Claude Cowork: ein zentraler Claude-Cowork-Hub von Anthropic, darüber drei Aufgabenformen — One-off Dispatch, Scheduled und Live Artifact — gespeist von einem Aufgaben-Inbox-Stapel sowie Slack-, Gmail- und Google-Connectoren.

KI-GuidesClaude CoworkAnthropic

So starten Sie mit Claude Cowork: Ein Entscheidungsrahmen für Wissensarbeitende (2026)

Claude Cowork ist der Ort, an dem Sie eine ganze Aufgabe delegieren, statt eine Frage zu stellen — Dateien und Apps zeigen, das Ergebnis beschreiben, fertige Arbeit zurückbekommen. Der schwierige Teil ist nicht der Prompt, sondern zu wissen, welche Aufgaben Sie übergeben sollten. Hier sind ein 5-Signal-Fit-Test, die drei Formen einer Cowork-Aufgabe und der Weg zum ersten Deliverable in zehn Minuten.

Marco Lobo·4. Juni 2026·9 Min. Lesezeit

Handgezeichnete Editorial-Illustration: Ein fähiger Claude-Agent mit lesbarer Anthropic-Wortmarke und Symbol stemmt sich gegen schwere Gerüststangen, Seile und angeschraubte Schutzgeländer mit den Labels „orchestration", „tool wrappers" und „fat system prompt"; daneben ein leichterer, sauberer Rahmen mit dem Label „boundaries that matter"; ruhiger cremefarbener Hintergrund, Stift-und-Aquarell-Stil

KI-EngineeringAgenten-HarnessHarness Debt

Harness Debt: Ihr KI-Agenten-Gerüst arbeitet still gegen das Modell (2026)

Ihr KI-Agent ist wahrscheinlich schlechter als das Modell darin — und die Lücke ist Ihr eigenes Gerüst. Ein experimentelles Harness erzielte mit demselben Modell mehr als das Doppelte von Anthropics Standard-Harness. Die Lösung ist kein größeres Framework, sondern das Löschen von Annahmen, die am Tag des Claude-Opus-4.6-Release veraltet waren.

Marco Lobo·23. Mai 2026·11 Min. Lesezeit

KI-Agenten im Unternehmen bauen: Implementierungsmuster für 2026

Wie rahmt Anthropic den Bau von KI-Agenten im Unternehmen?

Was lässt das Anthropic-Playbook für Implementierungsteams offen?

Wie sieht die wirkliche Architektur einer Enterprise-KI-Agentenflotte aus?

Single-Agent vs Multi-Agent vs Agentenflotte: was passt im Unternehmen?

Wie scaffolde ich institutionelle Agent-Skills für ein Unternehmen?

Welche Governance braucht ein Enterprise-Agent-Rollout wirklich?

Wie misst man ROI bei einem Enterprise-Agent-Programm?

Wie sollte ein 1.000-Personen-Unternehmen Claude-Agenten 2026 ausrollen?

Weiterführende Artikel zur Enterprise-Agent-Implementierung

Der Agent für genau diese Aufgabe

Richard

Häufig gestellte Fragen

Ähnliche Artikel

So funktionieren Claude Managed Agents wirklich: Dreaming, Outcomes, Multiagent-Orchestrierung und Webhooks (2026)

So starten Sie mit Claude Cowork: Ein Entscheidungsrahmen für Wissensarbeitende (2026)

Harness Debt: Ihr KI-Agenten-Gerüst arbeitet still gegen das Modell (2026)