MCP

3 Artikel

Editorial-Schema in Feder und Aquarell von einem Claude-Managed-Agents-System: ein Lead-Agent mit dem Claude-Schriftzug, der an Spezialisten-Subagenten auf einem gemeinsamen Dateisystem delegiert, mit einem separaten Grader, der die Ausgabe gegen eine Rubrik prüft, und einer Dreaming-Memory-Schleife
Claude Launch-AnalyseClaudeAnthropic

So funktionieren Claude Managed Agents wirklich: Dreaming, Outcomes, Multiagent-Orchestrierung und Webhooks (2026)

Anthropic hat Claude Managed Agents bei Code w/ Claude vier neue Mechaniken gegeben: Dreaming, Outcomes, Multiagent-Orchestrierung und Webhooks. Die eine, die verändert, wie man baut, ist Outcomes — ein separater Grader, der den Agenten so lange schleifen lässt, bis eine Rubrik erfüllt ist. So funktioniert jede einzelne, und wann man sie einsetzt.

Marco Lobo
Marco Lobo·25. Mai 2026·9 Min. Lesezeit
Handdrawn editorial diagram of the Generator-Evaluator harness pattern — a three-agent triangle with a Planner agent expanding a 1-4 sentence prompt into a product spec, a Generator agent building feature-by-feature using a React + Vite + FastAPI + SQLite stack, and an Evaluator agent using Playwright MCP to navigate the live app and grade against design quality, originality, craft, and functionality criteria; file-based handoff arrows between the three agents; by Anthropic Labs wordmark top-right, Claude Agent SDK badge bottom-right
AI EngineeringClaude Agent SDKAnthropic

Harness Design for Long-Running AI Applications: Inside Anthropic's Generator-Evaluator Pattern (Claude Agent SDK, 2026)

On 24 March 2026 Anthropic Labs engineer Prithvi Rajasekaran published the most rigorous public account to date of how Anthropic designs harnesses for long-running AI applications — a GAN-inspired generator-evaluator pattern applied across two unusually different domains: frontend design (subjective, no binary verification) and full-stack coding (objective, machine-verifiable). The piece evolves the November 2025 Initializer + Coding Agent baseline into a three-agent planner + generator + evaluator architecture, with concrete cost-and-duration data ($200 / 6h on a retro game maker test, then $124 / 4h on a more ambitious DAW after the Opus 4.6 simplification pass). Inside the pattern, the two failure modes it fixes (context anxiety + self-evaluation bias), how it compares to LangGraph / AutoGen / OpenAI Assistants v2 / Devin, when it doesn't fit, and the canonical principle every team operating a harness should adopt: stress-test every component against the current model.

Marco Lobo
Marco Lobo·22. Mai 2026·13 Min. Lesezeit
Handgezeichnetes Enterprise-KI-Agentenflotten-Diagramm mit Rollen-Agenten, verbunden mit Abteilungen, Systemen, Memory- und Governance-Schichten
KI-GuidesKI-AgentenClaude

KI-Agenten im Unternehmen bauen: Implementierungsmuster für 2026

Anthropics Playbook hat die Enterprise-Form richtig benannt. Was fehlt, ist die Implementierungsschicht: kontrollierte Skills, MCP-Tools, Gedächtnis, Beobachtbarkeit, Worktree-sichere Orchestrierung und Agent-Flotten, die den Kontakt mit einem Unternehmen mit 1.000 Personen überleben.

Marco Lobo
Marco Lobo·19. Mai 2026·11 Min. Lesezeit