Auto Skill Improver für Claude Cowork — Benchmark-gesteuerte Skill-Optimierung
Teste und verbessere deine Cowork-Skill-Dateien, Team-Workflows und Projektanweisungen mit empirischer Messung. Inspiriert von Karpathys Autoresearch.
So funktioniert es mit Cowork
- 1Klassifizieren — das Tool erkennt deinen Cowork-Skill-Typ (Team-Workflow, Projektassistent, Reviewer etc.)
- 2Benchmarken — es erstellt eine Testsuite, die deine Cowork-Anweisungen gegen reale Team-Szenarien testet
- 3Mutieren — eine Anweisungsänderung nach der anderen, jede gegen den Benchmark getestet
- 4Behalten oder verwerfen — nur Mutationen, die Cowork-Output messbar verbessern, überleben
Guide-Datei herunterladen
E-Mail eingeben, um herunterzuladen auto-skill-improver-cowork-quickstart.md und Zugang zum GitHub-Repository zu erhalten.
Kein Spam, niemals. Deine E-Mail wird sicher gespeichert, damit wir dir Updates zu neuen Anwendungsfällen und Workflows senden können.
Schritt für Schritt: Auto Skill Improver in Cowork einrichten
Quickstart-Datei herunterladen
Gib deine E-Mail im Formular oben ein, um die Cowork Quickstart-Datei herunterzuladen.
Dein Claude Cowork Projekt öffnen
Navigiere zum Projekt, in dem du einen Skill verbessern möchtest.
Datei in das Projekt hochladen
Cowork liest die Anweisungen und klont das Repository automatisch.
Auf deine Projekt-Skill-Datei oder Workflow-Anweisungen richten
Das Tool zielt auf deine Skill-Datei und beginnt mit der Einrichtung.
Baseline-Score prüfen, Mutationen durchführen
Verbesserungen genehmigen, Rückschritte verwerfen — nur Fortschritte werden behalten.
Verbesserten Skill zurück in dein Projekt exportieren
Sobald der Benchmark saturiert, ist deine optimierte Skill-Datei einsatzbereit.
Warum die meiste Cowork Skill-Iteration scheitert
Du aktualisierst deine Cowork-Skill-Datei. Die Anweisungen klingen präziser. Du deployest sie. Aber die tatsächliche Team-Erfahrung hat sich nicht messbar verbessert. Die meiste Skill-Bearbeitung ist redaktionell — Umschreiben basierend auf Intuition statt Evidenz.
Skill-Gefühl
- ✗Skill-Anweisungen umformulieren, hoffen dass Cowork besser für das Team funktioniert
- ✗Keine Baseline — keine Möglichkeit zu wissen, ob die Team-Erfahrung sich verbessert hat
- ✗Mehrere Anweisungsänderungen gleichzeitig verbergen, was tatsächlich geholfen hat
- ✗Subjektive Bewertung: 'die Antworten fühlen sich hilfreicher an'
Skill-Wissenschaft
- ✓Messbare Baseline vor jeder Skill-Datei-Änderung etablieren
- ✓Eine Anweisung nach der anderen mutieren
- ✓Den gleichen Benchmark vorher und nachher durchführen
- ✓Nur behalten, was höher punktet — den Rest verwerfen
Was es in Cowork Skills findet
Das Tool deckt strukturelle Probleme in deinen Cowork-Skill-Dateien auf, die beim manuellen Editing unsichtbar sind — Probleme, die teamorientierte Leistung still verschlechtern.
Unklare Output-Verträge
Vage Erfolgskriterien, die Cowork erlauben, inkonsistente Antworten für Teammitglieder zu produzieren.
Fehlendes Fallback-Verhalten
Kein definierter Wiederherstellungspfad, wenn ein Tool-Aufruf fehlschlägt im Team-Kontext.
Widersprüchliche Instruktionsebenen
Widersprüchliche Anweisungen verteilt über System-Prompts, Skill-Dateien und Projektkonfigurationen.
Abhängigkeits- & Portabilitätsprobleme
Hart codierte Pfade, fehlender Kontext oder Annahmen, die in verschiedenen Team-Umgebungen brechen.
Schwache Evidenzdisziplin
Behauptungen ohne Belege, Aussagen ohne Daten, Entscheidungen ohne Argumentationsketten.
Strukturelle Formatierungsprobleme
Inkonsistente Überschriftenebenen, fehlerhaftes Markdown oder Ausgaben, die nicht dem Format entsprechen.
Die Karpathy-inspirierte Methode
Andrej Karpathys Autoresearch wendet Messdisziplin auf Forschungsiteration an. Auto Skill Improver wendet das gleiche Prinzip auf Cowork Skill-Engineering an — eine kontrollierte Schleife, in der jede Skill-Datei-Änderung rechenschaftspflichtig ist.
Skill-Typ klassifizieren
Das Tool analysiert deine Cowork-Skill-Datei und bestimmt ihre Kategorie — Team-Assistent, Projekt-Orchestrator, Code-Reviewer oder anderes.
Einen echten Benchmark erstellen
Kein Gefühls-Check. Eine strukturierte Testsuite mit Bestanden/Nicht-bestanden-Kriterien, die deine Cowork-Anweisungen gegen repräsentative Team-Szenarien testet.
Baseline etablieren
Den Benchmark auf der unveränderten Skill-Datei ausführen. Den Score aufzeichnen. Das ist dein Vergleichspunkt.
Eine Sache nach der anderen mutieren
Eine einzelne Anweisung ändern, eine Einschränkung hinzufügen, eine Mehrdeutigkeit entfernen. Nie mehrere Skill-Direktiven gleichzeitig ändern.
Nur behalten, was verbessert
Den Benchmark nach jeder Mutation erneut ausführen. Wenn der Score steigt, bleibt die Änderung. Wenn nicht — wird sie verworfen.
Aufhören wenn der Benchmark saturiert
Wenn aufeinanderfolgende Mutationen keine Verbesserungen mehr bringen, hat deine Skill-Datei ihre aktuelle Obergrenze erreicht.
Wann verwenden — und wann nicht
Ideal für
- Cowork-Skill-Dateien, die teamorientiertes Verhalten definieren
- Projektanweisungen für Team-Workflows
- Cowork-Konfigurationen, die messbare Verbesserung brauchen
- Jedes Cowork-Setup, bei dem du Belege brauchst, dass Änderungen dem Team helfen
Nicht die richtige Wahl
- —Einmal-Prompts, die du einmal verwendest und verwirfst
- —Kreative Aufgaben ohne objektive Erfolgsmetrik
- —Skills, die bereits an der Leistungsgrenze sind
- —Situationen, in denen du nicht definieren kannst, was 'besser' für das Team bedeutet
Häufig gestellte Fragen
Auto Skill Improver für Claude Cowork ist ein Open-Source-Tool, das benchmark-gesteuerte Iteration auf deine Cowork-Skill-Dateien und Projektanweisungen anwendet. Es klassifiziert deinen Skill-Typ, erstellt eine Testsuite und mutiert systematisch eine Anweisung nach der anderen.
Es behandelt deine Cowork-Skill-Datei als testbares Artefakt. Das Tool generiert Team-Szenarien, misst Coworks Output-Qualität und nimmt gezielte Änderungen vor — eine nach der anderen.
Jeden Cowork-Skill-Typ — Team-Assistenten, Projekt-Orchestratoren, Code-Reviewer, Dokumentationsgeneratoren, Onboarding-Helfer und mehr.
Ein Benchmark ist eine strukturierte Testsuite mit definierten Eingaben und Bestanden/Nicht-bestanden-Kriterien. Für einen Team-Assistenten-Skill könnte das sein: 'Genaue Antworten auf häufige Projektfragen geben'.
Absolut. Auto Skill Improver ist besonders wertvoll für geteilte Cowork-Skills, weil Verbesserungen sich über die Erfahrung jedes Teammitglieds multiplizieren.
Benchmark-Sättigung tritt auf, wenn aufeinanderfolgende Skill-Datei-Mutationen keine Score-Verbesserungen mehr produzieren. Deine Anweisungen haben die Obergrenze erreicht.
Manuelle Bearbeitung ist redaktionell: du schreibst Anweisungen um, sie klingen hilfreicher, du deployest sie. Aber 'klingt hilfreicher' ist kein Beweis. Auto Skill Improver ist empirisch.
Ja. Auto Skill Improver ist vollständig Open Source und kostenlos nutzbar. Der Quellcode ist auf GitHub unter github.com/mlobo2012/auto-skill-improver verfügbar.
Aufhören zu raten. Anfangen zu messen.
Lade den Quickstart-Leitfaden herunter, klone das Repo und führe deine erste Cowork benchmark-gesteuerte Verbesserungsschleife in unter 10 Minuten durch.