Kostenlos & Open Source

Auto Skill Improver für Claude Cowork — Benchmark-gesteuerte Skill-Optimierung

Teste und verbessere deine Cowork-Skill-Dateien, Team-Workflows und Projektanweisungen mit empirischer Messung. Inspiriert von Karpathys Autoresearch.

So funktioniert es mit Cowork

  1. 1Klassifizieren — das Tool erkennt deinen Cowork-Skill-Typ (Team-Workflow, Projektassistent, Reviewer etc.)
  2. 2Benchmarken — es erstellt eine Testsuite, die deine Cowork-Anweisungen gegen reale Team-Szenarien testet
  3. 3Mutieren — eine Anweisungsänderung nach der anderen, jede gegen den Benchmark getestet
  4. 4Behalten oder verwerfen — nur Mutationen, die Cowork-Output messbar verbessern, überleben

Guide-Datei herunterladen

E-Mail eingeben, um herunterzuladen auto-skill-improver-cowork-quickstart.md und Zugang zum GitHub-Repository zu erhalten.

Kein Spam, niemals. Deine E-Mail wird sicher gespeichert, damit wir dir Updates zu neuen Anwendungsfällen und Workflows senden können.

Schritt für Schritt: Auto Skill Improver in Cowork einrichten

1

Quickstart-Datei herunterladen

Gib deine E-Mail im Formular oben ein, um die Cowork Quickstart-Datei herunterzuladen.

2

Dein Claude Cowork Projekt öffnen

Navigiere zum Projekt, in dem du einen Skill verbessern möchtest.

3

Datei in das Projekt hochladen

Cowork liest die Anweisungen und klont das Repository automatisch.

4

Auf deine Projekt-Skill-Datei oder Workflow-Anweisungen richten

Das Tool zielt auf deine Skill-Datei und beginnt mit der Einrichtung.

5

Baseline-Score prüfen, Mutationen durchführen

Verbesserungen genehmigen, Rückschritte verwerfen — nur Fortschritte werden behalten.

6

Verbesserten Skill zurück in dein Projekt exportieren

Sobald der Benchmark saturiert, ist deine optimierte Skill-Datei einsatzbereit.

Warum die meiste Cowork Skill-Iteration scheitert

Du aktualisierst deine Cowork-Skill-Datei. Die Anweisungen klingen präziser. Du deployest sie. Aber die tatsächliche Team-Erfahrung hat sich nicht messbar verbessert. Die meiste Skill-Bearbeitung ist redaktionell — Umschreiben basierend auf Intuition statt Evidenz.

Skill-Gefühl

  • Skill-Anweisungen umformulieren, hoffen dass Cowork besser für das Team funktioniert
  • Keine Baseline — keine Möglichkeit zu wissen, ob die Team-Erfahrung sich verbessert hat
  • Mehrere Anweisungsänderungen gleichzeitig verbergen, was tatsächlich geholfen hat
  • Subjektive Bewertung: 'die Antworten fühlen sich hilfreicher an'

Skill-Wissenschaft

  • Messbare Baseline vor jeder Skill-Datei-Änderung etablieren
  • Eine Anweisung nach der anderen mutieren
  • Den gleichen Benchmark vorher und nachher durchführen
  • Nur behalten, was höher punktet — den Rest verwerfen

Was es in Cowork Skills findet

Das Tool deckt strukturelle Probleme in deinen Cowork-Skill-Dateien auf, die beim manuellen Editing unsichtbar sind — Probleme, die teamorientierte Leistung still verschlechtern.

📝

Unklare Output-Verträge

Vage Erfolgskriterien, die Cowork erlauben, inkonsistente Antworten für Teammitglieder zu produzieren.

🔄

Fehlendes Fallback-Verhalten

Kein definierter Wiederherstellungspfad, wenn ein Tool-Aufruf fehlschlägt im Team-Kontext.

Widersprüchliche Instruktionsebenen

Widersprüchliche Anweisungen verteilt über System-Prompts, Skill-Dateien und Projektkonfigurationen.

🔗

Abhängigkeits- & Portabilitätsprobleme

Hart codierte Pfade, fehlender Kontext oder Annahmen, die in verschiedenen Team-Umgebungen brechen.

📊

Schwache Evidenzdisziplin

Behauptungen ohne Belege, Aussagen ohne Daten, Entscheidungen ohne Argumentationsketten.

🏗️

Strukturelle Formatierungsprobleme

Inkonsistente Überschriftenebenen, fehlerhaftes Markdown oder Ausgaben, die nicht dem Format entsprechen.

Die Karpathy-inspirierte Methode

Andrej Karpathys Autoresearch wendet Messdisziplin auf Forschungsiteration an. Auto Skill Improver wendet das gleiche Prinzip auf Cowork Skill-Engineering an — eine kontrollierte Schleife, in der jede Skill-Datei-Änderung rechenschaftspflichtig ist.

1

Skill-Typ klassifizieren

Das Tool analysiert deine Cowork-Skill-Datei und bestimmt ihre Kategorie — Team-Assistent, Projekt-Orchestrator, Code-Reviewer oder anderes.

2

Einen echten Benchmark erstellen

Kein Gefühls-Check. Eine strukturierte Testsuite mit Bestanden/Nicht-bestanden-Kriterien, die deine Cowork-Anweisungen gegen repräsentative Team-Szenarien testet.

3

Baseline etablieren

Den Benchmark auf der unveränderten Skill-Datei ausführen. Den Score aufzeichnen. Das ist dein Vergleichspunkt.

4

Eine Sache nach der anderen mutieren

Eine einzelne Anweisung ändern, eine Einschränkung hinzufügen, eine Mehrdeutigkeit entfernen. Nie mehrere Skill-Direktiven gleichzeitig ändern.

5

Nur behalten, was verbessert

Den Benchmark nach jeder Mutation erneut ausführen. Wenn der Score steigt, bleibt die Änderung. Wenn nicht — wird sie verworfen.

6

Aufhören wenn der Benchmark saturiert

Wenn aufeinanderfolgende Mutationen keine Verbesserungen mehr bringen, hat deine Skill-Datei ihre aktuelle Obergrenze erreicht.

Wann verwenden — und wann nicht

Ideal für

  • Cowork-Skill-Dateien, die teamorientiertes Verhalten definieren
  • Projektanweisungen für Team-Workflows
  • Cowork-Konfigurationen, die messbare Verbesserung brauchen
  • Jedes Cowork-Setup, bei dem du Belege brauchst, dass Änderungen dem Team helfen

Nicht die richtige Wahl

  • Einmal-Prompts, die du einmal verwendest und verwirfst
  • Kreative Aufgaben ohne objektive Erfolgsmetrik
  • Skills, die bereits an der Leistungsgrenze sind
  • Situationen, in denen du nicht definieren kannst, was 'besser' für das Team bedeutet

Häufig gestellte Fragen

Auto Skill Improver für Claude Cowork ist ein Open-Source-Tool, das benchmark-gesteuerte Iteration auf deine Cowork-Skill-Dateien und Projektanweisungen anwendet. Es klassifiziert deinen Skill-Typ, erstellt eine Testsuite und mutiert systematisch eine Anweisung nach der anderen.

Es behandelt deine Cowork-Skill-Datei als testbares Artefakt. Das Tool generiert Team-Szenarien, misst Coworks Output-Qualität und nimmt gezielte Änderungen vor — eine nach der anderen.

Aufhören zu raten. Anfangen zu messen.

Lade den Quickstart-Leitfaden herunter, klone das Repo und führe deine erste Cowork benchmark-gesteuerte Verbesserungsschleife in unter 10 Minuten durch.