Benchmark

1 Artikel

Foto einer britischen Sun-Zeitung auf einem Schreibtisch — Masthead THE SUN, rot-schwarze Schlagzeile TAN vs CLAW, Deck Silicon Valley benchmark BLOODBATH, geteiltes Pressefoto von Garry Tan und dem OpenClaw-Hummer-Maskottchen im Duell, gelber EXCLUSIVE-Sticker, unten irrelevante Tabloid-Teaser, echter Schreibtischkontext mit Bacon-Sandwich und Teering
KI-EngineeringAgentengedächtnisRetrieval

Wir haben Garry Tans gbrain gegen unser eigenes Agentengedächtnis getestet: 150 echte Fragen (Mai 2026)

Ein apples-to-apples Retrieval-Benchmark mit 352 Dateien und 150 Fragen zwischen gbrain und unserem bestehenden OpenClaw-qmd-Setup. gbrain gewinnt 8.3x häufiger bei harten, Cross-Source- und Diskriminierungsfragen, aber die Kernaussage ist weniger eindeutig als das Marketing.

Marco Lobo
Marco Lobo·5. Mai 2026·17 Min. Lesezeit