madeometer

Made O'Meter

Discover where a brand or product originates

Boswell Test / Botwell AI Framework

ownerAlan Wilhelm (Open Source) (USA)
originUnited States
manufacturedVereinigte Staaten

Der Boswell Test ist ein innovatives automatisiertes Framework, das für die vergleichende Analyse von großen Sprachmodellen (LLMs) konzipiert wurde. Entwickelt von Dr. Peter Luh und als 'botwell' Softwareprojekt von dem unabhängigen Entwickler Alan Wilhelm umgesetzt, nutzt das Tool eine Peer-Review-Methodik. In diesem System erstellen mehrere KI-Modelle Aufsätze zu spezifischen Themen und bewerten dann die Arbeiten der anderen, um die relative Leistung, Bewertungsbias und einen allgemeinen 'Boswell Quotienten' zu bestimmen.

Als Open-Source-Softwareprojekt erfolgt seine 'Herstellung' oder Entwicklung hauptsächlich durch Beiträge der Community und individuelle Wartung auf Plattformen wie GitHub. Das Framework ist darauf ausgelegt, mit verschiedenen KI-Anbietern, wie OpenRouter, zu interagieren, um Tests über eine Vielzahl von Modellen, einschließlich GPT, Claude und Llama, durchzuführen. Es dient als multidimensionale Alternative zu traditionellen statischen Benchmarks, indem es die analytischen Fähigkeiten der KI-Modelle selbst nutzt.

disclaimer

poweredBy