Made O'Meter
Discover where a brand or product originates
El Boswell Test es un innovador marco automatizado diseñado para el análisis comparativo de Modelos de Lenguaje Grande (LLMs). Concebido por el Dr. Peter Luh e implementado como el proyecto de software 'botwell' por el desarrollador independiente Alan Wilhelm, la herramienta utiliza una metodología de revisión por pares. En este sistema, múltiples modelos de IA generan ensayos sobre dominios específicos y luego evalúan el trabajo de los demás para determinar el rendimiento relativo, el sesgo de calificación y un 'Cociente Boswell' general.
Como un proyecto de software de código abierto, su 'fabricación' o desarrollo tiene lugar principalmente a través de contribuciones comunitarias y mantenimiento individual en plataformas como GitHub. El marco está diseñado para interactuar con varios proveedores de IA, como OpenRouter, para facilitar pruebas en una amplia gama de modelos, incluyendo GPT, Claude y Llama. Sirve como una alternativa multidimensional a los puntos de referencia estáticos tradicionales al aprovechar las capacidades analíticas de los propios modelos de IA.
Report a bug/Feedback
disclaimer
poweredBy