Lunary es una plataforma de observabilidad y evaluación para aplicaciones construidas sobre modelos de lenguaje grandes (LLMs). Ayuda a los equipos de ingeniería y producto a ver cómo se comportan las funciones de IA en producción e identificar rápidamente los problemas.
Observabilidad y analítica para LLMs
Lunary recopila registros de solicitudes, salidas del modelo y métricas clave de calidad para que puedas entender qué ocurre en tus flujos de trabajo de IA.
Seguimiento del rendimiento, la fiabilidad y el coste a lo largo del tiempo
Análisis de conversaciones de usuarios con chatbots
Identificación de dónde fallan las respuestas, se desvían o no cumplen las expectativas
Gestión de prompts y experimentación
Lunary incluye herramientas para gestionar prompts como un flujo de trabajo, lo que facilita mejorar la calidad sin cambios de código improvisados.
Versionado y comparación de prompts
Pruebas A/B y evaluaciones
Iteración estructurada sobre el texto y el comportamiento de los prompts
Pensado para startups y empresa
Lunary puede usarse tanto para herramientas internas de IA como para productos orientados al cliente. Los equipos obtienen una visión más clara del comportamiento de los LLMs y de los datos para apoyar las decisiones de producto, en lugar de tratar al modelo como una caja negra.

