Esta es la aplicación para Linux llamada Opik, cuya última versión se puede descargar como 1.8.60sourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Opik con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
SCREENSHOTS
Ad
vigilante
DESCRIPCIÓN
Evalúe, pruebe y monitoree aplicaciones LLM con confianza. Opik es una plataforma de código abierto para evaluar, probar y monitorizar aplicaciones LLM. Desarrollada por Comet. Registre, ordene, busque y comprenda cada paso que su aplicación LLM da para generar una respuesta. Anote, visualice y compare manualmente las respuestas LLM en una tabla intuitiva. Registre los seguimientos durante el desarrollo y la producción. Ejecute experimentos con diferentes indicaciones y evalúe con un conjunto de pruebas. Elija y ejecute métricas de evaluación preconfiguradas o defina las suyas propias con nuestra práctica biblioteca de SDK. Consulte los jueces LLM integrados para problemas complejos como la detección de alucinaciones, la veracidad y la moderación.
Caracteristicas
- Realizar un seguimiento de todas las llamadas y seguimientos de LLM durante el desarrollo y la producción
- Anote sus llamadas LLM registrando puntajes de retroalimentación mediante el SDK de Python o la interfaz de usuario
- Automatice el proceso de evaluación de su solicitud de LLM
- Almacenar casos de prueba y ejecutar experimentos
- Utilice el LLM de Opik como métrica de evaluación para cuestiones complejas como la detección de alucinaciones, la moderación y la evaluación de RAG.
- Ejecute evaluaciones como parte de su flujo de trabajo de CI/CD utilizando nuestra integración con PyTest
Lenguaje de programación
Java
Categorías
Esta aplicación también se puede descargar desde https://sourceforge.net/projects/opik.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.