Esta es la aplicación para Linux llamada optillm, cuya última versión se puede descargar como v0.2.8sourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada optillm con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
SCREENSHOTS
Ad
optillm
DESCRIPCIÓN
OptiLLM es un proxy de inferencia optimizado para Modelos de Lenguaje Grandes (LLM) que implementa técnicas de vanguardia para mejorar el rendimiento y la eficiencia. Funciona como un proxy compatible con la API de OpenAI, lo que permite una integración fluida en los flujos de trabajo existentes a la vez que optimiza los procesos de inferencia. OptiLLM busca reducir la latencia y el consumo de recursos durante la inferencia de LLM.
Caracteristicas
- Optimización del proxy de inferencia para LLM
- Implementa técnicas de optimización de última generación
- Compatible con la API de OpenAI
- Reduce la latencia de inferencia
- Disminuye el consumo de recursos
- Integración perfecta en flujos de trabajo existentes
- Admite varias arquitecturas LLM
- Proyecto de código abierto
- Contribuciones activas de la comunidad
Lenguaje de programación
Python
Categorías
Esta aplicación también se puede descargar desde https://sourceforge.net/projects/optillm.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.