Esta es la aplicación para Linux "Siguiendo Instrucciones con Comentarios", cuya última versión se puede descargar como following-instructions-human-feedbacksourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Siguiendo instrucciones con retroalimentación con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
CAPTURAS DE PANTALLA:
Seguir instrucciones con retroalimentación
DESCRIPCIÓN:
El repositorio "siguiendo instrucciones con retroalimentación humana" contiene el código y los materiales complementarios que sustentan el trabajo de OpenAI en el entrenamiento de modelos de lenguaje (modelos InstructGPT) que siguen mejor las instrucciones del usuario mediante retroalimentación humana. El repositorio alberga la tarjeta del modelo, ejemplos de resultados de evaluación automática y las pautas de etiquetado utilizadas en el proceso. Está explícitamente vinculado al artículo "Entrenamiento de modelos de lenguaje para seguir instrucciones con retroalimentación humana" y sirve como referencia para la recopilación de pautas de anotación, la comparación de preferencias y la evaluación del comportamiento de los modelos por parte de OpenAI. El repositorio no es una implementación completa de todo el proceso de RLHF, sino un centro de archivo que respalda la investigación publicada, brindando transparencia en torno a los estándares de evaluación y etiquetado humano. Incluye directorios como "automatic-eval-samples" (ejemplos de resultados del modelo en tareas de referencia) y un archivo "model-card.md" que describe el comportamiento previsto, las limitaciones y los sesgos de los modelos InstructGPT.
Caracteristicas
- Archivo de resultados de muestra de evaluación de experimentos de InstructGPT
- model-card.md describe el uso del modelo, las limitaciones y las consideraciones de seguridad
- Pautas de etiquetado/instrucciones de anotación utilizadas para evaluadores humanos
- Carpeta estructurada "muestras de evaluación automática" que muestra los resultados de referencia y los ajustados.
- Transparencia en torno a cómo OpenAI midió la clasificación y alineación de las preferencias del modelo
- Enlaces y referencias al artículo de investigación original y documentación
Categorías
Esta aplicación también se puede descargar desde https://sourceforge.net/projects/following-inst-feedback.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.