Descarga del kit de datos sintéticos para Linux

Esta es la aplicación para Linux llamada Synthetic Data Kit, cuya última versión se puede descargar como synthetic-data-kitsourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.

 
 

Descargue y ejecute en línea esta aplicación llamada Synthetic Data Kit con OnWorks de forma gratuita.

Siga estas instrucciones para ejecutar esta aplicación:

- 1. Descargue esta aplicación en su PC.

- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.

- 3. Cargue esta aplicación en dicho administrador de archivos.

- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.

- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.

- 6. Descarga la aplicación, instálala y ejecútala.

CAPTURAS DE PANTALLA:


Kit de datos sintéticos


DESCRIPCIÓN:

Synthetic Data Kit es un kit de herramientas basado en CLI que permite generar conjuntos de datos sintéticos de alta calidad para optimizar los modelos Llama, con énfasis en la producción de trazas de razonamiento y pares de control de calidad compatibles con los formatos modernos de optimización de instrucciones. Ofrece un flujo de trabajo modular y conciso que abarca la ingesta de fuentes heterogéneas (documentos, transcripciones), la creación de ejemplos etiquetados por parte de los modelos y la exportación a esquemas de optimización con un mínimo código de enlace. El objetivo del kit es reducir el cuello de botella de la preparación de datos, convirtiendo la creación de conjuntos de datos en una secuencia repetible en lugar de cuadernos ad hoc. Admite la generación de variantes de razonamiento/cadena de pensamiento, muestreo configurable y barandillas para que los resultados cumplan con las restricciones de formato y los controles de calidad. Los ejemplos y las guías muestran cómo optimizar comportamientos específicos de cada tarea, como el uso de herramientas o el razonamiento paso a paso, para luego guardarlos directamente en archivos listos para el entrenamiento.



Caracteristicas

  • Canalización CLI de cuatro etapas desde la ingesta hasta la exportación
  • Generación de pares de control de calidad y trazas de razonamiento
  • Indicaciones, muestreos y filtros configurables
  • Formatos de salida listos para entrenamiento para ajustes finos
  • Controles de calidad y validación de esquemas
  • Ejemplos que se centran en el razonamiento específico de la tarea


Lenguaje de programación

Python


Categorías

Generación de datos sintéticos

Esta aplicación también se puede obtener de https://sourceforge.net/projects/synthetic-data-kit.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.



Últimos programas en línea de Linux y Windows


Categorías para descargar Software y Programas para Windows y Linux