Si tratta dell'app Windows denominata Synthetic Data Kit, la cui ultima versione può essere scaricata come synthetic-data-kitsourcecode.tar.gz. Può essere eseguita online sul provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online gratuitamente questa app denominata Synthetic Data Kit con OnWorks.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avvia qualsiasi emulatore online OS OnWorks da questo sito Web, ma migliore emulatore online Windows.
- 5. Dal sistema operativo OnWorks Windows che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione e installala.
- 7. Scarica Wine dai repository software delle tue distribuzioni Linux. Una volta installato, puoi quindi fare doppio clic sull'app per eseguirli con Wine. Puoi anche provare PlayOnLinux, un'interfaccia fantasiosa su Wine che ti aiuterà a installare programmi e giochi Windows popolari.
Wine è un modo per eseguire il software Windows su Linux, ma senza Windows richiesto. Wine è un livello di compatibilità Windows open source in grado di eseguire programmi Windows direttamente su qualsiasi desktop Linux. Essenzialmente, Wine sta cercando di re-implementare abbastanza Windows da zero in modo che possa eseguire tutte quelle applicazioni Windows senza effettivamente bisogno di Windows.
IMMAGINI:
Kit di dati sintetici
DESCRIZIONE:
Synthetic Data Kit è un toolkit incentrato sulla CLI per la generazione di set di dati sintetici di alta qualità per l'ottimizzazione dei modelli Llama, con particolare attenzione alla produzione di tracce di ragionamento e coppie di controllo qualità in linea con i moderni formati di ottimizzazione delle istruzioni. Offre un flusso di lavoro modulare e personalizzato che comprende l'acquisizione di fonti eterogenee (documenti, trascrizioni), la richiesta ai modelli di creare esempi etichettati e l'esportazione in schemi di ottimizzazione con un codice di colla minimo. L'obiettivo di progettazione del kit è quello di ridurre il collo di bottiglia della "preparazione dei dati" trasformando la creazione del set di dati in una pipeline ripetibile anziché in notebook ad hoc. Supporta la generazione di varianti di ragionamento/catena di pensiero, campionamento configurabile e guardrail in modo che gli output soddisfino i vincoli di formato e i controlli di qualità. Esempi e guide mostrano come indirizzare comportamenti specifici per attività come l'uso di strumenti o il ragionamento passo passo, per poi salvarli direttamente in file pronti per l'addestramento.
Caratteristiche
- Pipeline CLI a quattro fasi dall'acquisizione all'esportazione
- Generazione di coppie QA e tracce di ragionamento
- Prompt, campionamento e filtri configurabili
- Formati di output pronti per la formazione per la messa a punto
- Controlli di qualità e convalida dello schema
- Esempi mirati al ragionamento specifico dell'attività
Linguaggio di programmazione
Python
Categorie
Questa applicazione può essere scaricata anche da https://sourceforge.net/projects/synthetic-data-kit.mirror/. È ospitata su OnWorks per poter essere eseguita online nel modo più semplice da uno dei nostri sistemi operativi gratuiti.