Aceasta este aplicația Linux numită Synthetic Data Kit, a cărei ultimă versiune poate fi descărcată sub numele synthetic-data-kitsourcecode.tar.gz. Poate fi rulată online pe furnizorul de găzduire gratuită OnWorks pentru stații de lucru.
Descarcă și rulează online gratuit această aplicație numită Synthetic Data Kit cu OnWorks.
Urmați aceste instrucțiuni pentru a rula această aplicație:
- 1. Ați descărcat această aplicație pe computer.
- 2. Introduceți în managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator pe care îl doriți.
- 3. Încărcați această aplicație într-un astfel de manager de fișiere.
- 4. Porniți emulatorul online OnWorks Linux sau Windows online sau emulatorul online MACOS de pe acest site web.
- 5. Din sistemul de operare OnWorks Linux pe care tocmai l-ați pornit, accesați managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator dorit.
- 6. Descărcați aplicația, instalați-o și rulați-o.
CAPTURĂ DE ECRAN:
Kit de date sintetice
DESCRIERE:
Kitul de date sintetice este un set de instrumente centrat pe CLI pentru generarea de seturi de date sintetice de înaltă calitate pentru reglarea fină a modelelor Llama, cu accent pe producerea de urme de raționament și perechi de QA care se aliniază cu formatele moderne de reglare a instrucțiunilor. Acesta oferă un flux de lucru modular, bazat pe opinii, care acoperă ingerarea de surse eterogene (documente, transcrieri), solicitarea modelelor să creeze exemple etichetate și exportul către scheme de reglare fină cu un cod minim de adeziv. Scopul de design al kitului este de a scurta blocajul de „pregătire a datelor” prin transformarea creării setului de date într-un flux repetabil, mai degrabă decât în notebook-uri ad-hoc. Acesta acceptă generarea de variante de raționamente/lanț de gândire, eșantionare configurabilă și bariere de siguranță, astfel încât rezultatele să îndeplinească constrângerile de format și verificările de calitate. Exemplele și ghidurile arată cum să vizați comportamente specifice sarcinii, cum ar fi utilizarea instrumentelor sau raționamentul pas cu pas, apoi să salvați direct în fișiere pregătite pentru antrenament.
Categorii
- Canalizare CLI în patru etape, de la ingerare la export
- Generarea de perechi QA și urme de raționament
- Prompting, eșantionare și filtre configurabile
- Formate de ieșire pregătite pentru antrenament, pentru reglare fină
- Verificări ale calității și validare a schemei
- Exemple care vizează raționamentul specific sarcinii
Limbaj de programare
Piton
Categorii
Aceasta este o aplicație care poate fi descărcată și de la https://sourceforge.net/projects/synthetic-data-kit.mirror/. A fost găzduită în OnWorks pentru a putea fi rulată online în cel mai simplu mod de pe unul dintre sistemele noastre de operare gratuite.