This is the Linux app named Synthetic Data Kit whose latest release can be downloaded as synthetic-data-kitsourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
Unduh dan jalankan aplikasi ini secara daring bernama Synthetic Data Kit dengan OnWorks secara gratis.
Ikuti petunjuk ini untuk menjalankan aplikasi ini:
- 1. Download aplikasi ini di PC Anda.
- 2. Masuk ke file manager kami https://www.onworks.net/myfiles.php?username=XXXXX dengan username yang anda inginkan.
- 3. Upload aplikasi ini di filemanager tersebut.
- 4. Jalankan emulator online OnWorks Linux atau Windows online atau emulator online MACOS dari situs web ini.
- 5. Dari OS Linux OnWorks yang baru saja Anda mulai, buka file manager kami https://www.onworks.net/myfiles.php?username=XXXXX dengan nama pengguna yang Anda inginkan.
- 6. Download aplikasinya, install dan jalankan.
SCREENSHOT:
Kit Data Sintetis
DESKRIPSI:
Synthetic Data Kit adalah toolkit yang berpusat pada CLI untuk menghasilkan dataset sintetis berkualitas tinggi guna menyempurnakan model Llama, dengan penekanan pada produksi jejak penalaran dan pasangan QA yang selaras dengan format penyetelan instruksi modern. Kit ini menyediakan alur kerja modular yang beropini yang mencakup penyerapan sumber heterogen (dokumen, transkrip), mendorong model untuk membuat contoh berlabel, dan mengekspor ke skema penyempurnaan dengan kode lem minimal. Tujuan desain kit ini adalah untuk mempersingkat hambatan "persiapan data" dengan mengubah pembuatan dataset menjadi alur kerja yang berulang, alih-alih buku catatan ad-hoc. Kit ini mendukung pembuatan varian rasional/rantai pemikiran, pengambilan sampel yang dapat dikonfigurasi, dan pembatas sehingga keluaran memenuhi batasan format dan pemeriksaan kualitas. Contoh dan panduan menunjukkan cara menargetkan perilaku spesifik tugas seperti penggunaan alat atau penalaran langkah demi langkah, lalu menyimpannya langsung ke dalam berkas siap pelatihan.
Fitur
- Alur kerja CLI empat tahap dari penyerapan hingga ekspor
- Pembuatan pasangan QA dan jejak penalaran
- Prompting, sampling, dan filter yang dapat dikonfigurasi
- Format keluaran siap pelatihan untuk penyempurnaan
- Pemeriksaan kualitas dan validasi skema
- Contoh yang menargetkan penalaran khusus tugas
Bahasa Pemrograman
Ular sanca
KATEGORI
Ini adalah aplikasi yang juga dapat diunduh dari https://sourceforge.net/projects/synthetic-data-kit.mirror/. Aplikasi ini dihosting di OnWorks agar dapat dijalankan secara daring dengan cara termudah dari salah satu Sistem Operasi gratis kami.