این یک برنامه لینوکسی به نام Synthetic Data Kit است که آخرین نسخه آن را میتوانید با نام synthetic-data-kitsourcecode.tar.gz دانلود کنید. این برنامه را میتوان به صورت آنلاین در ارائه دهنده خدمات میزبانی رایگان OnWorks برای ایستگاههای کاری اجرا کرد.
این برنامه با نام Synthetic Data Kit with OnWorks را به صورت رایگان دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
اسکرین شات ها:
کیت داده مصنوعی
DESCRIPTION:
کیت دادههای مصنوعی (Synthetic Data Kit) یک جعبه ابزار مبتنی بر رابط خط فرمان (CLI) برای تولید مجموعه دادههای مصنوعی با کیفیت بالا برای تنظیم دقیق مدلهای Llama است، با تأکید بر تولید ردپاهای استدلال و جفتهای QA که با فرمتهای مدرن تنظیم دستورالعمل مطابقت دارند. این کیت یک گردش کار ماژولار و خودمحور ارائه میدهد که شامل دریافت منابع ناهمگن (اسناد، رونوشتها)، وادار کردن مدلها به ایجاد نمونههای برچسبگذاری شده و صادرات به طرحهای تنظیم دقیق با حداقل کد چسب است. هدف طراحی این کیت، کوتاه کردن گلوگاه «آمادهسازی دادهها» با تبدیل ایجاد مجموعه دادهها به یک خط لوله تکرارپذیر به جای دفترچههای یادداشت موقت است. این کیت از تولید انواع منطق/زنجیره فکری، نمونهبرداری قابل تنظیم و محافظها پشتیبانی میکند تا خروجیها محدودیتهای فرمت و بررسیهای کیفیت را برآورده کنند. مثالها و راهنماها نشان میدهند که چگونه رفتارهای خاص وظیفه مانند استفاده از ابزار یا استدلال گام به گام را هدف قرار دهید، سپس مستقیماً در فایلهای آماده آموزش ذخیره کنید.
امکانات
- خط لوله چهار مرحلهای CLI از دریافت تا صدور
- تولید جفتهای QA و ردیابی استدلال
- اعلان، نمونهبرداری و فیلترهای قابل تنظیم
- قالبهای خروجی آماده برای آموزش جهت تنظیم دقیق
- بررسیهای کیفی و اعتبارسنجی طرحواره
- مثالهایی که استدلال مختص به وظیفه را هدف قرار میدهند
زبان برنامه نویسی
پــایتــون
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/synthetic-data-kit.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش به صورت آنلاین از یکی از سیستمهای عامل رایگان ما اجرا کرد.