This is the Linux app named Synthetic Data Kit whose latest release can be downloaded as synthetic-data-kitsourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
ดาวน์โหลดและใช้งานแอปชื่อ Synthetic Data Kit พร้อม OnWorks ออนไลน์ได้ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ
Ad
ชุดข้อมูลสังเคราะห์
DESCRIPTION
ชุดข้อมูลสังเคราะห์ (Synthetic Data Kit) คือชุดเครื่องมือที่เน้น CLI สำหรับการสร้างชุดข้อมูลสังเคราะห์คุณภาพสูงเพื่อปรับแต่งแบบจำลอง Llama โดยเน้นการสร้างร่องรอยการให้เหตุผลและคู่ QA ที่สอดคล้องกับรูปแบบการปรับแต่งคำสั่งสมัยใหม่ ชุดข้อมูลนี้ประกอบด้วยเวิร์กโฟลว์แบบโมดูลาร์ที่เน้นความคิดเห็นส่วนตัว ครอบคลุมการนำแหล่งข้อมูลที่หลากหลาย (เอกสาร บทถอดเสียง) มาใช้ กระตุ้นให้แบบจำลองสร้างตัวอย่างที่มีป้ายกำกับ และส่งออกไปยังสคีมาสำหรับการปรับแต่งโดยใช้โค้ดกาวน้อยที่สุด เป้าหมายการออกแบบของชุดข้อมูลนี้คือการลดปัญหาคอขวดของ "การเตรียมข้อมูล" โดยเปลี่ยนการสร้างชุดข้อมูลให้เป็นไปป์ไลน์ที่ทำซ้ำได้ แทนที่จะเป็นสมุดบันทึกเฉพาะทาง ชุดข้อมูลนี้รองรับการสร้างตัวแปรของเหตุผล/ห่วงโซ่ความคิด การสุ่มตัวอย่างที่กำหนดค่าได้ และกรอบป้องกัน เพื่อให้ผลลัพธ์ตรงตามข้อจำกัดของรูปแบบและการตรวจสอบคุณภาพ ตัวอย่างและคู่มือแสดงวิธีการกำหนดเป้าหมายพฤติกรรมเฉพาะงาน เช่น การใช้เครื่องมือ หรือการให้เหตุผลแบบทีละขั้นตอน จากนั้นบันทึกลงในไฟล์ที่พร้อมสำหรับการฝึกอบรมโดยตรง
คุณสมบัติ
- ไปป์ไลน์ CLI สี่ขั้นตอนตั้งแต่การนำเข้าจนถึงการส่งออก
- การสร้างคู่ QA และการติดตามการใช้เหตุผล
- การแจ้งเตือน การสุ่มตัวอย่าง และตัวกรองที่กำหนดค่าได้
- รูปแบบเอาต์พุตที่พร้อมสำหรับการฝึกอบรมเพื่อการปรับแต่ง
- การตรวจสอบคุณภาพและการตรวจสอบความถูกต้องของโครงร่าง
- ตัวอย่างการกำหนดเป้าหมายการใช้เหตุผลเฉพาะงาน
ภาษาโปรแกรม
หลาม
หมวดหมู่
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/synthetic-data-kit.mirror/ ได้ แอปพลิเคชันนี้โฮสต์อยู่ใน OnWorks เพื่อให้ใช้งานออนไลน์ได้ง่ายที่สุดจากระบบปฏิบัติการฟรีของเรา