यह सिंथेटिक डेटा किट नाम का एक लिनक्स ऐप है जिसका नवीनतम संस्करण synthetic-data-kitsourcecode.tar.gz के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ़्त होस्टिंग प्रदाता OnWorks पर ऑनलाइन चलाया जा सकता है।
सिंथेटिक डेटा किट नामक इस ऐप को ऑनवर्क्स के साथ मुफ्त में डाउनलोड करें और ऑनलाइन चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से ऑनवर्क्स लिनक्स ऑनलाइन या विंडोज ऑनलाइन एमुलेटर या मैकोज़ ऑनलाइन एमुलेटर शुरू करें।
- 5. ऑनवर्क्स लिनक्स ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें, इसे इंस्टॉल करें और इसे चलाएं।
स्क्रीनशॉट:
सिंथेटिक डेटा किट
विवरण:
सिंथेटिक डेटा किट एक CLI-केंद्रित टूलकिट है जो उच्च-गुणवत्ता वाले सिंथेटिक डेटासेट उत्पन्न करके लामा मॉडल्स को बेहतर बनाता है, और आधुनिक निर्देश-ट्यूनिंग प्रारूपों के अनुरूप तर्क ट्रेस और QA युग्म बनाने पर ज़ोर देता है। यह एक सुविचारित, मॉड्यूलर वर्कफ़्लो प्रदान करता है जो विषम स्रोतों (दस्तावेज़, ट्रांसक्रिप्ट) को ग्रहण करने, मॉडल्स को लेबल किए गए उदाहरण बनाने के लिए प्रेरित करने, और न्यूनतम ग्लू कोड के साथ फ़ाइन-ट्यूनिंग स्कीमाज़ में निर्यात करने को शामिल करता है। किट का डिज़ाइन लक्ष्य डेटासेट निर्माण को एड-हॉक नोटबुक्स के बजाय एक दोहराने योग्य पाइपलाइन में बदलकर "डेटा तैयारी" की अड़चन को कम करना है। यह तर्क/विचार-श्रृंखला के विभिन्न रूपों, विन्यास योग्य नमूनाकरण और गार्डरेल्स के निर्माण का समर्थन करता है ताकि आउटपुट प्रारूप प्रतिबंधों और गुणवत्ता जाँचों को पूरा कर सकें। उदाहरण और मार्गदर्शिकाएँ दिखाती हैं कि उपकरण उपयोग या चरण-दर-चरण तर्क जैसे कार्य-विशिष्ट व्यवहारों को कैसे लक्षित किया जाए, और फिर उन्हें सीधे प्रशिक्षण-तैयार फ़ाइलों में कैसे सहेजा जाए।
विशेषताएं
- इंजेस्ट से एक्सपोर्ट तक चार-चरणीय CLI पाइपलाइन
- QA युग्मों और तर्क-प्रणाली के निशानों का निर्माण
- कॉन्फ़िगर करने योग्य प्रॉम्प्टिंग, सैंपलिंग और फ़िल्टर
- फाइन-ट्यूनिंग के लिए प्रशिक्षण-तैयार आउटपुट प्रारूप
- गुणवत्ता जांच और स्कीमा सत्यापन
- कार्य-विशिष्ट तर्क को लक्षित करने वाले उदाहरण
प्रोग्रामिंग भाषा
अजगर
श्रेणियाँ
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/synthetic-data-kit.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे किसी भी निःशुल्क ऑपरेटिव सिस्टम से सबसे आसान तरीके से ऑनलाइन चलाने के लिए OnWorks में होस्ट किया गया है।