यह verl नाम का एक लिनक्स ऐप है जिसका नवीनतम संस्करण v0.6.1sourcecode.tar.gz के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ़्त होस्टिंग प्रदाता OnWorks पर ऑनलाइन चलाया जा सकता है।
इस verl नामक ऐप को OnWorks के साथ मुफ्त में डाउनलोड करें और ऑनलाइन चलाएँ।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से ऑनवर्क्स लिनक्स ऑनलाइन या विंडोज ऑनलाइन एमुलेटर या मैकोज़ ऑनलाइन एमुलेटर शुरू करें।
- 5. ऑनवर्क्स लिनक्स ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें, इसे इंस्टॉल करें और इसे चलाएं।
स्क्रीनशॉट:
खो गया
विवरण:
VERL एक सुदृढीकरण-शिक्षण-उन्मुख टूलकिट है जिसे भाषा मॉडल से लेकर निर्णय लेने वाले एजेंटों तक, आधुनिक AI प्रणालियों को प्रशिक्षित और संरेखित करने के लिए डिज़ाइन किया गया है। यह पर्यवेक्षित फ़ाइन-ट्यूनिंग, वरीयता मॉडलिंग और ऑनलाइन RL को एक सुसंगत प्रशिक्षण स्टैक में एकीकृत करता है ताकि टीमें न्यूनतम ग्लू कोड के साथ कच्चे डेटा से संरेखित नीतियों पर आगे बढ़ सकें। यह लाइब्रेरी मापनीयता और दक्षता पर केंद्रित है, वितरित प्रशिक्षण लूप, मिश्रित परिशुद्धता और रीप्ले/बफरिंग उपयोगिताएँ प्रदान करती है जो त्वरक को व्यस्त रखती हैं। यह लोकप्रिय संरेखण एल्गोरिदम के संदर्भ कार्यान्वयन और स्पष्ट उदाहरणों के साथ आता है जो अनुकूलन से पहले आधार रेखाओं को पुन: प्रस्तुत करना आसान बनाते हैं। डेटा पाइपलाइन मानव प्रतिक्रिया, सिम्युलेटेड वातावरण और सिंथेटिक प्राथमिकताओं को विनिमेय स्रोतों के रूप में मानती है, जो तीव्र प्रयोग में मदद करती है। VERL अनुसंधान और उत्पादन दोनों के लिए उपयुक्त है: लॉगिंग, चेकपॉइंटिंग और मूल्यांकन सूट इसमें अंतर्निहित हैं ताकि आप समय के साथ सीखने की गतिशीलता और प्रतिगमन को ट्रैक कर सकें।
विशेषताएं
- एसएफटी, वरीयता मॉडलिंग और ऑनलाइन आरएल के लिए एकीकृत पाइपलाइन
- मिश्रित परिशुद्धता और कुशल रीप्ले बफ़र्स के साथ वितरित प्रशिक्षण
- लोकप्रिय संरेखण/आरएल एल्गोरिदम के संदर्भ कार्यान्वयन
- मानव, सिम्युलेटेड और सिंथेटिक फीडबैक के लिए प्लग करने योग्य डेटा स्रोत
- व्यापक लॉगिंग, चेकपॉइंट और मूल्यांकन डैशबोर्ड
- कस्टम पुरस्कारों, नीतियों और परिवेशों के लिए विस्तार योग्य घटक
प्रोग्रामिंग भाषा
अजगर
श्रेणियाँ
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/verl.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे किसी भी निःशुल्क ऑपरेटिव सिस्टम से सबसे आसान तरीके से ऑनलाइन चलाने के लिए OnWorks में होस्ट किया गया है।