यह RLax नाम का एक लिनक्स ऐप है जिसका नवीनतम संस्करण RLax0.1.8sourcecode.tar.gz के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ़्त होस्टिंग प्रदाता OnWorks पर ऑनलाइन चलाया जा सकता है।
RLax नामक इस ऐप को OnWorks के साथ मुफ्त में डाउनलोड करें और ऑनलाइन चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से ऑनवर्क्स लिनक्स ऑनलाइन या विंडोज ऑनलाइन एमुलेटर या मैकोज़ ऑनलाइन एमुलेटर शुरू करें।
- 5. ऑनवर्क्स लिनक्स ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें, इसे इंस्टॉल करें और इसे चलाएं।
स्क्रीनशॉट:
आरलैक्स
विवरण:
RLax (उच्चारण "रिलैक्स") Google DeepMind द्वारा विकसित एक JAX-आधारित लाइब्रेरी है जो रीइन्फोर्समेंट लर्निंग (RL) एजेंट्स के निर्माण के लिए पुन: प्रयोज्य गणितीय बिल्डिंग ब्लॉक्स प्रदान करती है। पूर्ण एल्गोरिदम लागू करने के बजाय, RLax उन मुख्य कार्यात्मक संचालनों पर ध्यान केंद्रित करता है जो RL विधियों का आधार हैं—जैसे मूल्य फलन, प्रतिफल, नीति प्रवणता और हानि पदों की गणना—जिससे शोधकर्ताओं को लचीले ढंग से अपने एजेंट्स को इकट्ठा करने की अनुमति मिलती है। यह ऑन-पॉलिसी और ऑफ-पॉलिसी, दोनों तरह की लर्निंग के साथ-साथ मूल्य-आधारित, नीति-आधारित और मॉडल-आधारित दृष्टिकोणों का समर्थन करता है। RLax, JAX के साथ पूरी तरह से JIT-संयोज्य है, जो CPU, GPU और TPU बैकएंड में उच्च-प्रदर्शन निष्पादन को सक्षम बनाता है। यह लाइब्रेरी बेलमैन समीकरणों, प्रतिफल वितरणों, सामान्य मान फलनों और सतत एवं असतत क्रिया स्थानों, दोनों में नीति अनुकूलन के लिए उपकरण लागू करती है। यह DeepMind के Haiku (तंत्रिका नेटवर्क परिभाषा के लिए) और Optax (अनुकूलन के लिए) के साथ सहजता से एकीकृत होता है, जिससे यह मॉड्यूलर RL पाइपलाइनों का एक प्रमुख घटक बन जाता है।
विशेषताएं
- मॉड्यूलर सुदृढीकरण सीखने के आदिम (मूल्य, रिटर्न और नीतियां)
- GPU/TPU त्वरण और स्वचालित विभेदन के लिए JAX-अनुकूलित
- नीति-आधारित और नीति-विहीन शिक्षण प्रतिमानों का समर्थन करता है
- वितरणात्मक मूल्य फ़ंक्शन और सामान्य मूल्य फ़ंक्शन को कार्यान्वित करता है
- तंत्रिका नेटवर्क और अनुकूलन पाइपलाइनों के लिए हाइकू और ऑप्टैक्स के साथ एकीकृत करता है
- पुनरुत्पादन और शैक्षिक उपयोग के लिए व्यापक परीक्षण और उदाहरण
प्रोग्रामिंग भाषा
पायथन, यूनिक्स शैल
श्रेणियाँ
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/rlax.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे किसी भी निःशुल्क ऑपरेटिव सिस्टम से सबसे आसान तरीके से ऑनलाइन चलाने के लिए OnWorks में होस्ट किया गया है।