यह RLax नाम का एक विंडोज़ ऐप है जिसका नवीनतम संस्करण RLax0.1.8sourcecode.tar.gz के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ़्त होस्टिंग प्रदाता OnWorks पर ऑनलाइन चलाया जा सकता है।
RLax नामक इस ऐप को OnWorks के साथ मुफ्त में डाउनलोड करें और ऑनलाइन चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से कोई भी ओएस ऑनवर्क्स ऑनलाइन एमुलेटर शुरू करें, लेकिन बेहतर विंडोज ऑनलाइन एमुलेटर।
- 5. ऑनवर्क्स विंडोज ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें और इसे इंस्टॉल करें।
- 7. अपने Linux वितरण सॉफ़्टवेयर रिपॉजिटरी से वाइन डाउनलोड करें। एक बार इंस्टॉल हो जाने पर, आप ऐप को वाइन के साथ चलाने के लिए डबल-क्लिक कर सकते हैं। आप PlayOnLinux को भी आज़मा सकते हैं, जो वाइन पर एक फैंसी इंटरफ़ेस है जो आपको लोकप्रिय विंडोज़ प्रोग्राम और गेम इंस्टॉल करने में मदद करेगा।
वाइन लिनक्स पर विंडोज सॉफ्टवेयर चलाने का एक तरीका है, लेकिन विंडोज की आवश्यकता नहीं है। वाइन एक ओपन-सोर्स विंडोज संगतता परत है जो किसी भी लिनक्स डेस्कटॉप पर सीधे विंडोज प्रोग्राम चला सकती है। अनिवार्य रूप से, वाइन खरोंच से पर्याप्त विंडोज़ को फिर से लागू करने की कोशिश कर रहा है ताकि वह उन सभी विंडोज़ अनुप्रयोगों को वास्तव में विंडोज़ की आवश्यकता के बिना चला सके।
स्क्रीनशॉट:
आरलैक्स
विवरण:
RLax (उच्चारण "रिलैक्स") Google DeepMind द्वारा विकसित एक JAX-आधारित लाइब्रेरी है जो रीइन्फोर्समेंट लर्निंग (RL) एजेंट्स के निर्माण के लिए पुन: प्रयोज्य गणितीय बिल्डिंग ब्लॉक्स प्रदान करती है। पूर्ण एल्गोरिदम लागू करने के बजाय, RLax उन मुख्य कार्यात्मक संचालनों पर ध्यान केंद्रित करता है जो RL विधियों का आधार हैं—जैसे मूल्य फलन, प्रतिफल, नीति प्रवणता और हानि पदों की गणना—जिससे शोधकर्ताओं को लचीले ढंग से अपने एजेंट्स को इकट्ठा करने की अनुमति मिलती है। यह ऑन-पॉलिसी और ऑफ-पॉलिसी, दोनों तरह की लर्निंग के साथ-साथ मूल्य-आधारित, नीति-आधारित और मॉडल-आधारित दृष्टिकोणों का समर्थन करता है। RLax, JAX के साथ पूरी तरह से JIT-संयोज्य है, जो CPU, GPU और TPU बैकएंड में उच्च-प्रदर्शन निष्पादन को सक्षम बनाता है। यह लाइब्रेरी बेलमैन समीकरणों, प्रतिफल वितरणों, सामान्य मान फलनों और सतत एवं असतत क्रिया स्थानों, दोनों में नीति अनुकूलन के लिए उपकरण लागू करती है। यह DeepMind के Haiku (तंत्रिका नेटवर्क परिभाषा के लिए) और Optax (अनुकूलन के लिए) के साथ सहजता से एकीकृत होता है, जिससे यह मॉड्यूलर RL पाइपलाइनों का एक प्रमुख घटक बन जाता है।
विशेषताएं
- मॉड्यूलर सुदृढीकरण सीखने के आदिम (मूल्य, रिटर्न और नीतियां)
- GPU/TPU त्वरण और स्वचालित विभेदन के लिए JAX-अनुकूलित
- नीति-आधारित और नीति-विहीन शिक्षण प्रतिमानों का समर्थन करता है
- वितरणात्मक मूल्य फ़ंक्शन और सामान्य मूल्य फ़ंक्शन को कार्यान्वित करता है
- तंत्रिका नेटवर्क और अनुकूलन पाइपलाइनों के लिए हाइकू और ऑप्टैक्स के साथ एकीकृत करता है
- पुनरुत्पादन और शैक्षिक उपयोग के लिए व्यापक परीक्षण और उदाहरण
प्रोग्रामिंग भाषा
पायथन, यूनिक्स शैल
श्रेणियाँ
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/rlax.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे किसी भी निःशुल्क ऑपरेटिव सिस्टम से सबसे आसान तरीके से ऑनलाइन चलाने के लिए OnWorks में होस्ट किया गया है।