यह Scalable Distributed Deep-RL नामक एक Linux ऐप है जिसका नवीनतम संस्करण scalable_agentsourcecode.tar.gz के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ़्त होस्टिंग प्रदाता OnWorks पर ऑनलाइन चलाया जा सकता है।
स्केलेबल डिस्ट्रीब्यूटेड डीप-आरएल नामक इस ऐप को ऑनवर्क्स के साथ मुफ्त में डाउनलोड करें और ऑनलाइन चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से ऑनवर्क्स लिनक्स ऑनलाइन या विंडोज ऑनलाइन एमुलेटर या मैकोज़ ऑनलाइन एमुलेटर शुरू करें।
- 5. ऑनवर्क्स लिनक्स ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें, इसे इंस्टॉल करें और इसे चलाएं।
स्क्रीनशॉट:
स्केलेबल वितरित डीप-आरएल
विवरण:
स्केलेबल एजेंट, IMPALA (इम्पोर्टेंस वेटेड एक्टर-लर्नर आर्किटेक्चर) का एक खुला कार्यान्वयन है, जो Google DeepMind द्वारा विकसित एक अत्यधिक स्केलेबल वितरित सुदृढीकरण शिक्षण ढाँचा है। IMPALA ने अभिनय और शिक्षण प्रक्रियाओं को अलग करके बड़े पैमाने के वातावरण में एजेंटों को कुशलतापूर्वक प्रशिक्षित करने के लिए एक नया प्रतिमान पेश किया। इस आर्किटेक्चर में, कई एक्टर प्रक्रियाएँ अपने वातावरण के साथ समानांतर रूप से प्रक्षेप पथ एकत्र करने के लिए अंतःक्रिया करती हैं, जिन्हें फिर नीति अद्यतनों के लिए एक केंद्रीकृत शिक्षार्थी को अतुल्यकालिक रूप से भेजा जाता है। शिक्षार्थी, अभिनेताओं और शिक्षार्थी के बीच नीतिगत अंतराल को ठीक करने के लिए महत्व भार का उपयोग करता है, जिससे बड़े पैमाने पर स्थिर ऑफ-पॉलिसी प्रशिक्षण संभव होता है। यह डिज़ाइन नमूना दक्षता और स्थिरता बनाए रखते हुए सिस्टम को सैकड़ों वातावरणों और अरबों फ़्रेमों में कुशलतापूर्वक स्केल करने की अनुमति देता है।
विशेषताएं
- IMPALA को कार्यान्वित करता है, जो एक स्केलेबल वितरित गहन सुदृढीकरण शिक्षण ढांचा है
- महत्व भार के साथ अतुल्यकालिक अभिनेता-शिक्षार्थी वास्तुकला का समर्थन करता है
- बड़े पैमाने के वातावरणों (जैसे, DMLab-30, अटारी) पर एजेंटों को कुशलतापूर्वक प्रशिक्षित करना
- अनुकूलित डेटा थ्रूपुट के लिए गतिशील बैचिंग शामिल है
- डीपमाइंड सॉनेट और टेन्सरफ्लो के साथ संगत
- पुनरुत्पादनीय एकल-मशीन या वितरित प्रशिक्षण के लिए Dockerfile सेटअप प्रदान करता है
प्रोग्रामिंग भाषा
सी ++, पायथन
श्रेणियाँ
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/scalable-dist-deep-rl.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे किसी भी निःशुल्क ऑपरेटिव सिस्टम से सबसे आसान तरीके से ऑनलाइन चलाने के लिए OnWorks में होस्ट किया गया है।