यह परसेप्शन मॉडल्स नाम का एक लिनक्स ऐप है जिसका नवीनतम संस्करण perception_modelssourcecode.tar.gz के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ़्त होस्टिंग प्रदाता OnWorks पर ऑनलाइन चलाया जा सकता है।
OnWorks के साथ Perception Models नामक इस ऐप को मुफ्त में डाउनलोड करें और ऑनलाइन चलाएँ।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से ऑनवर्क्स लिनक्स ऑनलाइन या विंडोज ऑनलाइन एमुलेटर या मैकोज़ ऑनलाइन एमुलेटर शुरू करें।
- 5. ऑनवर्क्स लिनक्स ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें, इसे इंस्टॉल करें और इसे चलाएं।
स्क्रीनशॉट:
धारणा मॉडल
विवरण:
परसेप्शन मॉडल, फेसबुक रिसर्च द्वारा उन्नत छवि और वीडियो परसेप्शन कार्यों के लिए विकसित एक अत्याधुनिक ढाँचा है। इसमें दो मुख्य घटक शामिल हैं: दृश्य विशेषता निष्कर्षण के लिए परसेप्शन एनकोडर (PE) और मल्टीमॉडल डिकोडिंग एवं रीजनिंग के लिए परसेप्शन लैंग्वेज मॉडल (PLM)। PE मॉड्यूल, विज़न एनकोडर्स का एक परिवार है जिसे छवि और वीडियो समझ में उत्कृष्टता प्राप्त करने के लिए डिज़ाइन किया गया है, जो कई बेंचमार्क में SigLIP2, InternVideo2 और DINOv2 जैसे मॉडलों से बेहतर है। साथ ही, PLM, PE के साथ एकीकृत होकर दृष्टि-भाषा मॉडलिंग को सशक्त बनाता है, जिससे QwenVL2.5 और InternVL3 जैसे अग्रणी मल्टीमॉडल सिस्टम के साथ प्रतिस्पर्धी परिणाम प्राप्त होते हैं, और साथ ही यह खुले डेटा के साथ पूरी तरह से पुनरुत्पादनीय भी है। यह परियोजना दृश्य पहचान और सघन पूर्वानुमान से लेकर सूक्ष्म बहुमॉडल समझ तक, अनुसंधान अनुप्रयोगों की एक विस्तृत श्रृंखला का समर्थन करती है। इसके अतिरिक्त, इसमें छवि और वीडियो दोनों परसेप्शन के लिए कई बड़े पैमाने के खुले डेटासेट शामिल हैं।
विशेषताएं
- दृष्टि एन्कोडिंग के लिए परसेप्शन एनकोडर (पीई) और मल्टीमॉडल डिकोडिंग के लिए परसेप्शन लैंग्वेज मॉडल (पीएलएम) को संयोजित करता है
- छवि, वीडियो और विज़न-भाषा बेंचमार्क में अत्याधुनिक प्रदर्शन
- पारदर्शिता के लिए स्वतंत्र रूप से उपलब्ध डेटासेट का उपयोग करके खुले, पुनरुत्पादनीय मॉडल
- कोर, भाषा-संरेखित और स्थानिक कार्यों के लिए विशिष्ट कई PE संस्करण
- लचीली अनुसंधान आवश्यकताओं के लिए PLM 1B, 3B और 8B पैरामीटर आकारों में उपलब्ध है
- हगिंग फेस ट्रांसफॉर्मर्स, टिम और एलएमएमएस-इवल जैसे लोकप्रिय उपकरणों के साथ एकीकृत
प्रोग्रामिंग भाषा
अजगर
श्रेणियाँ
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/perception-models.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे किसी भी निःशुल्क ऑपरेटिव सिस्टम से सबसे आसान तरीके से ऑनलाइन चलाने के लिए OnWorks में होस्ट किया गया है।