This is the Windows app named DeepEval whose latest release can be downloaded as NewMultimodalMetrics,withPlatformSupportsourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
DeepEval नामक इस ऐप को OnWorks के साथ निःशुल्क डाउनलोड करें और ऑनलाइन चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से कोई भी ओएस ऑनवर्क्स ऑनलाइन एमुलेटर शुरू करें, लेकिन बेहतर विंडोज ऑनलाइन एमुलेटर।
- 5. ऑनवर्क्स विंडोज ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें और इसे इंस्टॉल करें।
- 7. अपने Linux वितरण सॉफ़्टवेयर रिपॉजिटरी से वाइन डाउनलोड करें। एक बार इंस्टॉल हो जाने पर, आप ऐप को वाइन के साथ चलाने के लिए डबल-क्लिक कर सकते हैं। आप PlayOnLinux को भी आज़मा सकते हैं, जो वाइन पर एक फैंसी इंटरफ़ेस है जो आपको लोकप्रिय विंडोज़ प्रोग्राम और गेम इंस्टॉल करने में मदद करेगा।
वाइन लिनक्स पर विंडोज सॉफ्टवेयर चलाने का एक तरीका है, लेकिन विंडोज की आवश्यकता नहीं है। वाइन एक ओपन-सोर्स विंडोज संगतता परत है जो किसी भी लिनक्स डेस्कटॉप पर सीधे विंडोज प्रोग्राम चला सकती है। अनिवार्य रूप से, वाइन खरोंच से पर्याप्त विंडोज़ को फिर से लागू करने की कोशिश कर रहा है ताकि वह उन सभी विंडोज़ अनुप्रयोगों को वास्तव में विंडोज़ की आवश्यकता के बिना चला सके।
स्क्रीनशॉट
Ad
डीपइवल
वर्णन
डीप इवल एक सरल-से-उपयोग, ओपन-सोर्स एलएलएम मूल्यांकन ढांचा है, जो बड़े-भाषा मॉडल सिस्टम का मूल्यांकन और परीक्षण करने के लिए है। यह Pytest के समान है, लेकिन LLM आउटपुट की यूनिट टेस्टिंग के लिए विशेष है। डीप इवल में जी-इवल, मतिभ्रम, उत्तर प्रासंगिकता, आरएजीएएस आदि जैसे मेट्रिक्स के आधार पर एलएलएम आउटपुट का मूल्यांकन करने के लिए नवीनतम शोध शामिल है, जो मूल्यांकन के लिए आपकी मशीन पर स्थानीय रूप से चलने वाले एलएलएम और विभिन्न अन्य एनएलपी मॉडल का उपयोग करता है। चाहे आपका एप्लिकेशन RAG या फ़ाइन-ट्यूनिंग, लैंगचेन या लामाइंडेक्स के माध्यम से कार्यान्वित किया गया हो, डीप इवल आपको कवर करता है। इसके साथ, आप अपनी RAG पाइपलाइन को बेहतर बनाने, प्रॉम्प्ट ड्रिफ्टिंग को रोकने या यहां तक कि OpenAI से अपने स्वयं के Llama2 को आत्मविश्वास के साथ होस्ट करने के लिए संक्रमण करने के लिए आसानी से इष्टतम हाइपरपैरामीटर निर्धारित कर सकते हैं।
विशेषताएं
- आपकी पसंद के किसी भी LLM द्वारा संचालित उपयोग के लिए तैयार LLM मूल्यांकन मेट्रिक्स की विशाल विविधता (सभी स्पष्टीकरण के साथ)
- कोड की कुछ पंक्तियों में 40+ सुरक्षा कमजोरियों के लिए अपने LLM एप्लिकेशन को रेड टीम करें
- दस्तावेज़ीकरण उपलब्ध है
- उदाहरण उपलब्ध हैं
- अपने पूरे डेटासेट का 20 लाइनों के अंदर पायथन कोड में समानांतर रूप से मूल्यांकन करें। इसे CLI के माध्यम से Pytest-जैसे तरीके से करें, या हमारे evaluate() फ़ंक्शन के माध्यम से करें
- अपने स्वयं के कस्टम मेट्रिक्स बनाएं जो DeepEval के बेस मीट्रिक वर्ग को इनहेरिट करके DeepEval के इकोसिस्टम के साथ स्वचालित रूप से एकीकृत हो जाते हैं
प्रोग्रामिंग भाषा
अजगर
कैटिगरीज
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/deepeval.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे किसी एक निःशुल्क ऑपरेटिव सिस्टम से सबसे आसान तरीके से ऑनलाइन चलाने के लिए OnWorks में होस्ट किया गया है।