هذا تطبيق لينكس يُدعى DeepEval، ويمكن تنزيل أحدث إصدار منه باسم NewInterfaces,ReduceETLCode_50_!sourcecode.tar.gz. ويمكن تشغيله عبر الإنترنت من خلال موفر الاستضافة المجاني OnWorks لمحطات العمل.
قم بتنزيل وتشغيل هذا التطبيق المسمى DeepEval مع OnWorks مجانًا عبر الإنترنت.
اتبع هذه التعليمات لتشغيل هذا التطبيق:
- 1. قم بتنزيل هذا التطبيق على جهاز الكمبيوتر الخاص بك.
- 2. أدخل في مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX باسم المستخدم الذي تريده.
- 3. تحميل هذا التطبيق في هذا الملف.
- 4. ابدأ تشغيل OnWorks Linux عبر الإنترنت أو محاكي Windows عبر الإنترنت أو محاكي MACOS عبر الإنترنت من هذا الموقع.
- 5. من نظام تشغيل OnWorks Linux الذي بدأته للتو ، انتقل إلى مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX مع اسم المستخدم الذي تريده.
- 6. قم بتنزيل التطبيق وتثبيته وتشغيله.
SCREENSHOTS
Ad
ديب إيفال
الوصف
DeepEval هو إطار عمل تقييمي مفتوح المصدر وسهل الاستخدام لأنظمة نماذج اللغات الكبيرة (LLM)، يُستخدم لتقييم واختبار أنظمة النماذج متعددة اللغات. يشبه Pytest ولكنه متخصص في اختبار مخرجات LLM. يدمج DeepEval أحدث الأبحاث لتقييم مخرجات LLM بناءً على مقاييس مثل G-Eval، والهلوسة، وملاءمة الإجابة، وRAGAS، وغيرها، والذي يستخدم أنظمة LLM ونماذج معالجة اللغة الطبيعية (NLP) الأخرى التي تعمل محليًا على جهازك للتقييم. سواءً تم تنفيذ تطبيقك عبر RAG أو الضبط الدقيق، أو LangChain، أو LlamaIndex، فإن DeepEval يُلبي جميع احتياجاتك. باستخدامه، يمكنك بسهولة تحديد المعاملات الفائقة المُثلى لتحسين مسار RAG، ومنع الانحراف الفوري، أو حتى الانتقال من OpenAI إلى استضافة Llama2 الخاص بك بثقة.
شرح المميزات:
- مجموعة كبيرة ومتنوعة من مقاييس تقييم LLM الجاهزة للاستخدام (جميعها مع تفسيرات) مدعومة بأي LLM من اختيارك
- قم بفحص تطبيق LLM الخاص بك بحثًا عن أكثر من 40 ثغرة أمنية في بضعة أسطر من التعليمات البرمجية
- الوثائق المتاحة
- الأمثلة المتاحة
- قيّم مجموعة بياناتك بالكامل دفعةً واحدةً في أقل من ٢٠ سطرًا من شيفرة بايثون بالتوازي. نفّذ ذلك عبر واجهة سطر الأوامر (CLI) بطريقة مشابهة لـ Pytest، أو من خلال دالة assess().
- قم بإنشاء مقاييسك المخصصة التي يتم دمجها تلقائيًا مع النظام البيئي لـ DeepEval من خلال وراثة فئة المقاييس الأساسية لـ DeepEval
لغة البرمجة
Python
التصنيفات
هذا تطبيق يُمكن تنزيله أيضًا من https://sourceforge.net/projects/deepeval.mirror/. وقد استُضيف في OnWorks لتشغيله عبر الإنترنت بسهولة من أحد أنظمتنا التشغيلية المجانية.