این برنامه ویندوزی به نام DeepEval است که آخرین نسخه آن را میتوانید با نام LLMEvals-v3.0sourcecode.tar.gz دانلود کنید. این برنامه را میتوان به صورت آنلاین در ارائه دهنده خدمات میزبانی وب رایگان OnWorks برای ایستگاههای کاری اجرا کرد.
این برنامه با نام DeepEval with OnWorks را به صورت رایگان دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. هر شبیه ساز آنلاین OS OnWorks را از این وب سایت راه اندازی کنید، اما شبیه ساز آنلاین ویندوز بهتر است.
- 5. از OnWorks Windows OS که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. برنامه را دانلود و نصب کنید.
- 7. Wine را از مخازن نرم افزار توزیع لینوکس خود دانلود کنید. پس از نصب، می توانید روی برنامه دوبار کلیک کنید تا آنها را با Wine اجرا کنید. همچنین می توانید PlayOnLinux را امتحان کنید، یک رابط کاربری فانتزی بر روی Wine که به شما کمک می کند برنامه ها و بازی های محبوب ویندوز را نصب کنید.
Wine راهی برای اجرای نرم افزار ویندوز بر روی لینوکس است، اما بدون نیاز به ویندوز. Wine یک لایه سازگار با ویندوز منبع باز است که می تواند برنامه های ویندوز را مستقیماً بر روی هر دسکتاپ لینوکس اجرا کند. اساساً، Wine در تلاش است تا به اندازه کافی از ویندوز را از ابتدا مجدداً پیاده سازی کند تا بتواند همه آن برنامه های ویندوز را بدون نیاز به ویندوز اجرا کند.
عکس ها
Ad
دیپ ایول
شرح
DeepEval یک چارچوب ارزیابی LLM متنباز و با کاربرد آسان برای ارزیابی و آزمایش سیستمهای مدل زبان بزرگ است. این چارچوب مشابه Pytest است اما برای آزمایش واحد خروجیهای LLM تخصص دارد. DeepEval جدیدترین تحقیقات را برای ارزیابی خروجیهای LLM بر اساس معیارهایی مانند G-Eval، hallucination، answer relevancy، RAGAS و غیره در بر میگیرد که از LLMها و مدلهای مختلف NLP دیگر که به صورت محلی روی دستگاه شما اجرا میشوند برای ارزیابی استفاده میکند. چه برنامه شما از طریق RAG یا fine-tuning، LangChain یا LlamaIndex پیادهسازی شده باشد، DeepEval شما را پوشش میدهد. با استفاده از آن، میتوانید به راحتی پارامترهای بهینه را برای بهبود خط لوله RAG خود تعیین کنید، از انحراف سریع جلوگیری کنید یا حتی با اطمینان از OpenAI به میزبانی Llama2 خود منتقل شوید.
امکانات
- طیف گستردهای از معیارهای ارزیابی LLM آماده برای استفاده (همه با توضیحات) که توسط هر LLM مورد نظر شما ارائه میشود
- تیم قرمز، اپلیکیشن LLM شما را برای بیش از ۴۰ آسیبپذیری امنیتی در چند خط کد، بررسی میکند.
- اسناد موجود
- نمونه های موجود
- کل مجموعه دادههای خود را به صورت انبوه در کمتر از 20 خط کد پایتون به صورت موازی ارزیابی کنید. این کار را از طریق رابط خط فرمان (CLI) به روشی شبیه به Pytest یا از طریق تابع ()evaly انجام دهید.
- با ارثبری از کلاس معیار پایه DeepEval، معیارهای سفارشی خود را ایجاد کنید که به طور خودکار با اکوسیستم DeepEval ادغام میشوند.
زبان برنامه نویسی
پــایتــون
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/deepeval.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش از یکی از سیستمهای عامل رایگان ما به صورت آنلاین اجرا کرد.