To aplikacja dla systemu Linux o nazwie DeepEval, której najnowszą wersję można pobrać jako NewInterfaces,ReduceETLCode_50_!sourcecode.tar.gz. Można ją uruchomić online w darmowym hostingu OnWorks dla stacji roboczych.
Pobierz i uruchom bezpłatnie aplikację DeepEval with OnWorks.
Postępuj zgodnie z tymi instrukcjami, aby uruchomić tę aplikację:
- 1. Pobrałem tę aplikację na swój komputer.
- 2. Wpisz w naszym menedżerze plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 3. Prześlij tę aplikację w takim menedżerze plików.
- 4. Uruchom emulator online OnWorks Linux lub Windows online lub emulator online MACOS z tej witryny.
- 5. W systemie operacyjnym OnWorks Linux, który właśnie uruchomiłeś, przejdź do naszego menedżera plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 6. Pobierz aplikację, zainstaluj ją i uruchom.
ZRZUTY EKRANU
Ad
Głęboka ocena
OPIS
DeepEval to prosty w użyciu, open-source'owy framework oceny LLM, służący do oceny i testowania systemów modeli wielkojęzycznych. Jest podobny do Pytest, ale specjalizuje się w testowaniu jednostkowym wyników LLM. DeepEval uwzględnia najnowsze badania, aby ocenić wyniki LLM na podstawie metryk, takich jak G-Eval, halucynacja, trafność odpowiedzi, RAGAS itp., które wykorzystują LLM i różne inne modele NLP, które są uruchamiane lokalnie na Twoim komputerze w celu oceny. Niezależnie od tego, czy Twoja aplikacja jest implementowana za pośrednictwem RAG, dostrajania, LangChain lub LlamaIndex, DeepEval ma dla Ciebie rozwiązanie. Dzięki niemu możesz łatwo określić optymalne hiperparametry, aby ulepszyć swój potok RAG, zapobiec dryfowaniu natychmiastowemu, a nawet przejść z OpenAI do hostowania własnego Llama2 z pewnością siebie.
Funkcjonalności
- Szeroka gama gotowych do użycia metryk oceny LLM (wszystkie z objaśnieniami) obsługiwanych przez DOWOLNY LLM Twojego wyboru
- Zespół Red Team w swojej aplikacji LLM wykrywa ponad 40 luk w zabezpieczeniach w kilku linijkach kodu
- Dostępna dokumentacja
- Dostępne przykłady
- Oceń cały swój zestaw danych zbiorczo w mniej niż 20 liniach kodu Pythona równolegle. Zrób to za pomocą CLI w sposób podobny do Pytest lub za pomocą naszej funkcji evaluate()
- Utwórz własne niestandardowe metryki, które zostaną automatycznie zintegrowane z ekosystemem DeepEval poprzez dziedziczenie podstawowej klasy metryk DeepEval
Język programowania
Python
Kategorie
Jest to aplikacja, którą można również pobrać z https://sourceforge.net/projects/deepeval.mirror/. Została umieszczona w OnWorks, aby można ją było uruchomić online w najłatwiejszy sposób z jednego z naszych darmowych systemów operacyjnych.