Questa è l'app Linux chiamata DeepEval, la cui ultima versione può essere scaricata come NewLoadingBars,AndCloudStoragesourcecode.tar.gz. Può essere eseguita online sul provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online gratuitamente questa app chiamata DeepEval con OnWorks.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avviare l'emulatore online OnWorks Linux o Windows online o l'emulatore online MACOS da questo sito Web.
- 5. Dal sistema operativo OnWorks Linux che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione, installala ed eseguila.
IMMAGINI:
Valutazione profonda
DESCRIZIONE:
DeepEval è un framework di valutazione LLM open source e di facile utilizzo, per la valutazione e il test di sistemi modello di grandi dimensioni. È simile a Pytest, ma è specializzato per i test unitari sugli output LLM. DeepEval integra le ricerche più recenti per valutare gli output LLM in base a metriche come G-Eval, allucinazioni, pertinenza delle risposte, RAGAS, ecc., che utilizza LLM e vari altri modelli NLP eseguiti localmente sul computer per la valutazione. Che la tua applicazione sia implementata tramite RAG o tramite fine-tuning, LangChain o LlamaIndex, DeepEval è la soluzione ideale. Con esso, puoi determinare facilmente gli iperparametri ottimali per migliorare la tua pipeline RAG, prevenire il drifting dei prompt o persino passare da OpenAI all'hosting del tuo Llama2 in tutta sicurezza.
Caratteristiche
- Ampia varietà di metriche di valutazione LLM pronte all'uso (tutte con spiegazioni) supportate da QUALSIASI LLM di tua scelta
- Red Team per la tua domanda LLM per oltre 40 vulnerabilità di sicurezza in poche righe di codice
- Documentazione disponibile
- Esempi disponibili
- Valuta l'intero set di dati in blocco in meno di 20 righe di codice Python in parallelo. Puoi farlo tramite la CLI in modo simile a Pytest o tramite la nostra funzione evaluate().
- Crea le tue metriche personalizzate che vengono automaticamente integrate con l'ecosistema di DeepEval ereditando la classe metrica di base di DeepEval
Linguaggio di programmazione
Python
Categorie
Questa applicazione può essere scaricata anche da https://sourceforge.net/projects/deepeval.mirror/. È ospitata su OnWorks per poter essere eseguita online nel modo più semplice da uno dei nostri sistemi operativi gratuiti.