Questa è l'app Linux denominata Arthur Bench la cui ultima versione può essere scaricata come 0.2.3sourcecode.zip. Può essere eseguito online nel provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online gratuitamente questa app denominata Arthur Bench con OnWorks.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avviare l'emulatore online OnWorks Linux o Windows online o l'emulatore online MACOS da questo sito Web.
- 5. Dal sistema operativo OnWorks Linux che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione, installala ed eseguila.
IMMAGINI
Ad
Arthur Panca
DESCRIZIONE
Bench è uno strumento per valutare gli LLM per casi d'uso di produzione. Sia che tu stia confrontando LLM diversi, considerando suggerimenti diversi o testando iperparametri di generazione come temperatura e # token, Bench fornisce un punto di contatto per tutta la valutazione delle prestazioni LLM.
Caratteristiche
- Standardizzare il flusso di lavoro della valutazione LLM con un'interfaccia comune tra attività e casi d'uso
- Per verificare se i LLM open source possono fare altrettanto bene dei principali fornitori di API LLM closed source sui tuoi dati specifici
- Per tradurre le classifiche nelle classifiche e nei benchmark LLM in punteggi che ti interessano per il tuo caso d'uso effettivo
- Bench fornisce un punto di contatto per tutta la valutazione delle prestazioni LLM
- Installa Bench nel tuo ambiente Python con dipendenze opzionali per fornire risultati localmente
- In alternativa, installa Bench nel tuo ambiente Python con dipendenze minime
Linguaggio di programmazione
Dattiloscritto
Categorie
Questa è un'applicazione che può essere recuperata anche da https://sourceforge.net/projects/arthur-bench.mirror/. È stato ospitato su OnWorks per poter essere eseguito online in modo più semplice da uno dei nostri sistemi operativi gratuiti.