Este é o aplicativo do Windows chamado Arthur Bench, cuja versão mais recente pode ser baixada como 0.2.3sourcecode.zip. Ele pode ser executado online no provedor de hospedagem gratuito OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado Arthur Bench com OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie qualquer emulador on-line OS OnWorks a partir deste site, mas um emulador on-line melhor do Windows.
- 5. No sistema operacional OnWorks Windows que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo e instale-o.
- 7. Baixe o Wine de seus repositórios de software de distribuição Linux. Depois de instalado, você pode clicar duas vezes no aplicativo para executá-lo com o Wine. Você também pode experimentar o PlayOnLinux, uma interface sofisticada do Wine que o ajudará a instalar programas e jogos populares do Windows.
Wine é uma forma de executar software Windows no Linux, mas sem a necessidade de Windows. Wine é uma camada de compatibilidade do Windows de código aberto que pode executar programas do Windows diretamente em qualquer desktop Linux. Essencialmente, o Wine está tentando reimplementar o suficiente do Windows do zero para que possa executar todos os aplicativos do Windows sem realmente precisar do Windows.
SCREENSHOTS
Ad
Banco Artur
DESCRIÇÃO
Bench é uma ferramenta para avaliar LLMs para casos de uso de produção. Esteja você comparando diferentes LLMs, considerando diferentes prompts ou testando hiperparâmetros de geração como temperatura e # tokens, o Bench fornece um ponto de contato para toda a avaliação de desempenho do seu LLM.
Funcionalidades
- Para padronizar o fluxo de trabalho de avaliação LLM com uma interface comum entre tarefas e casos de uso
- Para testar se os LLMs de código aberto podem ter um desempenho tão bom quanto os principais provedores de API LLM de código fechado em seus dados específicos
- Para traduzir as classificações nas tabelas de classificação e benchmarks do LLM em pontuações importantes para o seu caso de uso real
- Bench fornece um ponto de contato para todas as suas avaliações de desempenho LLM
- Instale o Bench em seu ambiente python com dependências opcionais para servir resultados localmente
- Alternativamente, instale o Bench em seu ambiente python com dependências mínimas
Linguagem de Programação
TypeScript
Categorias
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/arthur-bench.mirror/. Foi hospedado em OnWorks para poder ser executado online da maneira mais fácil a partir de um de nossos Sistemas Operativos gratuitos.