Seguindo instruções com feedback para download para Linux

Este é o aplicativo Linux chamado Seguindo Instruções com Feedback, cuja versão mais recente pode ser baixada como following-instructions-human-feedbacksourcecode.tar.gz. Ele pode ser executado online no provedor de hospedagem gratuita OnWorks para estações de trabalho.

 
 

Baixe e execute online este aplicativo chamado Following Instructions with Feedback with OnWorks gratuitamente.

Siga estas instruções para executar este aplicativo:

- 1. Baixe este aplicativo em seu PC.

- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.

- 3. Carregue este aplicativo em tal gerenciador de arquivos.

- 4. Inicie o emulador OnWorks Linux online ou Windows online ou emulador MACOS online a partir deste site.

- 5. No sistema operacional OnWorks Linux que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.

- 6. Baixe o aplicativo, instale-o e execute-o.

CAPTURAS DE TELA:


Seguindo instruções com feedback


DESCRIÇÃO:

O repositório following-instructions-human-feedback contém o código e os materiais complementares que sustentam o trabalho da OpenAI no treinamento de modelos de linguagem (modelos InstructGPT) que seguem melhor as instruções do usuário por meio de feedback humano. O repositório hospeda o cartão do modelo, exemplos de saídas de avaliação automática e diretrizes de rotulagem usadas no processo. Ele está explicitamente vinculado ao artigo "Treinando modelos de linguagem para seguir instruções com feedback humano" e serve como referência para como a OpenAI coleta diretrizes de anotação, executa comparações de preferências e avalia comportamentos de modelos. O repositório não é uma implementação completa de todo o pipeline RLHF, mas sim um centro de arquivamento que dá suporte à pesquisa publicada — fornecendo transparência em relação aos padrões de avaliação e rotulagem humana. Ele inclui diretórios como automatic-eval-samples (amostras de saídas de modelos em tarefas de benchmark) e um model-card.md que descreve o comportamento pretendido, as limitações e os vieses dos modelos InstructGPT.



Recursos

  • Arquivo de resultados de amostra de avaliação de experimentos do InstructGPT
  • model-card.md descrevendo o uso do modelo, limitações e considerações de segurança
  • Diretrizes de rotulagem / instruções de anotação usadas para avaliadores humanos
  • Pasta estruturada “amostras de avaliação automática” mostrando saídas de linha de base versus saídas ajustadas
  • Transparência sobre como o OpenAI mediu a classificação e o alinhamento das preferências do modelo
  • Links e referências ao artigo de pesquisa original e documentação



Categorias

Educação

Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/following-inst-feedback.mirror/. Ele foi hospedado no OnWorks para ser executado online da maneira mais fácil em um de nossos sistemas operacionais gratuitos.



Programas online mais recentes para Linux e Windows


Categorias para baixar software e programas para Windows e Linux