This is the Linux app named RobotsDisallowed whose latest release can be downloaded as RobotsDisallowedsourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
Baixe e execute online gratuitamente o aplicativo RobotsDisallowed com OnWorks.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie o emulador OnWorks Linux online ou Windows online ou emulador MACOS online a partir deste site.
- 5. No sistema operacional OnWorks Linux que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo, instale-o e execute-o.
CAPTURAS DE TELA:
Robôs proibidos
DESCRIÇÃO:
O RobotsDisallowed é um catálogo público que rastreia sites e organizações que bloqueiam explicitamente robôs de IA e web scraping em seus arquivos robots.txt ou mecanismos similares. Seu foco é documentar a crescente tendência de proprietários de conteúdo assumirem o controle sobre como seus dados são usados para treinamento de modelos e coleta automatizada. O projeto agrega domínios, identifica os bots ou agentes de usuário visados e revela padrões para pesquisadores, formuladores de políticas e desenvolvedores de ferramentas. Ele serve tanto como um esforço de transparência quanto como um recurso para pessoas que projetam estratégias de permissão/negação para acesso automatizado. O conjunto de dados convida a contribuições da comunidade para manter o panorama atualizado à medida que novos bots surgem e as políticas mudam. Ele também destaca a interseção entre padrões da web, ética e governança de IA, mostrando como os proprietários de sites operacionalizam o consentimento e a restrição em larga escala.
Recursos
- Lista selecionada de domínios que proíbem bots de IA ou de extração de dados.
- Identificação de agentes de usuário visados e padrões de bloqueio
- Conjunto de dados atualizado pela comunidade, refletindo mudanças nas políticas.
- Referência para pesquisadores e desenvolvedores de ferramentas de rastreamento.
- Panorama da evolução das normas em torno do uso de dados e do consentimento.
- Formato leve para análise e reutilização.
Categorias
Este aplicativo também pode ser obtido em https://sourceforge.net/projects/robotsdisallowed.mirror/. Ele foi hospedado no OnWorks para facilitar sua execução online a partir de um de nossos sistemas operacionais gratuitos.