This is the Linux app named RobotsDisallowed whose latest release can be downloaded as RobotsDisallowedsourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
Descarga y ejecuta online gratis esta aplicación llamada RobotsDisallowed con OnWorks.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
SCREENSHOTS
Ad
Robots prohibidos
DESCRIPCIÓN
RobotsDisallowed es un catálogo público que registra sitios web y organizaciones que bloquean explícitamente la IA y los rastreadores web en sus archivos robots.txt o mecanismos similares. Se centra en documentar la creciente tendencia de los propietarios de contenido a controlar cómo se utilizan sus datos para el entrenamiento de modelos y la extracción automatizada de información. El proyecto agrega dominios, registra los bots o agentes de usuario objetivo y revela patrones para investigadores, legisladores y desarrolladores de herramientas. Sirve tanto como iniciativa de transparencia como recurso para quienes diseñan estrategias de acceso automatizado. El conjunto de datos invita a la comunidad a contribuir para mantener la información actualizada a medida que surgen nuevos bots y las políticas cambian. También destaca la intersección entre los estándares web, la ética y la gobernanza de la IA, mostrando cómo los propietarios de sitios web implementan el consentimiento y la restricción a gran escala.
Caracteristicas
- Lista seleccionada de dominios que no permiten bots de IA o de extracción de datos.
- Identificación de agentes de usuario objetivo y patrones de bloqueo
- Conjunto de datos actualizado por la comunidad que refleja los cambios en las políticas
- Referencia para investigadores y desarrolladores de herramientas adaptadas al rastreo
- Panorama general de la evolución de las normas en torno al uso de datos y el consentimiento
- Formato ligero para análisis y reutilización
Categorías
Esta aplicación también se puede descargar desde https://sourceforge.net/projects/robotsdisallowed.mirror/. Está alojada en OnWorks para que pueda ejecutarse en línea de la forma más sencilla desde uno de nuestros sistemas operativos gratuitos.
