Dit is de Linux-app RobotsDisallowed, waarvan de nieuwste versie kan worden gedownload als RobotsDisallowedsourcecode.tar.gz. Deze kan online worden uitgevoerd via de gratis hostingprovider OnWorks voor werkstations.
Download en gebruik online gratis deze app genaamd RobotsDisallowed met OnWorks.
Volg deze instructies om deze app uit te voeren:
- 1. Download deze applicatie op uw pc.
- 2. Voer in onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX in met de gebruikersnaam die u wilt.
- 3. Upload deze applicatie in zo'n bestandsbeheerder.
- 4. Start de OnWorks Linux online of Windows online emulator of MACOS online emulator vanaf deze website.
- 5. Ga vanuit het OnWorks Linux-besturingssysteem dat u zojuist hebt gestart naar onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX met de gewenste gebruikersnaam.
- 6. Download de applicatie, installeer hem en voer hem uit.
SCREENSHOTS
Ad
RobotsNiet Toegestaan
PRODUCTBESCHRIJVING
RobotsDisallowed is een openbare catalogus die websites en organisaties bijhoudt die AI en webscraping crawlers expliciet blokkeren in hun robots.txt of gerelateerde mechanismen. Het richt zich op het documenteren van de groeiende trend waarbij contenteigenaren controle claimen over hoe hun data wordt gebruikt voor modeltraining en geautomatiseerde harvesting. Het project verzamelt domeinen, noteert de beoogde bots of user agents en brengt patronen aan het licht voor onderzoekers, beleidsmakers en toolontwikkelaars. Het dient zowel als een inspanning om transparantie te bevorderen als een bron voor mensen die strategieën voor toestaan/weigeren voor geautomatiseerde toegang ontwerpen. De dataset nodigt de community uit om bijdragen te leveren om het beeld actueel te houden naarmate er nieuwe bots ontstaan en beleid verandert. Het benadrukt ook het snijvlak van webstandaarden, ethiek en AI-governance door te laten zien hoe site-eigenaren toestemming en beperking op grote schaal operationaliseren.
Kenmerken
- Gecureerde lijst met domeinen die AI of scraping bots niet toestaan
- Identificatie van doelgerichte gebruikersagenten en blokkeringspatronen
- Door de community bijgewerkte dataset die beleidswijzigingen weerspiegelt
- Referentie voor onderzoekers en bouwers van crawl-bewuste tools
- Momentopname van de evoluerende normen rondom datagebruik en toestemming
- Lichtgewicht formaat voor analyse en hergebruik
Categorieën
Deze applicatie kan ook worden gedownload van https://sourceforge.net/projects/robotsdisallowed.mirror/. Deze is gehost in OnWorks, zodat deze eenvoudig online kan worden uitgevoerd via een van onze gratis besturingssystemen.
