Dies ist die Linux-App namens Crawl4AI, deren neueste Version als Releasev0.7.4sourcecode.tar.gz heruntergeladen werden kann. Sie kann online beim kostenlosen Hosting-Anbieter OnWorks für Workstations ausgeführt werden.
Laden Sie diese App namens Crawl4AI mit OnWorks kostenlos herunter und führen Sie sie online aus.
Befolgen Sie diese Anweisungen, um diese App auszuführen:
- 1. Diese Anwendung auf Ihren PC heruntergeladen.
- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.
- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.
- 4. Starten Sie den OnWorks Linux-Online- oder Windows-Online-Emulator oder den MACOS-Online-Emulator von dieser Website.
- 5. Rufen Sie vom gerade gestarteten OnWorks Linux-Betriebssystem aus unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.
- 6. Laden Sie die Anwendung herunter, installieren Sie sie und führen Sie sie aus.
SCREENSHOTS
Ad
Crawl4AI
BESCHREIBUNG
Crawl4AI ist ein leistungsstarker, KI-fähiger Webcrawler, der speziell für die LLM-Datenaufnahme und RAG-Pipelines entwickelt wurde. Er unterstützt adaptive Crawling-Heuristiken (Stopp, sobald genügend Informationen gesammelt wurden), strukturierte Markdown-Ausgabe und schnelle parallele Ausführung. Entwickelt für den Einsatz im großen Maßstab mit optionaler Docker-Bereitstellung und Framework-Integrationen.
Eigenschaften
- Adaptives KI-basiertes Crawling, das stoppt, wenn der Kontext ausreichend ist
- Gibt sauberes Markdown für die Aufnahme in LLM-Pipelines aus
- Extrahiert strukturierte Daten mit CSS/XPath oder LLM-gestützten Methoden
- Unterstützt Proxys, Stealth-Modi, Sitzungen, Hooks und Authentifizierung
- Leistungsstarkes, paralleles asynchrones Crawling mit Python-API
- Per Pip oder Docker implementierbar und aktiv gepflegt
Programmiersprache
Python
Kategorien
Diese Anwendung kann auch von https://sourceforge.net/projects/crawl4ai.mirror/ heruntergeladen werden. Sie wurde in OnWorks gehostet, um sie auf einfachste Weise online von einem unserer kostenlosen Betriebssysteme aus ausführen zu können.