这是名为 Crawl4AI 的 Linux 应用,其最新版本可下载为 Releasev0.7.4sourcecode.tar.gz。它可在免费的工作站托管服务提供商 OnWorks 上在线运行。
使用 OnWorks 免费下载并在线运行此名为 Crawl4AI 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
Crawl4AI
商品描述
Crawl4AI 是一款高性能、AI 就绪的网络爬虫,专为 LLM 数据提取和 RAG 流水线量身定制。它支持自适应启发式爬取(收集到足够信息后停止)、结构化 Markdown 输出和高速并行执行。它旨在通过可选的 Docker 部署和框架集成实现大规模运行。
功能
- 自适应人工智能感知爬取,当上下文足够时停止
- 输出干净的 Markdown 以供 LLM 管道提取
- 使用 CSS/XPath 或 LLM 辅助方法提取结构化数据
- 支持代理、隐身模式、会话、钩子和身份验证
- 使用 Python API 进行高性能、并行异步爬取
- 可通过 pip 或 Docker 部署并积极维护
程式语言
Python
分类
此应用程序也可从 https://sourceforge.net/projects/crawl4ai.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。