这是名为crawlee的Linux应用程序,其最新版本可以作为v3.5.8sourcecode.zip下载。 它可以在免费的工作站托管提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行这个名为crawlee的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
爬行者
商品描述
Crawlee 是一个网页抓取和浏览器自动化库。 它可以帮助您构建可靠的爬虫。 快速地。 Crawlee 不会为您修复损坏的选择器(目前),但它可以帮助您更快地构建和维护爬虫。 当网站添加 JavaScript 渲染时,您不必重写所有内容,只需切换到其中一种浏览器爬虫即可。 当您稍后找到一个很棒的 API 来加速您的爬行时,请将开关翻转回来。 它通过智能地旋转代理和良好的指纹来保持代理的健康,使您的爬虫看起来像人类。 它不是不可解锁的,但从长远来看它会为你省钱。 Crawlee 是由那些靠爬取谋生并每天使用它来爬取数百万页的人创建的。 在 Discord 上认识我们的社区。 我们相信网站最好用其编写的语言进行抓取。Crawlee 在 Node.js 上运行,并且它内置于 TypeScript 中,以改进 IDE 中的代码完成,即使您自己不使用 TypeScript 也是如此。
特征
- JavaScript 和 TypeScript
- HTTP 抓取
- 无头浏览器
- 自动缩放和代理管理
- 队列和存储
- 有用的实用程序和可配置性
程式语言
打字稿
分类目录
这是一个也可以从 https://sourceforge.net/projects/crawlee.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。