这是名为 crwlr 的 Windows 应用程序,其最新版本可以作为 v1.2.2.zip 下载。 它可以在免费的工作站托管提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行这个名为 crwlr 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从本网站启动任何 OS OnWorks 在线模拟器,但更好的 Windows 在线模拟器。
- 5. 从您刚刚启动的 OnWorks Windows 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序并安装。
- 7. 从您的 Linux 发行版软件存储库下载 Wine。 安装后,您可以双击该应用程序以使用 Wine 运行它们。 您还可以尝试 PlayOnLinux,这是 Wine 上的一个花哨界面,可帮助您安装流行的 Windows 程序和游戏。
Wine 是一种在 Linux 上运行 Windows 软件的方法,但不需要 Windows。 Wine 是一个开源的 Windows 兼容层,可以直接在任何 Linux 桌面上运行 Windows 程序。 本质上,Wine 试图从头开始重新实现足够多的 Windows,以便它可以运行所有这些 Windows 应用程序,而实际上不需要 Windows。
SCREENSHOTS
Ad
爬行者
商品描述
该库提供了一种框架和许多随时可用的所谓步骤,您可以将其用作构建块,以构建您自己的爬虫和抓取器。 在深入了解库之前,让我们先看一下术语“爬行”和“抓取”。 对于大多数现实世界的用例,这两件事是齐头并进的,这就是为什么这个库帮助并将两者结合起来的原因。 (网络)爬虫是一种(下载)加载文档并按照其中的链接加载文档的程序。 爬虫实际上可以加载它找到的所有链接(并且允许根据 robots.txt 文件加载),然后它只会加载整个互联网(如果它开头的 URL 没有死胡同)。 或者可以限制为仅加载符合特定条件的链接(在同一域/主机上,URL 路径以“/foo”开头,...)或仅加载到特定深度。 深度 3 表示 3 层深。 在提供给爬虫的初始 URL 上找到的链接为级别 1,依此类推。
特性
- 爬虫礼貌(尊重robots.txt,限制,...)
- 从 HTML 文档获取绝对链接
- 从 robots.txt 获取站点地图并从这些站点地图获取所有 URL
- 抓取(加载)网站的所有页面
- 使用任何 HTTP 方法(GET、POST...)并发送任何标头或正文
- 迭代分页列表页面
程式语言
PHP
分类
这是一个也可以从 https://sourceforge.net/projects/crwlr.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。