这是名为 Grab Framework Project 的 Linux 应用程序,其最新版本可以下载为 grabv1.2.0sourcecode.zip。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
免费在线下载并运行这个名为 Grab Framework Project with OnWorks 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
抓取框架项目
商品描述
Grab 是一个用于构建网络抓取工具的 Python 框架。 使用 Grab,您可以构建各种复杂的网络爬虫,从简单的 5 行脚本到处理数百万网页的复杂异步网站爬虫。 Grab 提供了一个 API 来执行网络请求和处理接收到的内容,例如与 HTML 文档的 DOM 树交互。 单一请求/响应 API,允许您构建网络请求、执行它并处理接收到的内容。 API 建立在 urllib3 和 lxml 库之上。 用于构建异步网络爬虫的 Spider API。 您编写类来为每种类型的网络请求定义处理程序。 每个处理程序都能够产生新的网络请求。 网络请求与异步网络套接字池并发处理。 Grab 提供称为 Spider 的接口来开发多线程网站抓取工具。
功能
- 自动 cookies(会话)支持
- 带/不带身份验证的 HTTPS/SOCKS 代理支持
- 国际化域名支持
- 使用 Web 表单的工具
- 简单的多部分文件上传
- 灵活定制HTTP请求
程式语言
Python
分类
这是一个也可以从 https://sourceforge.net/projects/grab-framework-project.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便以最简单的方式从我们的免费操作系统之一在线运行。