这是名为 Ex-Crawler 的 Linux 应用程序,其最新版本可以作为 ex-crawler-server-0.1.6-jar.zip 下载。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行这个名为 Ex-Crawler 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
前爬行者
商品描述
Ex-Crawler分为3个子项目(Crawler Daemon、分布式gui Client、(web)搜索引擎),共同提供了一个灵活强大的支持分布式计算的搜索引擎。 更多信息: http://ex-crawler.sourceforge.net特性
- 用 Java 编写的快速网络和图像爬虫,它会根据优先级算法自动跟踪新链接,并且可以一天 24 小时运行。
- 使用 MySQL、MSSQL、PostgreSQL 甚至 SQLlite 数据库来存储信息
- 带有 Web 前端搜索引擎、直接网站分析等(开发中 - SVN)
- 支持非高级用户的图形前端分布式爬虫(svn 中的 de.excrawler.distributed.client)
- 带有自己的服务器,您可以在其中添加新站点以及更多内容,包括 UserManagement 等。
- 自带插件界面,您可以轻松添加自己的功能
- 其他定制化方案
目的
高级最终用户、开发人员、教育、最终用户/桌面、科学/研究、系统管理员
程式语言
爪哇,PHP
数据库环境
JDBC、Microsoft SQL Server、MySQL、PostgreSQL (pgsql)、SQLite
这是一个也可以从 https://sourceforge.net/projects/ex-crawler/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。