GoGPT Best VPN GoSearch

OnWorks 网站图标

适用于 Linux 的 tika-python 下载

免费下载 tika-python Linux 应用程序以在 Ubuntu 在线、Fedora 在线或 Debian 在线中在线运行

这是名为 tika-python 的 Linux 应用程序,其最新版本可以作为 ApacheTika2.6.0Release.zip 下载。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。

使用 OnWorks 免费下载并在线运行这个名为 tika-python 的应用程序。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。

- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序,安装并运行。

SCREENSHOTS

Ad


提卡蟒蛇


商品描述

Apache Tika 库的 Python 端口,使用 Tika REST 服务器使 Tika 可用。 这使得 Apache Tika 可以作为 Python 库使用,可以通过 Setuptools、Pip 安装并且易于安装。 要使用此库,您需要在系统上安装 Java 7+,因为 tika-python 在后台启动 Tika REST 服务器。 要使其在断开连接的环境中工作,请下载一个 tika 服务器文件(tika-server.jar 和 tika-server.jar.md5,可以在此处找到)并将 TIKA_SERVER_JAR 环境变量设置为 TIKA_SERVER_JAR="file:// //tika-server.jar”,它成功地告诉 python-tika “下载”这个文件并将其移动到 /tmp/tika-server.jar 并作为后台进程运行。 这是在没有互联网访问的情况下运行 python-tika 的唯一方法。 如果没有这个设置,默认是检查 tika 版本并每次从 Apache 中拉取最新版本。



功能

  • 解析器接口(在 REST 之前向后兼容)
  • 解析器接口使用 /rmeta 接口提取文本和元数据
  • 或者,您可以传递 Tika 服务器 URL 以及对多实例执行有用的调用
  • 指定 XHTML 的输出格式
  • 解包接口在一次调用中处理元数据和文本提取
  • 内部返回内部解压的元数据和文本条目的 tarball


程式语言

Python


分类

文本处理、医疗保健、机器学习

这是一个也可以从 https://sourceforge.net/projects/tika-python.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便以最简单的方式从我们的免费操作系统之一在线运行。


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。