Đây là ứng dụng Linux có tên tika-python có bản phát hành mới nhất có thể tải xuống dưới dạng ApacheTika2.6.0Release.zip. Nó có thể được chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng này có tên tika-python với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MÀN HÌNH
Ad
tika-trăn
MÔ TẢ
Một cổng Python của thư viện Apache Tika giúp cung cấp Tika bằng cách sử dụng Máy chủ Tika REST. Điều này làm cho Apache Tika có sẵn dưới dạng thư viện Python, có thể cài đặt qua Setuptools, Pip và dễ cài đặt. Để sử dụng thư viện này, bạn cần cài đặt Java 7+ trên hệ thống của mình khi tika-python khởi động máy chủ Tika REST trong nền. Để tính năng này hoạt động trong môi trường bị ngắt kết nối, hãy tải xuống tệp máy chủ tika (cả tika-server.jar và tika-server.jar.md5, có thể tìm thấy tại đây) và đặt biến môi trường TIKA_SERVER_JAR thành TIKA_SERVER_JAR="file:// //tika-server.jar" yêu cầu thành công python-tika "tải xuống" tệp này và chuyển tệp đó sang /tmp/tika-server.jar và chạy dưới dạng quy trình nền. Đây là cách duy nhất để chạy python-tika mà không cần truy cập internet. Nếu không có bộ này, mặc định là kiểm tra phiên bản tika và lấy bản mới nhất mọi lúc từ Apache.
Tính năng
- Giao diện trình phân tích cú pháp (tương thích ngược trước REST)
- Giao diện trình phân tích cú pháp trích xuất văn bản và siêu dữ liệu bằng giao diện /rmeta
- Theo tùy chọn, bạn có thể chuyển URL máy chủ Tika cùng với lệnh gọi hữu ích cho việc thực thi nhiều phiên bản
- Chỉ định định dạng đầu ra cho XHTML
- Giao diện giải nén xử lý cả siêu dữ liệu và trích xuất văn bản trong một lần gọi
- Nội bộ trả lại một tarball siêu dữ liệu và các mục nhập văn bản được giải nén bên trong
Ngôn ngữ lập trình
Python
Danh Mục
Đây là một ứng dụng cũng có thể được tìm nạp từ https://sourceforge.net/projects/tika-python.mirror/. Nó đã được lưu trữ trong OnWorks để có thể chạy trực tuyến theo cách dễ dàng nhất từ một trong các Hệ điều hành miễn phí của chúng tôi.