To jest aplikacja dla systemu Linux o nazwie tika-python, której najnowszą wersję można pobrać jako ApacheTika2.6.0Release.zip. Można go uruchomić online w darmowym dostawcy usług hostingowych OnWorks dla stacji roboczych.
Pobierz i uruchom online tę aplikację o nazwie tika-python z OnWorks za darmo.
Postępuj zgodnie z tymi instrukcjami, aby uruchomić tę aplikację:
- 1. Pobrałem tę aplikację na swój komputer.
- 2. Wpisz w naszym menedżerze plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 3. Prześlij tę aplikację w takim menedżerze plików.
- 4. Uruchom emulator online OnWorks Linux lub Windows online lub emulator online MACOS z tej witryny.
- 5. W systemie operacyjnym OnWorks Linux, który właśnie uruchomiłeś, przejdź do naszego menedżera plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 6. Pobierz aplikację, zainstaluj ją i uruchom.
ZRZUTY EKRANU
Ad
tika-python
OPIS
Port Pythona biblioteki Apache Tika, który udostępnia Tika za pomocą Tika REST Server. To sprawia, że Apache Tika jest dostępna jako biblioteka Pythona, którą można zainstalować za pomocą Setuptools, Pip i jest łatwa w instalacji. Aby korzystać z tej biblioteki, musisz mieć zainstalowaną Javę 7+ w swoim systemie, ponieważ tika-python uruchamia serwer Tika REST w tle. Aby to działało w odłączonym środowisku, pobierz plik serwera tika (zarówno tika-server.jar, jak i tika-server.jar.md5, który można znaleźć tutaj) i ustaw zmienną środowiskową TIKA_SERVER_JAR na TIKA_SERVER_JAR="file:// //tika-server.jar”, który pomyślnie nakazuje python-tika „pobrać” ten plik i przenieść go do /tmp/tika-server.jar i uruchomić jako proces w tle. To jedyny sposób na uruchomienie python-tika bez dostępu do Internetu. Bez tego zestawu domyślnie sprawdzana jest wersja tika i pobierana za każdym razem najnowsza z Apache.
Funkcjonalności
- Interfejs parsera (kompatybilność wsteczna przed REST)
- Interfejs parsera wyodrębnia tekst i metadane za pomocą interfejsu /rmeta
- Opcjonalnie możesz przekazać adres URL serwera Tika wraz z wywołaniem, co jest przydatne do wykonywania wielu instancji
- Określ format wyjściowy na XHTML
- Interfejs rozpakowywania obsługuje zarówno metadane, jak i wyodrębnianie tekstu w jednym wywołaniu
- Wewnętrznie zwraca paczkę metadanych i wpisów tekstowych, która jest wewnętrznie rozpakowana
Język programowania
Python
Kategorie
Jest to aplikacja, którą można również pobrać z https://sourceforge.net/projects/tika-python.mirror/. Został umieszczony w OnWorks, aby można go było uruchomić online w najprostszy sposób z jednego z naszych bezpłatnych systemów operacyjnych.