Dies ist die Linux-App namens tika-python, deren neueste Version als ApacheTika2.6.0Release.zip heruntergeladen werden kann. Es kann online im kostenlosen Hosting-Anbieter OnWorks für Workstations betrieben werden.
Laden Sie diese App namens tika-python mit OnWorks kostenlos herunter und führen Sie sie online aus.
Befolgen Sie diese Anweisungen, um diese App auszuführen:
- 1. Diese Anwendung auf Ihren PC heruntergeladen.
- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.
- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.
- 4. Starten Sie den OnWorks Linux-Online- oder Windows-Online-Emulator oder den MACOS-Online-Emulator von dieser Website.
- 5. Rufen Sie vom gerade gestarteten OnWorks Linux-Betriebssystem aus unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.
- 6. Laden Sie die Anwendung herunter, installieren Sie sie und führen Sie sie aus.
SCREENSHOTS
Ad
Tika-Python
BESCHREIBUNG
Ein Python-Port der Apache Tika-Bibliothek, die Tika über den Tika-REST-Server verfügbar macht. Damit ist Apache Tika als Python-Bibliothek verfügbar, installierbar über Setuptools, Pip und einfach zu installieren. Um diese Bibliothek verwenden zu können, muss Java 7+ auf Ihrem System installiert sein, da tika-python den Tika-REST-Server im Hintergrund startet. Damit dies in einer nicht verbundenen Umgebung funktioniert, laden Sie eine tika-Serverdatei herunter (sowohl tika-server.jar als auch tika-server.jar.md5, die Sie hier finden können) und setzen Sie die Umgebungsvariable TIKA_SERVER_JAR auf TIKA_SERVER_JAR="file:// //tika-server.jar", wodurch python-tika erfolgreich angewiesen wird, diese Datei "herunterzuladen", sie nach /tmp/tika-server.jar zu verschieben und als Hintergrundprozess auszuführen. Dies ist die einzige Möglichkeit, python-tika ohne Internetzugang auszuführen. Ohne dieses Set wird standardmäßig die Tika-Version überprüft und jedes Mal die neueste Version von Apache abgerufen.
Eigenschaften
- Parser Interface (abwärtskompatibel vor REST)
- Die Parser-Schnittstelle extrahiert Text und Metadaten mithilfe der /rmeta-Schnittstelle
- Optional können Sie die Tika-Server-URL zusammen mit dem Aufruf übergeben, was für die Ausführung mehrerer Instanzen nützlich ist
- Geben Sie das Ausgabeformat in XHTML an
- Die Entpackungsschnittstelle verarbeitet sowohl Metadaten- als auch Textextraktion in einem einzigen Aufruf
- Gibt intern einen Tarball von Metadaten und Texteinträgen zurück, der intern entpackt ist
Programmiersprache
Python
Kategorien
Dies ist eine Anwendung, die auch von https://sourceforge.net/projects/tika-python.mirror/ abgerufen werden kann. Es wurde in OnWorks gehostet, damit es auf einfachste Weise online von einem unserer kostenlosen Betriebssysteme ausgeführt werden kann.