Це програма для Linux під назвою tika-python, останню версію якої можна завантажити як ApacheTika2.6.0Release.zip. Його можна запустити онлайн у безкоштовного хостинг-провайдера OnWorks для робочих станцій.
Завантажте та безкоштовно запустіть онлайн цю програму під назвою tika-python із OnWorks.
Дотримуйтесь цих інструкцій, щоб запустити цю програму:
- 1. Завантажив цю програму на свій ПК.
- 2. Введіть у наш файловий менеджер https://www.onworks.net/myfiles.php?username=XXXXX із потрібним ім'ям користувача.
- 3. Завантажте цю програму в такий файловий менеджер.
- 4. Запустіть онлайн-емулятор OnWorks Linux або Windows або онлайн-емулятор MACOS з цього веб-сайту.
- 5. З ОС OnWorks Linux, яку ви щойно запустили, перейдіть до нашого файлового менеджера https://www.onworks.net/myfiles.php?username=XXXXX з потрібним іменем користувача.
- 6. Завантажте програму, встановіть її та запустіть.
ЕКРАНИ
Ad
tika-python
ОПИС
Порт Python бібліотеки Apache Tika, що робить Tika доступним за допомогою сервера Tika REST. Це робить Apache Tika доступним як бібліотека Python, яку можна встановити за допомогою Setuptools, Pip і легко встановити. Щоб використовувати цю бібліотеку, у вашій системі потрібно встановити Java 7+, оскільки tika-python запускає сервер Tika REST у фоновому режимі. Щоб це працювало у відключеному середовищі, завантажте файл сервера tika (і tika-server.jar, і tika-server.jar.md5, які можна знайти тут) і встановіть для змінної середовища TIKA_SERVER_JAR значення TIKA_SERVER_JAR="file:// //tika-server.jar", який успішно повідомляє python-tika "завантажити" цей файл і перемістити його в /tmp/tika-server.jar і запустити як фоновий процес. Це єдиний спосіб запустити python-tika без доступу до Інтернету. Без цього набору за замовчуванням перевіряється версія tika та щоразу витягується остання версія з Apache.
риси
- Інтерфейс парсера (зворотне співставлення до REST)
- Інтерфейс аналізатора витягує текст і метадані за допомогою інтерфейсу /rmeta
- За бажанням ви можете передати URL-адресу сервера Tika разом із викликом, що корисно для багатоекземплярного виконання
- Укажіть вихідний формат для XHTML
- Інтерфейс розпакування обробляє як метадані, так і вилучення тексту за один виклик
- Внутрішньо повертає архів метаданих і текстових записів, який внутрішньо розпаковано
Мова програмування
Python
Категорії
Це програма, яку також можна завантажити з https://sourceforge.net/projects/tika-python.mirror/. Його розміщено в OnWorks, щоб його можна було найпростіше запускати онлайн з однієї з наших безкоштовних операційних систем.