Este é o aplicativo Linux chamado tika-python cuja versão mais recente pode ser baixada como ApacheTika2.6.0Release.zip. Ele pode ser executado online no provedor de hospedagem gratuito OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado tika-python com OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie o emulador OnWorks Linux online ou Windows online ou emulador MACOS online a partir deste site.
- 5. No sistema operacional OnWorks Linux que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo, instale-o e execute-o.
SCREENSHOTS
Ad
tika-python
DESCRIÇÃO
Uma porta Python da biblioteca Apache Tika que disponibiliza o Tika usando o Tika REST Server. Isso torna o Apache Tika disponível como uma biblioteca Python, instalável via Setuptools, Pip e fácil de instalar. Para usar esta biblioteca, você precisa ter o Java 7+ instalado em seu sistema, pois o tika-python inicia o servidor Tika REST em segundo plano. Para fazer isso funcionar em um ambiente desconectado, baixe um arquivo do servidor tika (tika-server.jar e tika-server.jar.md5, que podem ser encontrados aqui) e defina a variável de ambiente TIKA_SERVER_JAR como TIKA_SERVER_JAR="file:// //tika-server.jar" que diz ao python-tika para "baixar" este arquivo e movê-lo para /tmp/tika-server.jar e executar como um processo em segundo plano. Esta é a única maneira de executar o python-tika sem acesso à Internet. Sem esse conjunto, o padrão é verificar a versão do tika e extrair sempre a versão mais recente do Apache.
Recursos
- Interface do analisador (compatibilidade anterior ao REST)
- A interface do analisador extrai texto e metadados usando a interface /rmeta
- Opcionalmente, você pode passar o URL do servidor Tika junto com a chamada, o que é útil para execução de várias instâncias
- Especifique o formato de saída para XHTML
- A interface de descompactação lida com metadados e extração de texto em uma única chamada
- Retorna internamente um tarball de metadados e entradas de texto que são descompactadas internamente
Linguagem de Programação
Python
Categorias
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/tika-python.mirror/. Ele foi hospedado em OnWorks para ser executado online da maneira mais fácil a partir de um de nossos Sistemas Operativos gratuitos.