Este é o aplicativo do Windows chamado webStraktor cuja versão mais recente pode ser baixada como webStraktor-20140420-R01.zip. Ele pode ser executado online no provedor de hospedagem gratuito OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado webStraktor com OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie qualquer emulador on-line OS OnWorks a partir deste site, mas um emulador on-line melhor do Windows.
- 5. No sistema operacional OnWorks Windows que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo e instale-o.
- 7. Baixe o Wine de seus repositórios de software de distribuição Linux. Depois de instalado, você pode clicar duas vezes no aplicativo para executá-lo com o Wine. Você também pode experimentar o PlayOnLinux, uma interface sofisticada do Wine que o ajudará a instalar programas e jogos populares do Windows.
Wine é uma forma de executar software Windows no Linux, mas sem a necessidade de Windows. Wine é uma camada de compatibilidade do Windows de código aberto que pode executar programas do Windows diretamente em qualquer desktop Linux. Essencialmente, o Wine está tentando reimplementar o suficiente do Windows do zero para que possa executar todos os aplicativos do Windows sem realmente precisar do Windows.
SCREENSHOTS
Ad
web Straktor
DESCRIÇÃO
webStraktor é um cliente programável de extração de dados da World Wide Web. Seu objetivo é extrair conteúdo baseado em HTML por meio do protocolo HTTP e extrair informações relevantes. O webStraktor possui uma linguagem de script para facilitar a coleta, a extração e o armazenamento das informações disponíveis na web, inclusive imagens. A linguagem de script usa elementos da Expressão Regular e sintaxe xPath. A linguagem de script webStraktor possui um pequeno conjunto de instruções e sua sintaxe é fácil de dominar.
O formato de saída padrão do webStraktor é baseado em XML, em páginas de código ASCII, UTF-8 ou ISO-8859-1 (Latin1).
webStraktor depende do Apache HttpClient para recuperar conteúdo por meio do protocolo HTTP. Ele adere ao Protocolo de Exclusão de Robôs e pode ser configurado para operar de forma anônima conectando-se aos tipos predominantes de servidores proxy da web.
O webStraktor estende a funcionalidade de rastreadores da web, spiders ou bots, integrando recursos de raspagem e rastreamento.
Recursos
- rastreador da web programável (web spider ou web bot)
- linguagem de script fácil de dominar
- ambiente de desenvolvimento gráfico baseado em java swing
- Saída UTF8 ou ISO-8859-1 XML
- integra-se com aplicativos de agendamento prontamente disponíveis
- configuração exaustiva
- suporte para servidor proxy da web
- suporte de protocolo de exclusão de robô
- assinatura configurável do agente de usuário
- tutorial passo a passo e scripts de exemplo
- Baseado em Apache HttpClient
Público
Desenvolvedores, arquitetos
Interface com o usuário
Java swing
Linguagem de Programação
Java
Ambiente de Banco de Dados
Baseado em XML
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/webstraktor/. Ele foi hospedado no OnWorks para ser executado online da maneira mais fácil a partir de um de nossos Sistemas Operativos gratuitos.





