Esta es la aplicación de Windows llamada crwlr, cuya última versión se puede descargar como v3.5.5sourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada crwlr con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie cualquier emulador en línea de OS OnWorks desde este sitio web, pero mejor emulador en línea de Windows.
- 5. Desde el sistema operativo OnWorks Windows que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación e instálala.
- 7. Descargue Wine desde los repositorios de software de sus distribuciones de Linux. Una vez instalada, puede hacer doble clic en la aplicación para ejecutarla con Wine. También puedes probar PlayOnLinux, una elegante interfaz sobre Wine que te ayudará a instalar programas y juegos populares de Windows.
Wine es una forma de ejecutar software de Windows en Linux, pero no requiere Windows. Wine es una capa de compatibilidad de Windows de código abierto que puede ejecutar programas de Windows directamente en cualquier escritorio de Linux. Esencialmente, Wine está tratando de volver a implementar una cantidad suficiente de Windows desde cero para poder ejecutar todas esas aplicaciones de Windows sin necesidad de Windows.
SCREENSHOTS
Ad
rastreador
DESCRIPCIÓN
Esta biblioteca proporciona una especie de marco y una gran cantidad de los llamados pasos listos para usar, que puede utilizar como bloques de construcción para crear sus propios rastreadores y raspadores. Antes de sumergirnos en la biblioteca, echemos un vistazo a los términos rastreo y raspado. Para la mayoría de los casos de uso del mundo real, esas dos cosas van de la mano, por lo que esta biblioteca ayuda y combina ambas. Un rastreador (web) es un programa que (descarga) documentos y sigue los enlaces que contienen para cargarlos también. Un rastreador podría simplemente cargar todos los enlaces que encuentre (y se le permite cargar de acuerdo con el archivo robots.txt), luego simplemente cargaría todo Internet (si las URL con las que comienza no son un callejón sin salida). O puede restringirse para cargar solo enlaces que coincidan con ciertos criterios (en el mismo dominio/host, la ruta URL comienza con "/foo",...) o solo hasta una cierta profundidad. Una profundidad de 3 significa 3 niveles de profundidad. Los enlaces que se encuentran en las URL iniciales proporcionadas al rastreador son de nivel 1 y así sucesivamente.
Caracteristicas
- Cortesía del rastreador (respetar el archivo robots.txt, acelerar,...)
- Obtenga enlaces absolutos de documentos HTML
- Obtenga mapas de sitio de robots.txt y obtenga todas las URL de esos mapas de sitio
- Rastrear (cargar) todas las páginas de un sitio web
- Utilice cualquier método HTTP (GET, POST,...) y envíe cualquier encabezado o cuerpo
- Iterar sobre páginas de listas paginadas
Lenguaje de programación
PHP
Categorías
Esta es una aplicación que también se puede obtener de https://sourceforge.net/projects/crwlr.mirror/. Ha sido alojado en OnWorks para poder ejecutarlo online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.