Esta es la aplicación para Linux llamada Scrapy, cuya última versión se puede descargar como 2.13.3sourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Scrapy con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
SCREENSHOTS
Ad
Scrapy
DESCRIPCIÓN
Scrapy es un marco rápido, de código abierto y de alto nivel para rastrear sitios web y extraer datos estructurados de estos sitios web. Portátil y escrito en Python, puede ejecutarse en Windows, Linux, macOS y BSD.
Scrapy es potente, rápido y simple, y también fácilmente extensible. Simplemente escriba las reglas para extraer los datos y agregue una nueva funcionalidad si lo desea sin tener que tocar el núcleo. Scrapy hace el resto y se puede utilizar en varias aplicaciones. Puede usarse para minería de datos, monitoreo y pruebas automatizadas.
Caracteristicas
- Soporte integrado para la selección y extracción de datos de fuentes HTML / XML a través de expresiones XPath extendidas y selectores CSS, con métodos auxiliares para extraer usando expresiones regulares
- Consola de shell interactiva para usar CSS y expresiones XPath para extraer datos
- Soporte incorporado para generar exportaciones de feeds en varios formatos diferentes (JSON, XML, CSV) y su almacenamiento en varios backends (S3, FTP, sistema de archivos local)
- Soporte para codificación y detección automática
- Fuerte soporte de extensibilidad
- Un montón de extensiones integradas y middlewares para cookies y manejo de sesiones, robots.txt, restricción de profundidad de rastreo y más
- Consola Telnet para conectarse a una consola Python que se ejecuta dentro de su proceso Scrapy
- Arañas reutilizables, canalización de medios, resolución de DNS de almacenamiento en caché y más
Lenguaje de programación
Python
Categorías
Esta es una aplicación que también se puede obtener de https://sourceforge.net/projects/scrapy.mirror/. Se ha alojado en OnWorks para poder ejecutarlo online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.