GoGPT Best VPN GoSearch

icono de página de OnWorks

pwget - Online en la nube

Ejecute pwget en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando pwget que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


pwget - Programa de recuperación de URL web de Perl

SINOPSIS


pwget http://example.com/ [URL...]
pwget --config $ HOME / config / pwget.conf --Tag linux --Tag emacs ..
pwget --verbose --sobreescribir http://example.com/
pwget --verbose --overwrite --Salida ~ / dir / http://example.com/
pwget --nuevo --sobrescribir http://example.com/package-1.1.tar.gz

DESCRIPCIÓN


Automatice las descargas periódicas de archivos y paquetes.

Si recupera las últimas versiones de ciertos bloques de programa periódicamente, este es el Perl
guión para ti. Ejecutar desde el trabajo cron o una vez a la semana para cargar las versiones más recientes de los archivos.
la red. Nota:

Obtener y este vídeo programa
En este punto, puede preguntarse, ¿dónde necesitaría este programa de Perl cuando wget(1)
El programa C ha sido el estándar durante años. Bueno, 1) Perl es multiplataforma y más fácil
ampliable 2) Puede registrar los criterios de descarga de archivos en un archivo de configuración y usar perl
epxressions regulares para seleccionar descargas 3) el programa puede analizar páginas web y "buscar"
para los enlaces de descarga solo como se indica 4) por último, pero no menos importante, puede rastrear los más nuevos
paquetes cuyo nombre ha cambiado desde la última descarga. Hay heurísticas para determinar la
archivo o paquete más reciente de acuerdo con el esqueleto del nombre de archivo definido en la configuración.

Este programa no reemplaza pwget(1) porque no ofrece tantas opciones como wget,
como descargas recursivas y comparación de fechas. Utilice wget para descargas ad hoc y esto
utilidad para archivos que cambian (nuevas versiones de archivos) o que supervisa
periódicamente

Short introducción
Esta pequeña utilidad permite mantener una lista de URL en un archivo de configuración y
recuperar periódicamente esas páginas o archivos con comandos sencillos. Esta utilidad es la mejor
adecuado para pequeños trabajos por lotes para descargar, por ejemplo, las versiones más recientes de archivos de software. Si
utiliza una URL que ya está en el disco, asegúrese de proporcionar la opción --Sobrescribir para permitir
sobrescribir archivos existentes.

Si bien puede ejecutar este programa desde la línea de comandos para recuperar archivos individuales, el programa tiene
ha sido diseñado para utilizar un archivo de configuración independiente a través de --config opción. En la configuración
archivo puede controlar la descarga con directivas separadas como "guardar:" que le dice a
guarde el archivo con un nombre diferente. La forma más sencilla de recuperar la última versión de
un paquete de un sitio FTP es:

pwget --nuevo --overwite --verbose \
http://www.example.com/package-1.00.tar.gz

No se preocupe por el nombre de archivo "paquete-1.00.tar.gz". La última versión, digamos,
Se recuperará "package-3.08.tar.gz". La opción --nuevo indica que busque una versión más nueva
que la URL proporcionada.

Si la URL termina en una barra, entonces la lista de directorios en la máquina remota se almacena en el archivo:

! ruta! 000 archivo-raíz

El contenido de este archivo puede ser index.html o el listado del directorio según
el protocolo http o ftp utilizado.

OPCIONES


-UN, --regexp-contenido REGEXP
Analice el contenido del archivo y haga coincidir REGEXP. Solo si la expresión regular coincide con el archivo
contenido, luego descargue el archivo. Esta opción hará que las descargas sean lentas, porque el archivo está
leer en la memoria como una sola línea y luego se busca una coincidencia con el contenido.

Por ejemplo, para descargar el archivo lisp de Emacs (.el) escrito por el Sr. Foo en caso de que no se distinga entre mayúsculas y minúsculas
manera:

pwget -v -R '\ .el $' -A "(? i) Autor: Mr. Foo" \
http://www.emacswiki.org/elisp/index.html

-VS, --crear-caminos
Cree rutas que no existan en las directivas "lcd:".

De forma predeterminada, cualquier directiva LCD a un directorio no existente interrumpirá el programa. Con
esta opción, los directorios locales se crean según sea necesario, lo que permite volver a crear
la estructura exacta tal como está en el archivo de configuración.

-C, --config ARCHIVO
Esta opción se puede dar varias veces. Se leen todas las configuraciones.

Leer URL del archivo de configuración. Si no se proporciona un archivo de configuración, el archivo apuntado por
se lee la variable de entorno. Ver MEDIO AMBIENTE.

El diseño del archivo de configuración se describe en la sección ARCHIVO DE CONFIGURACIÓN

--chdir De miembros
Hacer un chdir () al DIRECTORIO antes de que comience la descarga de la URL. Esto es como hacer:

cd DIRECTORIO
pwget http://example.com/index.html

-D, --depurar [NIVEL]
Active la depuración con un número de NIVEL positivo. Cero significa que no hay depuración. Esta opción se enciende
--verboso

-mi, --extraer
Desempaquete los archivos después de recuperarlos. El comando para descomprimir archivos de almacenamiento típicos
se definen en un programa. Asegúrese de que estos programas estén a lo largo del camino. Los usuarios de Win32 son
Se recomienda instalar las utilidades Cygwin donde estos programas son estándar. Referir
a la sección VER TAMBIÉN.

.tar => alquitrán
.tgz => tar + gzip
.gz => gzip
.bz2 => bzip2
.zip => descomprimir

-F, - cortafuegos FIREWALL
Utilice FIREWALL cuando acceda a archivos a través del protocolo ftp: //.

-h, --ayuda
Imprima la página de ayuda en texto.

--ayuda-html
Imprime la página de ayuda en HTML.

--ayuda
Imprima la página de ayuda en formato de página de manual de Unix. Quiere alimentar esta salida a c
-man> para poder leerlo.

Imprime la página de ayuda.

-metro, --espejo SITIO
Si la URL apunta al área de descarga de Sourcefoge, use el SITE espejo para la descarga.
Alternativamente, la URL completa y completa puede incluir la información del espejo. Y ejemplo:

--espejo kent http://downloads.sourceforge.net/foo/foo-1.0.0.tar.gz

-norte, --nuevo
Obtenga el archivo más reciente. Esto se aplica a los archivos de datos, que no tienen extensión .asp o .html.
Cuando se anuncian nuevas versiones, el número de versión en el nombre del archivo generalmente indica cuál es
el actual, por lo que se obtiene un archivo codificado con:

pwget-o-v http://example.com/dir/program-1.3.tar.gz

no suele ser práctico desde el punto de vista de la automatización. Añadiendo --nuevo opción a la
la línea de comando causa doble paso: a) el conjunto http://example.com/dir/ es examinado para
todos los archivos yb) los archivos que coinciden aproximadamente con el nombre de archivo programa-1.3.tar.gz son
examinado, ordenado heurísticamente y se recupera el archivo con el número de versión más reciente.

--sin-lcd
Ignore las directivas "lcd:" en el archivo de configuración.

En el archivo de configuración, todas las directivas "lcd:" se obedecen tal como se ven. Pero si
si desea recuperar la URL de su directorio actual, asegúrese de proporcionar esta opción.
De lo contrario, el archivo terminará en el puntero del directorio con "lcd:".

--no guardar
Ignore las directivas "save:" en el archivo de configuración. Si las URL tienen opciones "guardar:",
se ignoran durante la recuperación. Normalmente quieres combinar --sin-lcd con --no guardar

--no extraer
Ignore las directivas "x:" en el archivo de configuración.

-Oh, --producción DIR
Antes de recuperar cualquier archivo, chdir a DIR.

-Oh, --Sobrescribir
Permitir sobrescribir archivos existentes al recuperar URL. Combina esto con
--versión de salto si actualiza archivos periódicamente.

--apoderado PROXY
Utilice el servidor PROXY para HTTP. (Ver - Cortafuegos para FTP.). El número de puerto es opcional en
la llamada:

--apoderado http://example.com.proxy.com
--proxy ejemplo.com.proxy.com:8080

-pag, --prefijo PREFIJO
Agregue PREFIX a todos los archivos recuperados.

-PAG, --sufijo SUFIJO
Agregue POSTFIX a todos los archivos recuperados.

-RE, --prefijo-fecha
Agregue el prefijo iso8601 ": AAAA-MM-DD" a todos los archivos recuperados. Esto se agrega antes de que sea posible
--prefijo-www or --prefijo.

-W, --prefijo-www
Por lo general, los archivos se almacenan con el mismo nombre que en el directorio de URL, pero si recupera
archivos que tienen nombres idénticos, puede almacenar cada página por separado para que el archivo
El nombre tiene como prefijo el nombre del sitio.

http://example.com/page.html -> example.com::page.html
http://example2.com/page.html -> example2.com::page.html

-r, --expresa regular REGEXP
Recupere la coincidencia de archivos en el sitio de la URL de destino. Esto es como "Conectarse a la URL
y obtener todos los archivos que coincidan con REGEXP ". Aquí todos los archivos comprimidos gzip se encuentran desde HTTP
directorio del servidor:

pwget -v -R "\ .gz" http://example.com/archive/

-R, --config-regexp REGEXP
Recupere las URL que coinciden con REGEXP del archivo de configuración. Esto cancela --Etiqueta opciones en
la línea de comando.

-s, --autotest
Ejecute algunas pruebas internas. Solo para mantenedor o desarrollador.

--dormir SEGUNDOS
Duerme SEGUNDOS antes de la próxima solicitud de URL. Cuando se utilizan descargas basadas en expresiones regulares que pueden
devuelven muchas visitas, algunos sitios no permiten solicitudes sucesivas en un corto período de tiempo
tiempo. Esta opción hace que el programa duerma durante varios SEGUNDOS entre recuperaciones para
superar "Servicio no disponible".

--salida estándar
Recupere la URL y escriba en stdout.

--versión de salto
No descargue archivos que tengan número de versión y que ya existan en el disco.
Suponga que tiene estos archivos y usa la opción --versión de salto:

paquete.tar.gz
archivo-1.1.tar.gz

Solo se recupera file.txt, porque file-1.1.tar.gz contiene el número de versión y el
El archivo no ha cambiado desde la última recuperación. La idea es que en cada lanzamiento el
número en la distribución aumenta, pero puede haber distribuciones que no
contener el número de versión. En intervalos regulares, es posible que desee cargar esos paquetes
de nuevo, pero omita los archivos versionados. En resumen: esta opción no tiene mucho sentido
sin opción adicional --nuevo

Si desea volver a cargar el archivo versionado, agregue la opción --Sobrescribir.

-t, --prueba, - corrida en seco
Ejecutar en modo de prueba.

-T, --etiqueta NOMBRE [NOMBRE] ...
Busque la etiqueta NAME en el archivo de configuración y descargue solo las entradas definidas en esa etiqueta.
Consulte --config ARCHIVO descripción de la opción. Puedes dar varios --Etiqueta interruptores.
Combinando esta opción con --expresa regular no tiene sentido y las concecuencias son
indefinido.

-v, --verboso [NÚMERO]
Imprima mensajes detallados.

-V, --versión
Imprime la información de la versión.

EJEMPLOS


Obtener archivos del sitio:

pwget http://www.example.com/dir/package.tar.gz ..

Muestra el archivo de copyright para el paquete GNU make desde las páginas de Debian:

pwget --stdout --regexp 'copyright $' http://packages.debian.org/unstable/make

Obtenga todos los archivos de almacenamiento de la lista de correo que coincidan con "gz":

pwget --regexpgz http://example.com/mailing-list/archive/download/

Lea un directorio y guárdelo con el nombre de archivo AAAA-MM-DD ::! Dir! 000root-file.

pwget --prefix-date --sobrescribir --verbose http://www.example.com/dir/

Para actualizar la versión más reciente del paquete, pero solo si ya no hay ninguno en el disco. los
--nuevo La opción indica que busque paquetes más nuevos y el nombre del archivo solo se usa como un esqueleto
para buscar archivos:

pwget --overwrite --skip-version --new --verbose \
ftp://ftp.ejemplo.com/dir/paquete-1.23.tar.gz

Para sobrescribir el archivo y agregar un prefijo de fecha al nombre del archivo:

pwget --prefix-date --overwrite --verbose \
http://www.example.com/file.pl

-> AAAA-MM-DD :: archivo.pl

Para agregar la fecha y el prefijo del sitio WWW a los nombres de archivo:

pwget --prefix-date --prefix-www --overwrite --verbose \
http://www.example.com/file.pl

-> AAAA-MM-DD :: www.example.com :: archivo.pl

Obtenga todos los archivos actualizados en las actualizaciones de etiquetas del archivo de configuración:

pwget --verbose --overwrite --skip-version --new - Actualizaciones de etiquetas
pwget -v -o -s -n -T actualizaciones

Obtener archivos a medida que leen en el archivo de configuración en el directorio actual, ignorando cualquier
Directivas "lcd:" y "save:":

pwget --config $ INICIO / config / pwget.conf /
--no-lcd --no-save --overwrite --verbose \
http://www.example.com/file.pl

Para verificar el archivo de configuración, ejecute el programa con expresiones regulares que no coincidan y este analiza el
archivo y verifica las directivas "lcd:" en el camino:

pwget -v -r expresión regular ficticia

->

pwget.DirectiveLcd: LCD [$ EUSR / directorio ...]
no es un directorio en / users / foo / bin / pwget línea 889.

CONFIGURACIÓN ARCHIVO


Comentarios
El archivo de configuración NO es código Perl. Los comentarios comienzan con el carácter de almohadilla (#).

Variables
En este punto, las expansiones de variables ocurren solo en LCD:. No intentes usarlos en ningún lado.
de lo contrario, como en las URL.

Variables de ruta para LCD: se definen utilizando la siguiente notación, los espacios no están permitidos en
Parte VALOR (sin nombres de directorio con espacios). Los nombres variables distinguen entre mayúsculas y minúsculas. Variables
Sustituir por variabales de entorno con el mismo nombre. Las variables de entorno son
Inmediatamente disponible.

VARIABLE = / home / my / dir # define variable
VARIABLE = $ dir / some / file # Usar variable definida previamente
FTP = $ HOME / ftp # Usar variable de entorno

La mano derecha puede referirse a variables previamente definidas o al entorno existente.
variables. Repito, este no es un código Perl, aunque puede parecer uno, sino solo un
sintaxis permitida en el archivo de configuración. Observe que hay un dólar a la derecha>
cuando se hace referencia a la variable, pero no hay ningún dólar en el lado izquierdo cuando se define la variable.
A continuación se muestra un ejemplo de un posible archivo de configuración contant. Las etiquetas están jerárquicamente
ordenado sin límite.

Advertencia: recuerde utilizar diferentes nombres de variables en archivos de inclusión separados. Todos
las variables son globales.

Incluir archivos
Es posible incluir más archivos de configuración con declaración

INCLUIR

Son posibles ampliaciones variables en el nombre del archivo. No hay límite de cuántos o de profundidad
Se utiliza incluir estructura. Cada archivo se incluye solo una vez, por lo que es seguro tener
múltiples inclusiones en el mismo archivo. Se lee cada inclusión, así que ponga lo más importante
anular incluye último:

INCLUIR # Global
INCLUDE <$ HOME / config / pwget.conf> # HOME lo anula

Una etiqueta especial "ESTE" significa la ruta relativa del archivo de inclusión actual, lo que hace que
posible incluir varios archivos del mismo directorio donde un archivo de inclusión inicial
reside

# Inicio de la configuración en /etc/pwget.conf

# ESTO = / Etc, ubicación actual
incluir

# Se refiere al directorio donde está el usuario actual: el pwd
incluir

# fin

Configuración presentar (aqui)
El archivo de configuración puede contener muchos , donde cada directiva termina en un
colon. El uso de cada directorio se explica mejor examinando el archivo de configuración
a continuación y leyendo el comentario cerca de cada directiva.

# $ HOME / config / pwget.conf F- Archivo de configuración de Perl pwget

ROOT = $ HOME # definir variables
CONF = $ INICIO / config
ACTUALIZAR = $ ROOT / actualizaciones
DOWNL = $ ROOT / descargar

# Incluya más archivos de configuración. Es posible
# dividir un archivo enorme en pedazos y tener "linux",
# configuraciones de "win32", "debian", "emacs" en
# y archivos manejables.

INCLUYE <$ CONF / pwget-other.conf>
INCLUYE <$ CONF / pwget-more.conf>

tag1: copias locales tag1: local # varios nombres a esta categoría

lcd: directiva $ UPDATE # chdir

# Esto se muestra al usuario con la opción --verbose
imprimir: Aviso, este sitio se movió AAAA-MM-DD, actualice sus marcadores

archivo: //absolute/dir/file-1.23.tar.gz

tag1: externo

lcd: $ DOWNL

etiqueta2: http-externo

http://www.example.com/page.html
http://www.example.com/page.html guardar: /dir/dir/page.html

etiqueta2: ftp externo

ftp://ftp.com/dir/archivo.txt.gz guardar: xx-file.txt.gz login: foo pass: passwd x:

lcd: $ HOME / descargar / paquete

ftp://ftp.com/dir/paquete-1.1.tar.gz nuevo:

etiqueta2: paquete-x

lcd: $ DOWNL / paquete-x

# Persona anuncia nuevos archivos en su página de inicio, descarga todos
# archivos anunciados. Desempaquete todo (x :) y elimine cualquier
# directorios existentes (xopt: rm)

http://example.com/~foo pregexp: \. tar \ .gz $ x: xopt: rm

# Fin del archivo de configuración pwget.conf

Anuncia OF DIRECTIVAS IN CONFIGURACIÓN ARCHIVO


Todas las directivas deben estar en la misma línea donde está la URL. Los programas escanean líneas y
determina todas las opciones dadas en línea para la URL. Las directivas se pueden anular mediante un comando
opciones de línea.

cnv: CONVERSION
Solo actualmente conv: texto está disponible.

Convierte la página descargada en texto. Esta opción siempre necesita salvar: or rebautizar:,
porque solo esas directivas cambian el nombre del archivo. Aquí hay un ejemplo:

http://example.com/dir/file.html cnv: guardar texto: archivo.txt
http://example.com/dir/ pregexp: \. html cnv: cambio de nombre de texto: s / html / txt /

A texto: La directiva abreviada se puede utilizar en lugar de cnv: texto.

cregexp: REGEXP
Descargue el archivo solo si el contenido coincide con REGEXP. Esto es lo mismo que la opción
--Contenido de expresiones regulares. En este ejemplo, la lista de directorios de paquetes lisp de Emacs (.el) son
descargado, pero solo si su contenido indica que el autor es el Sr. Foo:

http://example.com/index.html cregexp :(? i) autor:. * Foo pregexp: \. el $

lcd: DIRECTORIO
Establezca el directorio de descarga local en DIRECTORIO (chdir a él). Cualquier variable de entorno es
sustituido en el nombre de la ruta. Si se encuentra esta etiqueta, reemplaza la configuración de --Producción. Si
La ruta no es un directorio, termina con un error. Ver también --Crear-rutas y --sin-lcd.

inicio de sesión: LOGIN-NAME
Nombre de inicio de sesión de ftp. El valor predeterminado es "anónimo".

espejo: SITIO
Esto es relevante solo para Sourceforge, que no permite descargas directas con enlaces.
Visite la página de inicio de Sourceforge del proyecto y vea qué espejos están disponibles para
descargando

Un ejemplo:

http://sourceforge.net/projects/austrumi/files/austrumi/austrumi-1.8.5/austrumi-1.8.5.iso/download nuevo: espejo: kent

nuevo:
Obtenga el archivo más reciente. Esta variable se restablece al valor de --nuevo después de que la línea haya sido
procesado. Lo más nuevo significa que se ejecuta un comando "ls" en el ftp, y algo
equivalente en HTTP "directorios ftp", y cualquier archivo que se parezca al nombre del archivo es
examinados, clasificados y determinados heuréticamente según el número de versión del archivo
cuál es el último. Por ejemplo, archivos que tienen información de versión en AAAAMMDD
Es muy probable que el formato se recupere correctamente.

No se comprueban las marcas de tiempo de los archivos.

El único requisito es que el nombre del archivo "debe" seguir la numeración de la versión universal
estándar:

FILE-VERSION.extension # de facto VERSION se define como [\ d.] +

archivo-19990101.tar.gz # ok
archivo-1999.0101.tar.gz # ok
archivo-1.2.3.5.tar.gz # ok

file1234.txt # no reconocido. Debe tener "-"
file-0.23d.tar.gz # advertencia, las letras son problemáticas

Los archivos que tienen algún indicador de versión alfabético al final de VERSION pueden no ser
manejado correctamente. Póngase en contacto con el desarrollador e infórmele sobre el estándar de facto para
que los archivos se pueden recuperar de forma más inteligente.

NOTA: Para que el nuevo: directiva para saber qué tipo de archivos buscar, necesita una
tamplate de archivo. Puede utilizar un enlace directo a algún nombre de archivo. Aquí la ubicación
"http://www.example.com/downloads"se examina y se toma la plantilla de nombre de archivo utilizada
como "file-1.1.tar.gz" para buscar archivos que podrían ser más recientes, como
"archivo-9.1.10.tar.gz":

http://www.example.com/downloads/file-1.1.tar.gz nuevo:

Si el nombre del archivo aparece en una página con nombre, use la directiva archivo: para la plantilla. En esto
caso de que la página "download.html" sea examinada en busca de archivos que parezcan "file. * tar.gz" y
se busca lo último:

http://www.example.com/project/download.html file: file-1.1.tar.gz nuevo:

Sobrescribir: o:
Igual que encender --Sobrescribir

página:
Lea la página web y aplíquele comandos. Un ejemplo: póngase en contacto con la página raíz y guárdelo:

http://example.com/~foo page: save: foo-homepage.html

Para encontrar la información correcta en la página, se suelen utilizar otras directivas.
suministrado para guiar la búsqueda.

1) Agregar la directiva "pregexp: ARCHIVE-REGEXP" coincide con los enlaces A HREF en la página.

2) Agregar directiva nuevo: indica que busque VERSIONES más nuevas del archivo.

3) Agregar la directiva "archivo: DOWNLOAD-FILE" indica qué plantilla usar para construir el
nombre de archivo descargable. Esto es necesario para la directiva "nuevo:".

4) Una directiva "vregexp: VERSION-REGEXP" coincide con la ubicación exacta en la página desde
donde se extrae la información de la versión. La expresión regular predeterminada busca la línea que
dice "La última versión ... es ... NN". La expresión regular debe devolver subcoincidencia 2 para el
número de versión.

UN EJEMPLO

Busque archivos más nuevos en una lista de directorios HTTP. Examinar la página
http://www.example.com/download/dir para el modelo "package-1.1.tar.gz" y busque uno más nuevo
expediente. Por ejemplo, se descargaría "package-4.7.tar.gz".

http://www.example.com/download/dir/package-1.1.tar.gz nuevo:

UN EJEMPLO

Busque archivos más nuevos en el contenido de la página. La directiva archivo: actúa como un
modelo para los nombres de archivo a los que prestar atención.

http://www.example.com/project/download.html nuevo: pregexp: tar.gz archivo: paquete-1.1.tar.gz

UN EJEMPLO

Directiva de uso rebautizar: para cambiar el nombre del archivo antes de guardarlo en el disco. Aquí el
El número de versión se adjunta al nombre del archivo actila:

archivo.txt-1.1
archivo.txt-1.2

La directiva necesaria sería la siguiente; las entradas se han dividido en líneas separadas
para legibilidad:

http://example.com/files/
pregexp: \. el- \ d
vregexp: (archivo.el - ([\ d.] +))
archivo: file.el-1.1
nuevo:
renombrar: s / - [\ d.] + //

Esto dice efectivamente: "Vea si hay una nueva versión de algo que se parezca
file.el-1.1 y guárdelo con el nombre file.el eliminando el número de versión adicional en el
final del nombre de archivo original ".

UN EJEMPLO

Contacto absoluto página: at http://www.example.com/package.html y busque direcciones URL A HREF
en la página que coincide pregeexp:. Además, haz otro escaneo y busca la versión.
número en la página desde la posición que coincida vregexp: (subpartido 2).

Una vez que se hayan encontrado todas las piezas, utilice la plantilla archivo: para hacer el archivo recuperable
usando el número de versión encontrado en vregexp:. La ubicación de descarga real es
combinación de página: y A HREF pregeexp: ubicación.

La directiva necesaria sería la siguiente; las entradas se han dividido en líneas separadas
para legibilidad:

http://www.example.com/~foo/package.html
página:
pregexp: paquete.tar.gz
vregexp: ((? i) última. *? versión. *? \ b ([\ d] [\ d.] +). *)
archivo: paquete-1.3.tar.gz
nuevo:
x:

Un ejemplo de página web donde se aplicaría lo anterior:




La última versión del paquete es 2.4.1 Puede ser
descargado de varias formas:

Archivo de alquitrán
archivo zip




Para este ejemplo, suponga que "package.tar.gz" es un enlace simbólico que apunta al
archivo de versión más reciente "package-2.4.1.tar.gz". Por lo tanto, la ubicación de descarga real
ha sido "http://www.example.com/~foo/download/files/package-2.4.1.tar.gz".

¿Por qué no descargar simplemente "package.tar.gz"? Porque entonces el programa no puede decidir si el
La versión de la página es más reciente que la almacenada en el disco desde la descarga anterior. Con
números de versión en los nombres de archivo, la comparación es posible.

página: encontrar
FIXME: Esta opción está obsoleta. no utilice.

ESTO ES PARA HTTP solamente. Use Directiva de uso expresión regular: para protocolos FTP.

Esta es una instrucción más general que la página: y vregexp: explicado arriba.

Instruir para descargar todas las URL en la coincidencia de páginas HTML pregexp: RE. En situación típica
el mantenedor de la página enumera su software en la página de desarrollo. Este ejemplo
descargue todos los archivos tar.gz de la página. Tenga en cuenta que el REGEXP se compara con el A
Contenido del enlace HREF, no el texto real que se muestra en la página:

http://www.example.com/index.html página: busque pregexp: \. tar.gz $

También puede utilizar adicionales expresión regular-no: directiva si desea excluir archivos después
la pregeexp: ha coincidido con un enlace.

http://www.example.com/index.html página: busque pregexp: \. tar.gz $ regexp-no: escritorio

pase: CONTRASEÑA
Para inicios de sesión FTP. El valor predeterminado es "[email protected]".

pregexp: RE
Buscar enlaces HREF en una página que coincida con una expresión regular. La expresión regular debe
ser una sola palabra sin espacios en blanco. Esto es incorrecto:

pregexp: (esta expresión regular)

Debe estar escrito como:

pregexp: (esto \ s + regexp \ s)

imprimir: MENSAJE
Imprime el mensaje asociado al usuario que solicita el nombre de etiqueta coincidente. Esta directiva debe en
línea separada dentro de la etiqueta.

etiqueta1: linux

imprimir: este sitio de descarga se movió 2002-02-02, verifique sus marcadores.
http://new.site.com/dir/file-1.1.tar.gz nuevo:

La directiva "print:" para la etiqueta se muestra solo si el usuario activa el modo --verbose:

pwget -v -T Linux

renombrar: PERL-CODE
Cambie el nombre de cada archivo usando PERL-CODE. El PERL-CODE debe ser un programa completo de Perl sin
espacios en cualquier lugar. Las siguientes variables están disponibles durante el eval () de código:

$ ARG = nombre de archivo actual
$ url = URL completa para el archivo
El código debe devolver $ ARG que se usa para el nombre del archivo

Por ejemplo, si la página contiene enlaces a archivos .html que en realidad son archivos de texto,
siguiente declaración cambiaría las extensiones de archivo:

http://example.com/dir/ página: busque pregexp: \. html renombrar: s / html / txt /

También puede llamar a la función "MonthToNumber ($ string)" si el nombre de archivo contiene escrito
nombre del mes, como <2005-February.mbox>. La función convertirá el nombre en número.
Muchos archivos de listas de correo se pueden descargar limpiamente de esta manera.

# Esto descargará los archivos de la lista de correo SA-Exim:
http://lists.merlins.org/archives/sa-exim/ pregexp: \. txt $ renombrar: $ ARG = MonthToNumber ($ ARG)

Aquí hay un ejemplo más complicado:

http://www.contactor.se/~dast/svnusers/mbox.cgi pregexp: mbox. * \ d $ renombrar: my ($ y, $ m) = ($ url =~ / año= (\ d +). * mes = (\ d +) /); $ ARG = "$ y- $ m.mbox"

Vamos a romper eso. Puede dedicar algo de tiempo a este ejemplo, ya que
las posibilidades son ilimitadas.

1. Conectarse a la página
http://www.contactor.se/~dast/svnusers/mbox.cgi

2. Busque en la página URL que coincidan con la expresión regular 'mbox. * \ D $'. A
El enlace encontrado podría coincidir con hrefs como este:
http://svn.haxx.se/users/mbox.cgi? año = 2004 & mes = 12

3. El enlace encontrado se coloca en $ ARG (igual que $ _), que se puede utilizar
para extraer el nombre del buzón adecuado con un código Perl que sea
evaluado. El nombre resultante debe aparecer en $ ARG. Así el código
Extrae efectivamente dos elementos del enlace para formar un buzón.
Nombre:

my ($ y, $ m) = ($ url = ~ /year=(\d+).*month=(\d+)/)
$ ARG = "$ y- $ m.mbox"

=> 2004-12.mbox

Solo recuerde, que el código perl que sigue a la directiva "renombrar:" deben no debe
contener espacios. Todo debe poder leerse como una sola cadena.

regexp: REGEXP
Obtenga todos los archivos en el directorio ftp que coincidan con las expresiones regulares. Directiva salvar: se ignora.

regexp-no: REGEXP
Después de que la directiva "regexp:" coincida, excluya los archivos que coincidan con la directiva expresión regular-
en:

Regexp: REGEXP
Esta opción es para uso interactivo. Recupere todos los archivos del sitio HTTP o FTP que
coincidir con REGEXP.

guardar: NOMBRE-DE-ARCHIVO-LOCAL
Guarde el archivo con este nombre en el disco local.

tagN: NOMBRE
Las descargas se pueden agrupar en "tagN" para que, por ejemplo, la opción --Etiqueta1 comenzaría
descargando archivos desde ese punto en adelante hasta que se encuentre la próxima "etiqueta1". Hay actualmente
número ilimitado de niveles de etiquetas: etiqueta1, etiqueta2 y etiqueta3, para que pueda organizar su
se descarga jerárquicamente en el archivo de configuración. Por ejemplo para descargar todo Linux
archivos que supervisa, le daría la opción --Etiqueta Linux. Para descargar solo el NT
Último binario de Emacs, daría la opción --Etiqueta emacs-nt. Fíjate que no das
el "nivel" en la opción, el programa lo encontrará en el archivo de configuración después
el nombre de la etiqueta coincide.

La descarga se detiene en la siguiente etiqueta del "mismo nivel". Es decir, tag2 se detiene solo en
siguiente etiqueta2, o cuando se encuentra la etiqueta de nivel superior (etiqueta1) o hasta el final del archivo.

tag1: linux # Todas las descargas de Linux de esta categoría

tag2: sunsite tag2: otro-nombre-para-este-lugar

# Lista de archivos para descargar desde aquí

etiqueta2: ftp.funet.fi

# Lista de archivos para descargar desde aquí

etiqueta1: emacs-binary

etiqueta2: emacs-nt

etiqueta2: xemacs-nt

etiqueta2: emacs

etiqueta2: xemacs

x: Extraiga (descomprima) el archivo después de la descarga. Ver también opción --deshacer y --no extraer La pestaña
archivo de almacenamiento, digamos .tar.gz se extraerá el archivo en la ubicación de descarga actual.
(ver directiva LCD:)

El procedimiento de desempaquetado comprueba el contenido del archivo para ver si el paquete está
correctamente formado. El formato de archivo de facto es

paquete-N.NN.tar.gz

En el archivo, se supone que todos los archivos se almacenan en el subdirectorio adecuado con
información de versión:

paquete-N.NN / doc / README
paquete-N.NN / doc / INSTALL
paquete-N.NN / src / Makefile
paquete-N.NN / src / some-code.java

"IMPORTANTE:" Si el archivo no tiene un subdirectorio para todos los archivos, un subdirectorio
se crea y todos los elementos se descomprimen debajo de él. El nombre del subdirectorio defualt en
construido a partir del nombre del archivo con el sello de fecha actual en formato:

paquete-AAAA.MMDD

Si el nombre del archivo contiene algo que parece un número de versión, el archivo creado
El directorio se construirá a partir de él, en lugar de la fecha actual.

paquete-1.43.tar.gz => paquete-1.43

xx: Como directiva x: pero extraiga el archivo "tal cual", sin comprobar el contenido del
archivo. Si sabe que está bien que el archivo no incluya subdirectorios,
utilice esta opción para suprimir la creación de un paquete raíz artificial: AAAA.MMDD.

xopt: rm
Esta opción le dice que elimine cualquier directorio de desempaquetado anterior.

A veces, los archivos del archivo son de solo lectura y se descomprimen el archivo en segundo lugar.
el tiempo, después de un período de tiempo, mostraría

tar: package-3.9.5 / .cvsignore: No se pudo crear el archivo:
Permiso denegado

tar: package-3.9.5 / BUGS: No se pudo crear el archivo:
Permiso denegado

Esto no es un error grave, porque el archivo ya estaba en el disco y tar no
sobrescribir archivos anteriores. Sería bueno informar al encargado del archivo que el
los archivos tienen permisos incorrectos. Es habitual esperar que los paquetes distribuidos tengan
marca de escritura establecida para todos los archivos.

ERRORES


Aquí hay una lista de posibles mensajes de error y cómo tratarlos. Encendiendo --depurar
ayudará a comprender cómo el programa ha interpretado el archivo de configuración o la línea de comando
opciones. Preste mucha atención a la salida generada, ya que puede revelar que una expresión regular
porque un sitio es demasiado flojo o demasiado estrecho.

ERROR {URL-AQUÍ} Piscinas presentar descriptor
Este es "error de archivo no encontrado". Ha escrito el nombre del archivo incorrectamente. Doble
verifique la línea del archivo de configuración.

Use pwget en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad




×
Anuncio
❤ ️Compre, reserve o adquiera aquí: sin costo, ayuda a mantener los servicios gratuitos.