pdfgrep - Online en la nube

Este es el comando pdfgrep que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


pdfgrep - buscar archivos pdf para una expresión regular

SINOPSIS


pdfgrep [OPCIÓN...] PATRÓN [ARCHIVO...]

DESCRIPCIÓN


Busque PATRÓN en cada ARCHIVO. PATRÓN es una expresión regular extendida.

pdfgrep funciona de manera muy similar a grep, con una distinción: opera en páginas y no en líneas.

OPCIONES


-i, --ignorar caso
Ignore las distinciones de mayúsculas y minúsculas tanto en PATRÓN y los archivos de entrada.

-F, - cuerdas-fijas
Interpretar PATRÓN como una lista de cadenas fijas separadas por líneas nuevas, cualquiera de las cuales debe
ser emparejado

-P, --perl-regexp
Interpretar PATRÓN como una expresión regular compatible con Perl (PCRE). Ver pcresintaxis(3)
para obtener una descripción general rápida.

-H, --con-nombre de archivo
Imprime el nombre de archivo para cada coincidencia. Esta es la configuración predeterminada cuando hay más
de un archivo para buscar.

-h, --no-nombre de archivo
Suprima el prefijo del nombre del archivo en la salida. Esta es la configuración predeterminada cuando hay
es solo un archivo para buscar.

-n, --número de página
Ponga el prefijo de cada coincidencia con el número de la página donde se encontró.

-c, --contar
Suprime la salida normal. En su lugar, imprima el número de coincidencias para cada archivo de entrada. Nota
que a diferencia de grep, varias coincidencias en la misma página se contarán individualmente.

-p, - recuento de páginas
Como -c, pero imprime el número de coincidencias por página.

-C, --contexto NUM
Imprimir como máximo INUM personajes de contexto alrededor de cada partido. El número exacto
varían, porque pdfgrep intenta respetar los límites de las palabras. Si NUM es "línea", El conjunto
Se imprimirá la línea. Si esta opción no está configurada, pdfgrep intenta imprimir líneas que son
no más largo que el ancho del terminal.

--color CUÁNDO
Envuelva nombres de archivos, números de página y texto coincidente con secuencias de escape para mostrar
ellos en color en la terminal. (La configuración predeterminada es auto). CUÁNDO puede ser:


Utilice siempre colores, incluso cuando stdout no sea un terminal.

nunca
No utilices colores.

auto
Utilice colores solo cuando stdout sea una terminal.

-o, --sólo coincidencia
Imprima solo la parte coincidente de una línea sin ningún contexto circundante.

-r, --recursivo
Buscar recursivamente todos los archivos (restringido por --incluir y --excluir) debajo de cada
directorio, siguiendo los enlaces simbólicos solo si están en la línea de comando.

-R, --desreferencia-recursiva
Igual que -r, pero sigue todos los enlaces simbólicos.

--exclude =MUNDIALIZA
Omitir archivos cuyo nombre base coincida MUNDIALIZA. Vea glob(7) para comodines que puede utilizar. usted
puede utilizar esta opción varias veces para excluir más patrones. Tiene prioridad sobre
--incluir. Tenga en cuenta que las entradas y las exclusiones se aplican solo a los archivos encontrados a través de --recursivo y
no a la lista de argumentos.

--include =MUNDIALIZA
Buscar solo archivos cuyo nombre base coincida MUNDIALIZA. Vea --excluir para detalles. El valor por defecto
is * .pdf.

--password =CONTRASEÑA
Utilice CONTRASEÑA para descifrar los archivos PDF. Puede especificarse varias veces; todas las contraseñas
se probará en todos los PDF. Nota: que esta contraseña aparecerá en su comando
historia y la salida de ps(1). Por lo tanto, no use esto si la seguridad de CONTRASEÑA
es importante.

-m, - recuento máximo NUM
Dejar de leer un archivo después NUM partidos. Cuando también se usa la opción -co --count,
pdfgrep no genera un recuento mayor que NUM.

-Z, --nulo
Salida de un byte nulo (llamado NUL en ASCII y '\ 0' en C) en lugar de los dos puntos que
generalmente separa un nombre de archivo del resto de la línea. Esta opción hace que la salida
inequívoco en presencia de dos puntos, espacios o líneas nuevas en el nombre del archivo. Puede ser
utilizado junto con comandos como xargs -0 or perl -0.

--coincidencia-prefijo-separador SEP
Cambia los dos puntos utilizados para separar el nombre de archivo, el número de línea y el texto en la salida a
SEP, que puede ser una cadena arbitraria. Esto es útil cuando los nombres de archivo contienen dos puntos,
pero solo para uso interactivo. Para secuencias de comandos, --nulo debe ser usado.

--depurar
Habilite la salida de depuración. Nota: : Debido a las limitaciones de poppler antes de la versión 0.30.0, algunos
la salida de depuración también se imprime sin --depurar cuando se utiliza una versión de poppler de este tipo.

--advertir-vacío
Imprima una advertencia para stderr si un PDF no contiene texto que se pueda buscar. Este es el caso de
PDF que constan solo de imágenes, por ejemplo, documentos escaneados.

--unac
Elimine acentos y ligaduras tanto del patrón de búsqueda como de los documentos PDF. Esta
es útil si desea buscar una palabra que contenga "ae", pero el PDF utiliza la
un solo carácter "æ" en su lugar. Ver unac(3) y sin acento(1) para obtener más detalles.

Este opción is experimental y único estará disponible if pdfgrep is compilado con unac
apoyo.

-q, --tranquilo
Suprime toda la salida normal a stdout. Los errores se imprimirán y los códigos de salida
ser devuelto (ver más abajo).

--ayuda
Imprima un breve resumen de las opciones.

-V, --versión Muestra información de la versión.

SALIR ESTADO


Normalmente, el estado de salida es 0 si se encuentra al menos una coincidencia, 1 si no se encuentra ninguna coincidencia y
2 si ocurrió un error. Pero si el --tranquilo or -q se utiliza la opción y se encontró una coincidencia,
pdfgrep devolverá 0 independientemente de los errores.

MEDIO AMBIENTE VARIABLES


El comportamiento de pdfgrep se ve afectado por la siguiente variable de entorno.

GREP_COLORS
Especifica los colores y otros atributos utilizados para resaltar varias partes del
producción. La sintaxis y los valores son como GREP_COLORS of grep. Vea grep(1) para más
detalles. Actualmente solo las capacidades mt, ms, mc, fn, ln y se son utilizados por
pdfgrep, donde el mt, ms y mc tienen el mismo efecto.

EJEMPLOS


Imprimir la first ten líneas pareo patrón y Imprimir su página número

pdfgrep -n --max-count 10 patrón foo.pdf

Buscar que todas .pdf archivos cuyo nombres begin con foo recursivamente in la corriente directorio

pdfgrep -r: incluye el patrón "foo * .pdf"

Buscar que todas .pdf archivos que están menores than 12 m recursivamente in la corriente directorio

encontrar . -nombre "* .pdf" -tamaño -12M -print0 | patrón xargs -0 pdfgrep

Tenga en cuenta que, a diferencia de los ejemplos anteriores, esta tarea no se pudo resolver con
pdfgrep solo, pero las herramientas Unix find(1) y xargs(1) tenía que ser utilizado. Eso es porque
pdfgrep en sí no incluye opciones para excluir archivos por su tamaño. Pero como ves
¡no tiene por qué!

Use pdfgrep en línea usando los servicios de onworks.net



Últimos programas en línea de Linux y Windows