Este é o comando pdfgrep que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador Windows online ou emulador MAC OS online
PROGRAMA:
NOME
pdfgrep - pesquisa arquivos pdf para uma expressão regular
SINOPSE
pdfgrep. [OPÇÃO...] PADRONIZAR [ARQUIVO...]
DESCRIÇÃO
Procurar por PADRONIZAR em cada ARQUIVO. PADRONIZAR é uma expressão regular estendida.
pdfgrep. funciona de forma muito semelhante ao grep, com uma distinção: opera em páginas e não em linhas.
OPÇÕES
-i, --ignorar caso
Ignore as distinções de maiúsculas e minúsculas em ambos os PADRONIZAR e os arquivos de entrada.
-F, --strings fixas
Interpretar PADRONIZAR como uma lista de strings fixas separadas por novas linhas, qualquer uma das quais é para
ser combinado.
-P, --perl-regexp
Interpretar PADRONIZAR como uma expressão regular compatível com Perl (PCRE). Ver sintaxe(3).
para uma visão geral rápida.
-H, --com-nome do arquivo
Imprima o nome do arquivo para cada correspondência. Esta é a configuração padrão quando há mais
mais de um arquivo para pesquisar.
-h, --no-nome do arquivo
Suprime o prefixo do nome do arquivo na saída. Esta é a configuração padrão quando há
é apenas um arquivo para pesquisar.
-n, --número de página
Prefixe cada correspondência com o número da página onde foi encontrada.
-c, --contar
Suprime a saída normal. Em vez disso, imprima o número de correspondências para cada arquivo de entrada. Observação
que, ao contrário do grep, várias correspondências na mesma página serão contadas individualmente.
-p, --contagem de páginas
Como -c, mas imprime o número de correspondências por página.
-C, --contexto NUM
Imprima no máximo INUM caracteres de contexto em torno de cada partida. O número exato irá
variam, porque o pdfgrep tenta respeitar os limites das palavras. Se NUM é "linha", o todo
linha será impressa. Se esta opção não for definida, o pdfgrep tenta imprimir as linhas que são
não mais do que a largura do terminal.
--cor QUANDO
Cerque nomes de arquivo, números de página e texto correspondente com sequências de escape para exibir
em cores no terminal. (A configuração padrão é auto). QUANDO pode ser:
sempre
Sempre use cores, mesmo quando stdout não é um terminal.
nunca
Não use cores.
auto
Use cores apenas quando stdout for um terminal.
-o, - apenas correspondendo
Imprime apenas a parte correspondente de uma linha sem qualquer contexto circundante.
-r, --recursivo
Pesquisar recursivamente todos os arquivos (restrito por --incluir e --excluir) sob cada
, seguindo os links simbólicos apenas se estiverem na linha de comando.
-R, --dereferência-recursiva
Igual a -r, mas segue todos os links simbólicos.
--exclude =GLOBO
Pular arquivos cujo nome de base corresponda GLOBO. Ver glob(7) para curingas que você pode usar. Vocês
pode usar essa opção várias vezes para excluir mais padrões. Tem precedência sobre
--incluir. Observe que in e excludes se aplicam apenas a arquivos encontrados por meio de --recursivo e
não para a lista de argumentos.
--include =GLOBO
Pesquisar apenas arquivos cujo nome de base corresponda GLOBO. Ver --excluir para detalhes. O padrão
is * .pdf.
--password =SENHA
Use a SENHA para descriptografar os arquivos PDF. Pode ser especificado várias vezes; todas as senhas
será testado em todos os PDFs. Observação que esta senha aparecerá em seu comando
história e a saída de ps(1). Portanto, não use isso se a segurança de SENHA
é importante.
-m, --contagem máxima NUM
Pare de ler um arquivo depois NUM fósforos. Quando a opção -c ou --count também é usada,
pdfgrep não produz uma contagem maior que NUM.
-Z, --nulo
Produz um byte nulo (chamado NUL em ASCII e '\ 0' em C) em vez dos dois pontos que
geralmente separa um nome de arquivo do resto da linha. Esta opção torna a saída
inequívoco na presença de dois pontos, espaços ou novas linhas no nome do arquivo. Pode ser
usado em conjunto com comandos como xargs -0 or perl -0.
--match-prefix-separador Setembro
Altera os dois pontos usados para separar o nome do arquivo, o número da linha e o texto na saída para
Setembro, que pode ser uma string arbitrária. Isso é útil quando os nomes dos arquivos contêm dois pontos,
mas apenas para uso interativo. Para scripts, --nulo deve ser usado.
--depurar
Habilite a saída de depuração. Observação: Devido às limitações do poppler antes da versão 0.30.0, alguns
a saída de depuração também é impressa sem --depurar ao usar uma versão poppler.
--avisar-vazio
Imprima um aviso para stderr se um PDF não contiver texto pesquisável. Este é o caso de
PDFs que consistem apenas em imagens, por exemplo, documentos digitalizados.
--unac
Remova acentos e ligaduras do padrão de pesquisa e dos documentos PDF. Esse
é útil se você deseja pesquisar uma palavra que contenha "ae", mas o PDF usa o
em vez disso, um único caractere "æ". Ver unac(3). e sem sotaque(1). para obter detalhes.
Esta opção is experimental e só disponível if pdfgrep. is compilado com unac
.
-q, --quieto
Suprime todas as saídas normais para saída padrão. Os erros serão impressos e os códigos de saída serão
ser devolvido (veja abaixo).
--Socorro
Imprima um breve resumo das opções.
-V, --versão Mostra as informações da versão.
SAIR STATUS
Normalmente, o status de saída é 0 se pelo menos uma correspondência for encontrada, 1 se nenhuma correspondência for encontrada e
2 se ocorrer um erro. Mas se o --quieto or -q opção é usada e uma correspondência foi encontrada,
pdfgrep. retornará 0 independentemente dos erros.
MEIO AMBIENTE VARIÁVEIS
O comportamento de pdfgrep. é afetado pela seguinte variável de ambiente.
GREP_COLORS
Especifica as cores e outros atributos usados para destacar várias partes do
saída. A sintaxe e os valores são como GREP_COLORS of grep. Ver grep(1) para mais
detalhes. Atualmente, apenas os recursos mt, ms, mc, fn, ln e se são usados por
pdfgrep., Onde mt, ms e mc têm o mesmo efeito.
EXEMPLOS
Impressão da primeiro dez linhas correspondente de cinto de segurança e impressão a visão deles página número
pdfgrep -n --max-count 10 padrão foo.pdf
Pesquisar todos os .pdf arquivos de quem nomes começar com Foo recursivamente in da atual anuário
pdfgrep -r --inclui o padrão "foo * .pdf"
Pesquisar todos os .pdf arquivos que. e guarante que os mesmos estão menor do que 12M recursivamente in da atual anuário
achar . -name "* .pdf" -size -12M -print0 | padrão xargs -0 pdfgrep
Observe que, em contraste com os exemplos anteriores, esta tarefa não pôde ser resolvida com
pdfgrep sozinho, mas as ferramentas Unix find(1). e xargs(1). teve que ser usado. Isso é porque
O pdfgrep em si não inclui opções para excluir arquivos por seu tamanho. Mas como você vê,
não precisa!
Use o pdfgrep online usando os serviços onworks.net
