Este é o comando pdftotext que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
pdftotext - Portable Document Format (PDF) para conversor de texto (versão 3.03)
SINOPSE
pdftotexto [opções] [Ficheiro PDF [arquivo de texto]]
DESCRIÇÃO
PDFtotexto converte arquivos PDF (Portable Document Format) em texto simples.
Pdftotext lê o arquivo PDF, Ficheiro PDFe grava um arquivo de texto, arquivo de texto. Se arquivo de texto
não é especificado, pdftotext converte arquivo.pdf para arquivo.txt. Se arquivo de texto é ´- ', o texto
é enviado para stdout.
OPÇÕES
-f número
Especifica a primeira página a ser convertida.
-l número
Especifica a última página a ser convertida.
-r número
Especifica a resolução, em DPI. O padrão é 72 DPI.
-x número
Especifica a coordenada x do canto superior esquerdo da área de corte
-y número
Especifica a coordenada y do canto superior esquerdo da área de corte
-W número
Especifica a largura da área de corte em pixels (o padrão é 0)
-H número
Especifica a altura da área de corte em pixels (o padrão é 0)
-layout
Mantenha (da melhor forma possível) o layout físico original do texto. o
o padrão é ´undo 'layout físico (colunas, hifenização, etc.) e a saída do
texto na ordem de leitura.
-fixo número
Assume texto de densidade fixa (ou tabular), com a largura de caractere especificada (em
pontos). Isso força o modo de layout físico.
-cru Mantenha o texto na ordem do fluxo de conteúdo. Este é um hack que muitas vezes "desfaz" a coluna
formatação, etc. O uso do modo raw não é mais recomendado.
-htmlmeta
Gere um arquivo HTML simples, incluindo as metainformações. Isso simplesmente envolve o
texto em e e adiciona os meta cabeçalhos.
-bbox Gere um arquivo XHTML contendo informações da caixa delimitadora para cada palavra no
arquivo.
-bbox-layout
Gere um arquivo XHTML contendo informações de caixa delimitadora para cada bloco, linha,
e palavra no arquivo.
-enc nome-codificação
Define a codificação a ser usada para saída de texto. O padrão é "UTF-8".
-ouvir
Ajusta as codificações disponíveis
-eol unix | dos | mac
Define a convenção de fim de linha a ser usada para saída de texto.
-nopgbrk
Não insira quebras de página (caracteres de alimentação de formulário) entre as páginas.
-opw senha
Especifique a senha do proprietário para o arquivo PDF. Fornecer isso irá ignorar todos
restrições de segurança.
-upw senha
Especifique a senha do usuário para o arquivo PDF.
-q Não imprima mensagens ou erros.
-v Imprima informações de copyright e versão.
-h Imprima informações de uso. (-Socorro e --Socorro são equivalentes.)
Use pdftotext online usando serviços onworks.net