GoGPT Best VPN GoSearch

Favicon di OnWorks

pstotext - Online nel cloud

Esegui pstotext nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questo è il comando pstotext che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


pstotext - estrae il testo ASCII da un file PostScript o PDF

SINTASSI


pstotesto [opzione|percorso]...

dove l'opzione include:

-sughero
-paesaggio
-paesaggioAltro
-ritratto
-
-file di uscita
-gs comando
-debug
-bbox

DESCRIZIONE


pstotesto legge uno o più file PostScript o PDF e scrive sullo standard output a
rappresentazione del testo normale che verrebbe visualizzato se il file PostScript fosse
stampato. Come descritto nella sezione DETTAGLI di seguito, questa rappresentazione è solo un
approssimazione. Tuttavia, è spesso utile per il recupero di informazioni (ad esempio, in esecuzione
grep(1) o la creazione di un indice full-text) o per recuperare il testo da un file PostScript il cui
fonte che hai perso.

pstotesto chiama Ghostscript e richiede Aladdin Ghostscript versione 3.51 o successiva.
Ghostscript deve essere richiamabile nel percorso di ricerca corrente come gs. In alternativa, puoi
usa l'opzione -gs per specificare il comando (percorso e opzioni) per eseguire Ghostscript. Per
ad esempio, su Windows potresti usare -gs "c:\gs\gswin32c.exe -Ic:\gs;c:\gs\fonts".

pstotesto legge ed elabora la sua riga di comando da sinistra a destra, ignorando il caso di
opzioni. Quando incontra un percorso, apre il file e si aspetta di trovare un
Processo PostScript o documento PDF da elaborare. L'opzione - significa leggere ed elaborare a
Processo PostScript dall'input standard. Se non vengono incontrati argomenti - o pathname,
pstotesto legge un lavoro PostScript dall'input standard. (I documenti PDF richiedono un accesso casuale,
quindi non può essere letto dallo standard input.) È possibile utilizzare l'opzione -output per specificare an
file di output (ricorda di invocarlo prima il file di input); altrimenti pstotesto scrive a
uscita standard.

L'opzione -cork è rilevante solo per i file PostScript prodotti da dvips da TeX o LaTeX
documenti; racconta pstotesto usare la codifica Cork (conosciuta come T1 in LaTeX) piuttosto che
la vecchia codifica del testo TeX (conosciuta come OT1 in LaTeX). Sfortunatamente i file prodotti da dvips
non distinguere quali codifiche dei caratteri sono state utilizzate.

Le opzioni -landscape e -landscapeOther dovrebbero essere usate per i documenti che devono essere
ruotato di 90 gradi in senso orario o antiorario, rispettivamente, per essere leggibile.

Le opzioni -debug e -bbox sono principalmente utili per i manutentori di pstotesto. -debug
mostra l'output di Ghostscript e i messaggi di errore. -bboxes emette una parola per riga con
informazioni sul riquadro di delimitazione.

DETTAGLI


pstotesto fa il suo lavoro dicendo a Ghostscript di caricare una libreria PostScript che lo causa
per scrivere nel suo output standard le informazioni su ogni stringa resa da un lavoro PostScript
o documento PDF. Queste informazioni includono i caratteri della stringa e abbastanza
informazioni aggiuntive per approssimare il rettangolo di delimitazione della stringa. pstotesto
post-elabora queste informazioni e produce una sequenza di parole delimitate dallo spazio,
newline e formfeed.

pstotesto emette le parole nella stessa sequenza in cui sono rese dal documento. Questo
di solito, ma non sempre, segue l'ordine in cui un umano leggerebbe le parole su una pagina.
All'interno di questa sequenza, le parole sono separate da uno spazio o da una nuova riga a seconda che
oppure no cadono sulla stessa linea. Ogni pagina è terminata con un formfeed. Se usi
l'opzione errata dal set {-portrait, -landscape, -landscapeOther}, pstotesto is
probabilmente sostituirà la nuova riga per lo spazio.

Un lavoro PostScript o un documento PDF spesso rende una parola come diverse stringhe per ottenere
spaziatura corretta tra particolari coppie di caratteri. pstotesto fa del suo meglio per
assemblare queste stringhe di nuovo in parole, usando una semplice euristica: stringhe separate da a
distanza inferiore a 0.3 volte il minimo delle larghezze medie dei caratteri nei due
le stringhe sono considerate parte della stessa parola. Nota che questo in genere causa
caratteri di punteggiatura iniziali e finali da includere in una parola.

Il linguaggio PostScript fornisce uno schema di codifica flessibile mediante il quale i codici dei caratteri in
le stringhe selezionano caratteri specifici (simboli), quindi un lavoro PostScript è libero di usare qualsiasi
codice carattere. D'altra parte, pstotesto si traduce sempre in ISO 8859-1 (latino-1)
codice carattere, che è un'estensione di ASCII che copre la maggior parte dell'Europa occidentale
le lingue. Quando un carattere non è presente in ISO 8859-1, pstotesto usa una sequenza di
caratteri, ad esempio "---" per la lineetta o "A\226" per Abreve. pstotesto può essere ingannato da a
font il cui vettore di codifica non segue le convenzioni di Adobe, ma contiene l'euristica
permettendogli di gestire un'ampia varietà di caratteri che si comportano male.

(pstotesto non traduce più il trattino (\255) in meno (\055).)

Usa pstotext online utilizzando i servizi onworks.net


Server e workstation gratuiti

Scarica app per Windows e Linux

Comandi Linux

Ad




×
Cookie per pubblicità
❤️Fai acquisti, prenota o acquista qui: nessun costo, aiuta a mantenere i servizi gratuiti.