IngleseFranceseSpagnolo

Ad


Favicon di OnWorks

enca - Online nel cloud

Esegui enca nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questo è il comando enca che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


enca -- rileva e converte la codifica dei file di testo

SINOSSI


ENCA [-L LINGUA] [OPZIONE]... [RISORSE] ...
conv [-L LINGUA] [OPZIONE]... [RISORSE] ...

INTRODUZIONE E ESEMPI


Se sei abbastanza fortunato, le uniche due cose che avrai bisogno di sapere sono: comando

ENCA RISORSE

ti dirà quale file di codifica RISORSE usa (senza cambiarlo), e

conv RISORSE

convertirà il file RISORSE alla codifica nativa della tua locale. Per convertire il file in un altro
codifica utilizzare il -x opzione (vedi -x entrata in sezione VERSIONI e sezioni CONVERSIONE ed
CODICI per dettagli).

Entrambi funzionano con più file e anche con l'input standard (output). Per esempio

enca -x latino2

assicura che il file `sometext' sia in ISO Latin 2 quando viene inviato alla stampante.

Il motivo principale per cui questi comandi falliranno e trasformeranno i tuoi file in spazzatura è che Enca
ha bisogno di conoscere la propria lingua per rilevare la codifica. Cerca di determinare la tua lingua
e il set di caratteri preferito dalle impostazioni internazionali, che potrebbe non essere quello che desideri.

Puoi (o devi) usare -L opzione per dirgli la lingua giusta. Supponiamo che tu abbia scaricato
qualche file HTML russo, `file.htm', afferma di essere windows-1251 ma non lo è. Quindi corri

enca -L ru file.htm

e scopri che è KOI8-R (per esempio). Attenzione, attualmente non ce ne sono molti supportati
lingue (vedi sezione LE LINGUE).

Un altro avvertimento riguarda il fatto che diverse caratteristiche di Enca, ovvero la sua conversione del set di caratteri
capacità, dipendono fortemente da quali altri strumenti sono installati sul sistema (vedi
pagina CONVERSIONE)--correre

enca --versione

per ottenere l'elenco delle caratteristiche (vedi sezione CARATTERISTICHE). Prova anche

enca --aiuto

per ottenere la descrizione di tutte le altre opzioni di Enca (e per trovare il resto di questa pagina di manuale
ridondante).

DESCRIZIONE


Enca legge file di testo dati, o input standard quando non ne viene fornito nessuno, e usa la conoscenza
sulla loro lingua (deve essere supportata da te) e un misto di analisi, statistica
analisi, ipotesi e magia nera per determinare le loro codifiche, che poi vengono stampate su
standard output (o confessa di non avere idea di quale possa essere la codifica). Di
predefinito, Enca presenta i risultati come descrizioni leggibili dall'uomo su più righe, molte altre
formati sono disponibili: vedere i selettori del tipo di output di seguito.

Enca può anche convertire i file in altre codifiche ENC quando lo chiedi, usando a
convertitore integrato, qualche libreria di conversione o chiamando un convertitore esterno.

L'obiettivo primario di Enca è quello di essere utilizzabile incustodito, come strumento di conversione automatica, anche se
forse non sono ancora arrivato a questo punto (vedi sezione SICUREZZA).

Si prega di notare che, tranne rari casi, Enca deve davvero conoscere la lingua dei file di input da fornire
sei una risposta affidabile D'altra parte, può quindi gestire abbastanza bene i file che sono
non puramente testuale o addirittura rileva set di caratteri di stringhe di testo all'interno di qualche file binario; di
ovviamente dipende dal carattere della componente non testuale.

Enca non si preoccupa della struttura dei file di input, li vede come un pezzo uniforme di
testo/dati. In caso di file multipart (ad es. caselle di posta), è necessario utilizzare uno strumento che sappia
la struttura per estrarre prima le singole parti. È il costo della capacità di rilevare
codifiche di eventuali file danneggiati, incompleti o altrimenti errati.

VERSIONI


Esistono diverse categorie di opzioni: opzioni della modalità di funzionamento, selettori del tipo di output,
indovinare parametri, parametri di conversione, opzioni generali ed elenchi.

Tutte le opzioni lunghe possono essere abbreviate purché siano parametri non ambigui e obbligatori
delle opzioni lunghe sono obbligatorie anche per le opzioni corte.

Funzionamento modalità di
stanno seguendo:

-c, --auto-converti
Equivalente a chiamare Enca as conv.

Se non viene specificato alcun selettore del tipo di output, rileva le codifiche dei file, indovina il tuo
set di caratteri preferito dalle versioni locali e converti i file in esso (disponibile solo con
+funzione target-charset-auto).

-g, --indovinare
Equivalente a chiamare Enca as ENCA.

Se non viene specificato alcun selettore del tipo di output, rilevare le codifiche dei file e segnalarle.

Uscita Digitare selettori
selezionare quale azione intraprenderà Enca quando determinerà la codifica; la maggior parte di loro semplicemente
scegliere tra diversi nomi, formati e convenzioni come possono essere stampate le codifiche, ma
uno di loro (-x) è speciale: dice a Enca di ricodificare i file con un'altra codifica ENC.
Queste opzioni si escludono a vicenda; se specifichi più di un selettore del tipo di output
l'ultimo ha la precedenza.

Diversi tipi di output rappresentano il nome del set di caratteri utilizzato da qualche altro programma, ma non tutti questi
i programmi conoscono tutti i set di caratteri che Enca riconosce. Attenzione, Enca non fa differenza
tra set di caratteri non riconosciuto e set di caratteri senza nome in un dato spazio dei nomi in tale
situazioni.

-d, --particolari
In passato stampava alcune pagine di dettagli sul processo di indovinello, ma poiché Enca
è solo un programma collegato alla libreria Enca, questo non è possibile e questa opzione
è più o meno equivalente a --leggibile dagli umani, tranne che segnala il motivo dell'errore quando
Enca non riconosce la codifica.

-e, --enca-nome
Stampa il bel nome del set di caratteri di Enca, cioè forse il più generalmente accettato
e identificatore di set di caratteri più o meno leggibile dall'uomo, con superfici aggiunte.

Questo nome viene utilizzato anche quando si chiama un convertitore esterno.

-f, --leggibile dagli umani
Stampa la descrizione verbale del set di caratteri e delle superfici rilevati: qualcosa di umano
capisce meglio. Questo è il comportamento predefinito.

Il formato preciso è il seguente: la prima riga contiene solo il nome del set di caratteri e
è seguito da zero o più righe rientrate contenenti i nomi delle superfici rilevate.
Tuttavia, questo formato non è adatto o destinato a un'ulteriore lavorazione meccanica,
e le descrizioni verbali del set di caratteri sono come cambiare in futuro.

-i, --nome-iconv
Stampa come iconv(3) (e/o iconv(1)) chiama il set di caratteri rilevato. Più precisamente,
stampa uno, più o meno arbitrariamente scelto, alias accettato da iconv. un set di caratteri
sconosciuto a iconv conta come sconosciuto.

Questo tipo di output ha senso solo quando Enca è compilato con il supporto iconv (caratteristica
+iconv-interfaccia).

-r, --rfc1345-nome
Stampa il nome del set di caratteri RFC 1345. Quando tale nome non esiste perché RFC 1345
non definisce una data codifica, qualche altro nome definito in qualche altro RFC o semplicemente
viene stampato il nome che l'autore considera 'il più canonico'.

Poiché RFC 1345 non definisce le superfici, non vengono aggiunte informazioni sulla superficie.

-m, --nome-mime
Stampa il nome MIME preferito del set di caratteri rilevato. Questo è il nome che dovresti
normalmente utilizzato per correggere e-mail o pagine web.

Un set di caratteri non presente in http://www.iana.org/assignments/character-sets conta come
Sconosciuto.

-s, --cstocs-nome
Stampa come cstocs(1) chiama il set di caratteri rilevato. Un set di caratteri sconosciuto a cstocs
conta come sconosciuto.

-n, --nome=PAROLA
Stampa il nome del set di caratteri (codifica) selezionato da PAROLA (può essere abbreviato finché è
inequivocabile). Per i nomi sopra elencati, --nome=PAROLA è equivalente --PAROLA.

utilizzando alias poiché il tipo di output fa sì che Enca stampi l'elenco di tutti gli alias accettati
del set di caratteri rilevato.

-x, --converti in=[..]ENC
Converte il file in codifica ENC.

L'opzionale `..' prima del nome della codifica non ha un significato speciale, tranne che puoi usare
per ricordarti che, a differenza di in ricodificare(1), dovresti specificare desiderato
codifica, invece di corrente.

Puoi usare ricodificare(1) catene di ricodifica o qualsiasi altro tipo di ricodifica senza cervello
specifica per ENC, a patto che tu dica a Enca di usare qualche strumento di comprensione
per la conversione (vedi sezione CONVERSIONE).

Quando Enca non riesce a determinare la codifica, stampa un avviso e lascia il
file così com'è; quando viene eseguito come filtro, cerca di fare del suo meglio per copiare lo standard
input allo standard output invariato. Tuttavia, non dovresti fare affidamento su di esso e farlo
di backup.

indovinare parametri
Ce n'è solo uno: -L impostazione della lingua dei file di input. Questa opzione è obbligatoria (ma vedi
sotto).

-L, --lingua=LUNGO
Imposta la lingua dei file di input su LUNGO.

Più precisamente, LUNGO puòessere qualsiasi nome locale valido (o alias con +locale-alias
funzione) di alcune lingue supportate. Puoi anche specificare "nessuno" come nome della lingua,
vengono riconosciute solo le codifiche multibyte. Correre

enca --list language

per ottenere l'elenco delle lingue supportate. Quando non specifichi alcuna lingua ci prova Enca
per indovinare la tua lingua dalle impostazioni internazionali e presuppone che i file di input usino questo
linguaggio. Vedi sezione LE LINGUE per i dettagli.

Conversione parametri
darti un controllo più preciso su come verrà eseguita la conversione del set di caratteri. Non influiscono
qualsiasi cosa quando -x non è specificato come tipo di output. Si prega di vedere la sezione CONVERSIONE per l'
dettagli di conversione cruenti.

-C, --try-convertitori=ELENCO
Aggiunge separato da virgole ELENCO all'elenco dei convertitori che verranno provati quando si
chiedere la conversione. I loro nomi possono essere abbreviati finché sono
inequivocabile. Correre

enca --list convertitori

per ottenere l'elenco di tutti i nomi di convertitori validi (e vedere la sezione CONVERSIONE per la loro
descrizione).

L'elenco predefinito dipende da come è stato compilato Enca, esegui

enca --aiuto

per scoprire l'elenco dei convertitori predefiniti.

Nota che l'elenco predefinito viene utilizzato solo quando non lo specifichi -C affatto. Altrimenti,
la lista è costruita come se inizialmente fosse vuota e ogni -C aggiunge nuovi convertitori
ad esso. Inoltre, specificando nessuna poiché il nome del convertitore provoca la cancellazione del convertitore
elenco.

-E, --external-converter-programma=PERCORSO
Imposta il nome del programma del convertitore esterno su PERCORSO. Il convertitore esterno predefinito dipende
su come enca è stato rispettato, e la possibilità di utilizzare convertitori esterni può
non essere affatto disponibile. Correre

enca --aiuto

per scoprire il programma di conversione predefinito nella build enca.

Generale Opzioni
non si adatta ad altre categorie di opzioni...

-p, --con-nomefile
Forza Enca a prefissare ogni risultato con il nome del file corrispondente. Per impostazione predefinita, Enca
antepone i risultati con i nomi dei file quando viene eseguito su più file.

L'input standard viene stampato come STDIN e uscita standard come STDOUT (quest'ultimo può essere
probabilmente visualizzato solo nei messaggi di errore).

-P, --no-nomefile
Forza Enca a non anteporre i risultati ai nomi dei file. Per impostazione predefinita, Enca non ha il prefisso
risultato con il nome del file quando eseguito su un singolo file (incluso l'input standard).

-V, --verboso
Aumenta il livello di verbosità (ogni utilizzo lo aumenta di uno).

Attualmente questa opzione non è molto utile perché diverse parti di Enca rispondono
in modo diverso allo stesso livello di verbosità, per lo più per niente.

Annunci
sono tutti terminali, cioè quando Enca ne incontra alcuni stampa l'elenco richiesto
e termina senza elaborare alcuna delle seguenti opzioni.

-h, --Aiuto
Stampa una breve guida all'uso.

-G, --licenza
Stampa la licenza Enca completa (se possibile tramite un cercapersone).

-l, --lista=PAROLA
Elenco stampe specificato da PAROLA (può essere abbreviato purché non sia ambiguo).
Gli elenchi disponibili includono:

set di caratteri incorporati. Tutte le codifiche convertibili tramite convertitore integrato, per gruppo (entrambi
la codifica di input e output deve provenire da questo elenco e appartenere allo stesso gruppo per
conversione interna).

codifiche integrate. Equivalente a set di caratteri incorporati, ma considerato obsoleto; volere
essere accettato con un avvertimento, per un po'.

convertitori. Tutti i nomi dei convertitori validi (da utilizzare con -C).

set di caratteri. Tutte le codifiche (charset). Puoi selezionare quali nomi verranno stampati
con --nome o qualsiasi selettore del tipo di output del nome (ovviamente, solo le codifiche che hanno a
verrà stampato il nome nello spazio dei nomi specificato), il selettore deve essere specificato
prima --elenco.

codifiche. Equivalente a set di caratteri, ma considerato obsoleto; sarà accettato con
un avvertimento, per un po'.

le lingue. Tutte le lingue supportate insieme ai set di caratteri che le appartengono. Nota
il tipo di output seleziona lo stile del nome della lingua, non lo stile del nome del set di caratteri qui.

nomi. Tutti i possibili valori di --nome opzione.

list. Tutti i possibili valori di questa opzione. (Pazzo?)

superfici. Tutte le superfici che Enca riconosce.

-v, --versione
Stampa la versione del programma e l'elenco delle funzioni (vedere la sezione CARATTERISTICHE).

CONVERSIONE


Sebbene Enca sia stato originariamente progettato solo come strumento per indovinare la codifica, ora
dispone di diversi metodi di conversione del set di caratteri. Puoi controllare quale di loro sarà
utilizzato con -C.

Enca prova in sequenza i convertitori dall'elenco specificato da -C finché non ne trova qualcuno che
è in grado di eseguire la conversione richiesta o finché non esaurisce l'elenco. Dovresti specificare
convertitori preferiti prima, meno preferiti dopo. Convertitore esterno (esterno) dovrebbe essere
specificato sempre per ultimo, solo come ultima risorsa, poiché di solito non è possibile recuperare
quando fallisce. L'elenco predefinito dei convertitori inizia sempre con incassato e poi
prosegue con il primo disponibile da: codice libero, iconv, niente.

Va notato che quando Enca dice che non è in grado di eseguire la conversione significa solo
nessuno dei convertitori è in grado di eseguirlo. Può essere ancora possibile eseguire il
ha richiesto la conversione in più passaggi, utilizzando diversi convertitori, ma per capire come,
l'intelligenza umana è probabilmente necessaria.

Built-in convertitore
è il più semplice e di gran lunga il più veloce di tutti, può eseguire solo pochi byte per byte
conversioni e modifica i file direttamente sul posto (può essere considerato pericoloso, ma è
abbastanza efficiente). Puoi ottenere un elenco di tutte le codifiche con cui può convertire

enca --list integrato

Oltre alla velocità, il suo principale vantaggio (e anche svantaggio) è che non gli importa: è
converte semplicemente i caratteri che hanno una rappresentazione nella codifica di destinazione, non tocca
qualsiasi altra cosa e non stampa mai alcun messaggio di errore.

Questo convertitore può essere specificato come incassato con -C.

codice libero convertitore
è un'interfaccia per la libreria di ricodifica GNU, che esegue l'effettivo lavoro di ricodifica. Può o può
non essere compilato in; correre

enca --versione

per scoprire la sua disponibilità nella tua build enca (funzione + interfaccia-librecode).

Dovresti avere familiarità con ricodificare(1) prima di usarlo, poiché la ricodifica è un'operazione tranquilla
strumento di conversione di set di caratteri sofisticato e potente. Potresti incontrare problemi nell'usarlo
insieme ad Enca soprattutto perché il supporto di Enca per superfici non compatibili al 100%,
perché recode si sforza troppo per rendere reversibile la trasformazione, perché a volte
ignora silenziosamente gli errori di I/O e perché è incredibilmente bacato. Si prega di consultare la ricodifica GNU
pagine info per i dettagli sulla libreria di ricodifica.

Questo convertitore può essere specificato come codice libero con -C.

Iconv convertitore
è un'interfaccia per UNIX98 iconv(3) funzioni di conversione, che eseguono la ricodifica effettiva
lavoro. Può o non può essere compilato in; correre

enca --versione

per scoprire la sua disponibilità nella tua build enca (funzione +iconv-interface).

Sebbene iconv sia presente sulla maggior parte dei sistemi odierni, solo raramente offre un set utile di
conversioni disponibili, l'unica eccezione degna di nota è iconv da GNU libc. è
di solito piuttosto schizzinoso anche sulle superfici (mentre, allo stesso tempo, non implementa la superficie
conversione). Tuttavia rappresenta probabilmente l'unico strumento standard(izzato) in grado di eseguire
conversione da/a Unicode. Si prega di consultare la documentazione di iconv per i dettagli sulla sua
capacità del tuo particolare sistema.

Questo convertitore può essere specificato come iconv con -C.

Esterno convertitore
è uno strumento di conversione esterno arbitrario che può essere specificato con -E opzione (al massimo una
possono essere definiti contemporaneamente). Ci sono alcuni standard, forniti insieme all'enca:
cstocs, ricodificare, carta geografica, ummape piconv. Sono tutti script wrapper: for cstocs(1) ricodificare(1)
carta geografica(1) ummap(1), e piconv(1).

Si prega di notare che enca ha poco controllo su ciò che fa realmente il convertitore esterno. Se imposti
ad /bin/rm sei pienamente responsabile delle conseguenze.

Se vuoi creare il tuo convertitore da utilizzare con enca, dovresti sapere che lo è sempre
detto

CONVERTITORE ENC_CORRENTE ENC RISORSE [-]

where CONVERTITORE è ciò che è stato impostato da -E, ENC_CORRENTE viene rilevata la codifica, ENC è quello
è stato specificato con -xe RISORSE è il file da convertire, cioè viene chiamato per ciascuno
file separatamente. Il quarto parametro opzionale, -, dovrebbe causare (quando presente) l'invio
risultato della conversione in output standard invece di sovrascrivere il file RISORSE.
il convertitore dovrebbe anche occuparsi di non modificare i permessi dei file, restituendo il codice di errore 1
quando fallisce e pulisce i suoi file temporanei. Si prega di consultare lo standard esterno
convertitori per esempi.

Questo convertitore può essere specificato come esterno con -C.

Predefinito bersaglio set di caratteri
Il modo semplice per specificare il set di caratteri di destinazione è il -x opzione, che sovrascrive qualsiasi
predefiniti. Quando Enca è chiamato come conv, il set di caratteri di destinazione predefinito è selezionato esattamente come
allo stesso modo di ricodificare(1) lo fa.

Se l' DEFAULT_CHARSET la variabile di ambiente è impostata, viene utilizzata come set di caratteri di destinazione.

Altrimenti, se il sistema fornisce il nl_langinfo(3) funzione, locale attuale
set di caratteri viene utilizzato come set di caratteri di destinazione.

Quando entrambi i metodi falliscono, Enca si lamenta e termina.

Reversibilità note
Se la reversibilità è cruciale per te, non dovresti usare affatto enca come convertitore (o forse
puoi, con un design molto specifico ricodificare(1) involucro). Altrimenti dovresti a
almeno sappi che ci sono quattro mezzi di base per gestire le entità carattere inconvertibili:

fail--anche questa è una possibilità, e per inciso è esattamente ciò che l'attuale GNU libc
l'implementazione di iconv lo fa (si può anche dire a ricodifica di farlo)

non toccarli: questo è ciò che fa sempre il convertitore interno enca e può fare la ricodifica;
sebbene non sia reversibile, un essere umano è solitamente in grado di ricostruire l'originale (at
almeno in linea di principio)

approssimarli: questo è ciò che può fare cstocs e anche ricodificare, sebbene in modo diverso; e il
la scelta migliore se vuoi solo rendere leggibile il testo maledetto

eliminali: questo è ciò che possono fare sia recode che cstocs (cstocs può anche sostituirli
caratteri da qualche carattere fisso invece di ignorare semplicemente); utile quando il
i caratteri da omettere contengono solo rumore.

Si prega di consultare il manuale del convertitore preferito per i dettagli di questo problema. In genere, se
non sei abbastanza fortunato da avere tutti i caratteri convertibili nel tuo file, manuale
l'intervento è comunque necessario.

Prestazione note
Le scarse prestazioni dei convertitori disponibili sono state una delle ragioni principali per l'inclusione
convertitore integrato in enca. Prova a usarlo quando possibile, ad esempio quando i file in
considerazione sono charset sufficientemente puliti o charset abbastanza disordinati in modo che il suo zero built-in
l'intelligenza non conta. Non richiede spazio su disco aggiuntivo né memoria aggiuntiva e può
outperform ricodificare(1) più di 10 volte su file di grandi dimensioni e versione Perl (cioè la più veloce
uno di cstocs(1) più di 400 volte su file di piccole dimensioni (in effetti è veloce quasi quanto un semplice
cp(1)).

Cerca di evitare convertitori esterni quando non è assolutamente necessario poiché tutte le biforcazioni
e spostare le cose è incredibilmente lento.

CODICI


Puoi ottenere l'elenco dei set di caratteri riconosciuti con

enca --list set di caratteri

e usando --nome parametro è possibile selezionare qualsiasi nome che si desidera utilizzare nell'elenco.
Puoi anche elencare tutte le superfici con

enca --list superfici

La codifica e i nomi delle superfici non fanno distinzione tra maiuscole e minuscole e i caratteri non alfanumerici non lo sono
preso in considerazione. Tuttavia, i caratteri non alfanumerici per lo più non sono affatto consentiti.
Gli unici consentiti sono: `-', `_', `.', `:' e `/' (come set di caratteri/separatore di superficie). Così
"ibm852" e "IBM-852" sono gli stessi, mentre "IBM 852" non è accettato.

set di caratteri
Il seguente elenco di set di caratteri riconosciuti utilizza i nomi di Enca (-e) e descrizioni verbali come
segnalato da Enca (-f):

ASCII caratteri ASCII a 7 bit
ISO-8859-2 Norma ISO 8859-2; ISO latino 2
ISO-8859-4 Norma ISO 8859-4; latino 4
ISO-8859-5 Norma ISO 8859-5; cirillico ISO
ISO-8859-13 Norma ISO 8859-13; ISO Baltico; latino 7
ISO-8859-16 Norma ISO 8859-16
CP1125 Codice MS-Windows 1125
CP1250 Codice MS-Windows 1250
CP1251 Codice MS-Windows 1251
CP1257 Codice MS-Windows 1257; WinBaltRim
IBM852 Pagina codici IBM/MS 852; PC (DOS) Latino 2
IBM855 Pagina codici IBM/MS 855
IBM775 Pagina codici IBM/MS 775
IBM866 Pagina codici IBM/MS 866
baltico ISO-IR-179; baltico
KEYBCS2 codifica Kamenicky; KEYBCS2
macce Macintosh dell'Europa centrale

maccyr Macintosh Cirillico
ECMA-113 Ecma Cirillico; ECMA-113
KOI-8_CS_2 Codice KOI8-CS2 (`T602')
KOI8-R KOI8-R Cirillico
KOI8-U KOI8-U Cirillico
KOI8-UNI KOI8-Cirillico unificato
Sequenze di controllo TeX (La)TeX
UCS-2 Set di caratteri universale 2 byte; UCS-2; BMP
UCS-4 Set di caratteri universale 4 byte; UCS-4; ISO-10646
UTF-7 Formato di trasformazione universale 7 bit; UTF-7
UTF-8 Formato di trasformazione universale 8 bit; UTF-8
CORK Codifica del sughero; T1
Standard nazionale cinese semplificato GBK; GB2312
BIG5 Standard industriale cinese tradizionale; Big5
HZ HZ codificato GB2312
sconosciuto Codifica non riconosciuta

where Sconosciuto non è una vera codifica, viene segnalato quando Enca non è in grado di dare un
risposta affidabile.

superfici
Enca ha qualche supporto sperimentale per le cosiddette superfici (vedi sotto). rileva
seguenti superfici (non tutte possono essere applicate a tutti i set di caratteri):

/CR Terminatori di linea CR
/LF Terminatori di linea LF
/CRLF Terminatori di linea CRLF
NA Terminatori di linea misti
NA Circondato da/intermezzato con dati non di testo
/21 Ordine byte invertito a coppie (1,2 -> 2,1)
/4321 Ordine dei byte invertito al quadruplo (1,2,3,4 -> 4,3,2,1)
NA Pezzi piccoli e grandi di endian, concatenati
/qp Citato-stampabile codificato

Nota che alcune superfici hanno NA al posto dell'identificatore: non possono essere specificate a comando
linea, possono essere segnalati solo da Enca. Questo è intenzionale perché ti informano solo
perché il file non può essere considerato consistente in superficie invece di rappresentare un vero?
superficie.

Ogni set di caratteri ha la sua superficie naturale (chiamata "implicita" in recode) che non è riportata,
ad esempio, per il set di caratteri IBM 852 è `terminatori di riga CRLF'. Per le codifiche UCS, il big endian è
considerata come superficie naturale; gli ordini di byte insoliti sono costruiti da 21 e 4321
permutazioni: 2143 è riportato semplicemente come 21, mentre 3412 è riportato come combinazione di 4321
e 21.

UTF-8 doppiamente codificato non è né un set di caratteri né una superficie, è solo segnalato.

WRI set di caratteri, codifiche ed superfici
Charset è un insieme di entità carattere mentre la codifica è la sua rappresentazione nei termini
di byte e bit. In Enca, la parola codifica significa lo stesso di "rappresentazione del testo",
cioè la relazione tra sequenza di entità caratteriali che costituiscono il testo e
sequenza di byte (bit) che costituiscono il file.

Quindi, la codifica è sia un set di caratteri che la cosiddetta superficie (terminatori di riga, ordine dei byte,
combinazione, trasformazione Base64, ecc.). Tuttavia, risulta conveniente lavorare con
alcune coppie {charset,surface} come con i set di caratteri originali. Quindi, come in ricodificare(1), tutti gli UCS- e
Le codifiche UTF del set di caratteri Universal sono chiamate set di caratteri. Si prega di vedere ricodifica
documentazione per ulteriori dettagli su questo problema.

L'unica cosa buona delle superfici è: quando non inizi a giocarci, neanche
Enca non partirà e cercherà di comportarsi il più possibile da superficiale ignaro
programma, anche quando si parla di ricodifica.

LE LINGUE


Enca ha bisogno di conoscere la lingua dei file di input per funzionare in modo affidabile, almeno in caso di
normale codifica a 8 bit. Le codifiche multibyte dovrebbero essere riconosciute per qualsiasi latino, cirillico
o lingua greca.

Puoi (o devi) usare -L opzione per dire a Enca la lingua. Dal momento che le persone più spesso
lavorare con file nella stessa lingua per la quale hanno configurato le impostazioni locali, Enca prova
cerca di indovinare la lingua esaminando il valore di LC_CTYPE e altre categorie locali
(per favore consulta località(7)) e usarlo per la lingua quando non ne specifichi alcuna. Di
ovviamente, potrebbe essere completamente sbagliato e ti darà risposte senza senso e ti danneggerà
file, quindi per favore non dimenticare di usare il -L opzione. Puoi anche usare ENCAOPT ambiente
variabile per impostare una lingua predefinita (vedi sezione AMBIENTE).

Le seguenti lingue sono supportate da Enca (ogni lingua è elencata insieme a quella supportata
codifiche a 8 bit).

Bielorusso CP1251 IBM866 ISO-8859-5 KOI8-UNI maccyr IBM855
Bulgaro CP1251 ISO-8859-5 IBM855 maccyr ECMA-113
Ceco ISO-8859-2 CP1250 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
Estone ISO-8859-4 CP1257 IBM775 ISO-8859-13 macce baltiche
Croato CP1250 ISO-8859-2 IBM852 macce CORK
Ungherese ISO-8859-2 CP1250 IBM852 macce CORK
Lituano CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
Lettone CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
Polacco ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 baltico CORK
Russo KOI8-R CP1251 ISO-8859-5 IBM866 maccyr
Slovacco CP1250 ISO-8859-2 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
Sloveno ISO-8859-2 CP1250 IBM852 macce CORK
Ucraino CP1251 IBM855 ISO-8859-5 CP1125 KOI8-U maccyr
Cinese GBK BIG5 HZ
nessuna

La lingua speciale nessuna può essere abbreviato in __, non contiene codifiche a 8 bit, quindi solo
vengono rilevate codifiche multibyte.

Puoi anche utilizzare i nomi delle impostazioni locali invece delle lingue:

essere bielorusso
bulgaro bg
ceco cs
estone et
croato hr
hu . ungherese
lituano lt
lettone lv
polacco più
Russa russa
slovacco
sloveno sl
ucraino regno unito
cinese zh

CARATTERISTICHE


Diverse funzionalità di Enca dipendono da ciò che è disponibile sul tuo sistema e da come era
compilato. Puoi ottenere la loro lista con

enca --versione

Il segno più prima del nome di una funzione significa che è disponibile, il segno meno significa che questa build è carente
la caratteristica particolare.

interfaccia librecode. Enca ha un'interfaccia per la conversione del set di caratteri della libreria di ricodifica GNU
funzioni.

interfaccia iconv. Enca ha un'interfaccia per le funzioni di conversione del set di caratteri iconv UNIX98.

convertitore-esterno. Enca può utilizzare programmi di conversione esterni (se ne hai uno adatto
installato).

rilevamento della lingua. Enca cerca di indovinare la lingua (-L) da locali. Non hai bisogno di
--linguaggio opzione, almeno in linea di principio.

alias locale. Enca è in grado di decifrare gli alias locali utilizzati per i nomi delle lingue.

target-charset-auto. Enca prova a rilevare il tuo set di caratteri preferito dalle impostazioni locali. Opzione
--auto-converti e chiamando Enca as conv funziona, almeno in linea di principio.

ENCAOPT. Enca è in grado di analizzare correttamente questa variabile di ambiente prima della riga di comando
parametri. Cose semplici come ENCAOPT="-L UK" funzionerà anche senza questa funzione.

AMBIENTE


La variabile ENCAOPT può contenere una serie di opzioni Enca predefinite. Il suo contenuto è interpretato
prima degli argomenti della riga di comando. Sfortunatamente, questo non funziona ovunque (deve avere
+ funzione ENCAOPT).

LC_CTYPE, LC_COLLATE, LC_MESSAGGI (forse ereditato da LC_TUTTI or LUNGO) è usato per
indovinare la tua lingua (deve avere +funzione di rilevamento della lingua).

La variabile DEFAULT_CHARSET può essere utilizzato da conv come set di caratteri di destinazione predefinito.

DIAGNOSTICA


Enca restituisce il codice di uscita 0 quando tutti i file di input sono stati eseguiti con successo (cioè tutti
sono state rilevate le codifiche e tutti i file sono stati convertiti nella codifica richiesta, se la conversione
è stato chiesto). Il codice di uscita 1 viene restituito quando Enca non è stato in grado di indovinare la codifica o
eseguire la conversione su qualsiasi file di input perché non è abbastanza intelligente. Il codice di uscita 2 è
restituito in caso di problemi gravi (es. I/O).

SICUREZZA


Dovrebbe essere possibile far lavorare Enca incustodita, è il suo obiettivo. Però:

Non c'è garanzia che il rilevamento funzioni al 100%. Non scommetterci, puoi facilmente perdere
dati preziosi.

Non usare enca (il programma), collega invece a libenca se vuoi qualcosa di simile
sicurezza. Quindi devi eseguire tu stesso l'eventuale conversione.

Non utilizzare convertitori esterni. Idealmente, disabilitali in fase di compilazione.

Fare attenzione a ENCAOPT e tutta l'automagia incorporata che indovina varie cose da
ambiente, vale a dire locali.

Utilizzare enca online utilizzando i servizi onworks.net


Server e workstation gratuiti

Scarica app per Windows e Linux

  • 1
    itop - ITSM CMDB OpenSource
    ittop - ITSM CMDB OpenSource
    Portale delle operazioni IT: un open completo
    sorgente, ITIL, servizio web based
    strumento di gestione compreso un full
    CMDB personalizzabile, un sistema di helpdesk e
    un uomo dei documenti...
    Scarica ittop - ITSM CMDB OpenSource
  • 2
    Clementine
    Clementine
    Clementine è una musica multipiattaforma
    giocatore e organizzatore di librerie ispirato da
    Amarok 1.4. Ha un veloce e
    interfaccia facile da usare, e ti permette di
    cerca e...
    Scarica Clementina
  • 3
    XISMUS
    XISMUS
    ATTENZIONE: l'aggiornamento cumulativo 2.4.3 ha
    stato rilasciato!! L'aggiornamento funziona per qualsiasi
    precedente versione 2.xx. Se stai aggiornando
    dalla versione v1.xx, scaricare e
    i ...
    Scarica XISMuS
  • 4
    facetrack noir
    facetrack noir
    Programma headtracking modulare che
    supporta più face tracker, filtri
    e protocolli di gioco. Tra i tracker
    sono SM FaceAPI, AIC Inertial Head
    Inseguitore...
    Scarica facetrack noir
  • 5
    Codice QR PHP
    Codice QR PHP
    Il codice QR PHP è open source (LGPL)
    libreria per la generazione di QR Code,
    Codice a barre bidimensionale. Basato su
    libreria libqrencode C, fornisce API per
    creazione barra QR Code...
    Scarica codice QR PHP
  • 6
    freeciv
    freeciv
    Freeciv è un gioco a turni gratuito
    gioco di strategia multiplayer, in cui ciascuno
    giocatore diventa il leader di a
    civiltà, lottando per ottenere il
    obiettivo finale: diventare...
    Scarica Freeciv
  • Di Più "

Comandi Linux

Ad