Aceasta este comanda uconv care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
uconv - convertiți datele de la o codificare la alta
REZUMAT
uconv [ -h, -?, --Ajutor ] [ -V, --versiune ] [ -s, --tăcut ] [ -v, --verbos ] [ -l, --listă
| -l, --list-code cod | --cod-implicit | -L, --list-transliteratori ] [ --canon ] [ -x
transliterare ] [ --pentru-apel invers suna inapoi | -c ] [ --de-apel invers suna inapoi | -i ] [
--suna inapoi suna inapoi ] [ --da înapoi | --fără retragere ] [ -b, --dimensiunea blocului mărimea ] [ -f,
--din-cod codare ] [ -t, --a coda codare ] [ --adăugați-semnătură ] [ --elimină-semnătură
] [ -o, --ieșire fişier ] [ fişier... ]
DESCRIERE
uconv convertește sau transcodează fiecare dată fişier (sau intrarea sa standard dacă nu fişier is
specificat) dintr-unul codare altcuiva. Transcodarea se face folosind Unicode ca pivot
codificare (adică datele sunt mai întâi transcodate din codificarea lor originală în Unicode și
apoi de la Unicode la codificarea destinației).
Daca un codare nu este specificat sau este -, este folosită codarea implicită. Astfel, sunând uconv
Cu nu codare oferă o modalitate ușoară de a valida și igieniza fișierele de date pentru mai departe
consumul de instrumente care necesită date în codificarea implicită.
Când suni uconv, este posibil să specificați apeluri inverse care sunt utilizate pentru a gestiona invalid
caractere introduse sau caractere care nu pot fi transcodate la destinație
codificare. Unele codificări, de exemplu, oferă un caracter de substituție implicit care poate fi
folosit pentru a reprezenta apariția unor astfel de caractere în intrare. Alte apeluri inverse oferă a
reprezentare vizuală utilă a datelor invalide.
uconv poate rula și cea specificată transliterare asupra datelor transcodate, caz în care
transliterarea va avea loc ca pas intermediar, după ce datele au fost transcodificate
la Unicode. The transliterare poate fi fie o listă de puncte separate prin punct și virgulă
nume de transliterator sau un set arbitrar de reguli complexe în transliterarea ICU
formatul regulilor.
În scopuri de transcodare, uconv opțiunile sunt compatibile cu cele ale inconv(1), făcându-l
ușor de înlocuit în scripturi. Nu este neapărat cazul, însă, codificarea
nume folosite de uconv și UTI sunt aceleași cu cele folosite de inconv(1). De asemenea, opțiuni care
furnizați date informaționale, cum ar fi -l, --listă unul oferit de unii inconv(1) variante
precum GNU, produc date într-un format ușor diferit și mai ușor de analizat.
OPŢIUNI
-h, -?, --Ajutor
Tipăriți ajutor despre utilizare și ieșire.
-V, --versiune
Tipăriți versiunea de uconv și ieșire.
-s, --tăcut
Suprimați mesajele în timpul execuției.
-v, --verbos
Afișează mesaje informative suplimentare în timpul execuției.
-l, --listă
Listați toate codificările disponibile și ieșiți.
-l, --list-code cod
Enumerați numai cod codificare și ieșire. Dacă cod nu este o codificare adecvată, ieșiți cu
o eroare.
--cod-implicit
Listați numai numele codificării implicite și ieșiți.
-L, --list-transliteratori
Enumerați toate transliteratorii disponibili și ieșiți.
--canon
Dacă este folosit cu -l, --listă or --cod-implicit, lista de codificări este produsă în a
format compatibil cu convrtrs.txt(5). Dacă este folosit cu -L, --list-transliteratori,
tipăriți un singur nume de transliterator pe rând.
-x transliterare
Rulați data transliterare pe datele Unicode transcodate și utilizați
date transliterate ca intrare pentru transcodare la codificarea destinației.
--pentru-apel invers suna inapoi
Utilizare suna inapoi pentru a gestiona caractere care nu pot fi transcodate la destinație
codificare. Vezi secțiunea Apeluri inverse pentru detalii despre apelurile returnate valide.
-c Omiteți caracterele nevalide din rezultat. La fel ca --pentru-apel invers sări.
--de-apel invers suna inapoi
Utilizare suna inapoi pentru a gestiona caractere care nu pot fi transcodate din original
codificare. Vezi secțiunea Apeluri inverse pentru detalii despre apelurile returnate valide.
-i Ignorați secvențele nevalide din intrare. La fel ca --de-apel invers sări.
--suna inapoi suna inapoi
Utilizare suna inapoi pentru a gestiona ambele caractere care nu pot fi transcodate din original
codificare și caractere care nu pot fi transcodate în codificarea destinației. Vedea
secțiune Apeluri inverse pentru detalii despre apelurile returnate valide.
--da înapoi
Utilizați maparea alternativă atunci când transcodați din Unicode la codificarea destinației.
--fără retragere
Nu utilizați maparea alternativă atunci când transcodați din Unicode la destinație
codificare. Aceasta este valoarea implicită.
-b, --dimensiunea blocului mărimea
Citiți intrarea în blocuri de mărimea octeți la un moment dat. Dimensiunea implicită a blocului este 4096.
-f, --din-cod codare
Setați codificarea originală a datelor la codare.
-t, --a coda codare
Transcodați datele în codare.
--adăugați-semnătură
Adăugați un caracter de semnătură Unicode U+FEFF (BOM) dacă setul de caractere de ieșire îl acceptă
și oricum nu adaugă unul.
--elimină-semnătură
Eliminați un caracter de semnătură Unicode U+FEFF (BOM).
-o, --ieșire fişier
Scrieți datele transcodate în fişier.
Apeluri inverse
uconv acceptă specificarea apelurilor inverse pentru a gestiona date nevalide. Reapelurile pot fi setate pentru ambele
direcții de transcodare: de la codarea originală la Unicode, cu --de-apel invers
opțiunea și de la Unicode la codificarea destinației, cu --pentru-apel invers opțiune.
Următoarea este o listă de valide suna inapoi numele, împreună cu o descriere a acestora
comportament. Lista de apeluri inverse suportate efectiv de uconv este afișat când este apelat
implementate cu -h, --Ajutor.
substitui Scrieți secvența de înlocuire a codificării sau înlocuirea Unicode
caracter U+FFFD la transcodarea în Unicode.
sări Ignorați datele nevalide.
opri Opriți cu o eroare când întâlniți date nevalide. Aceasta este valoarea implicită
sună din nou.
scăpa La fel ca escape-icu.
escape-icu Înlocuiți caracterele lipsă cu un șir de format %Uhhhh pentru
plan 0 caractere și %Uhhhh%Uhhhh pentru avioanele 1 și mai sus,
Unde hhhh este valoarea hexazecimală a uneia dintre unitățile de cod UTF-16
reprezentând personajul. Caracterele din planurile 1 și mai sus sunt
scris ca o pereche de unități de cod surogat UTF-16.
escape-java Înlocuiți caracterele lipsă cu un șir de format \uhhhh pentru
plan 0 caractere și \uhhhh\uhhhh pentru avioanele 1 și mai sus,
Unde hhhh este valoarea hexazecimală a uneia dintre unitățile de cod UTF-16
reprezentând personajul. Caracterele din planurile 1 și mai sus sunt
scris ca o pereche de unități de cod surogat UTF-16.
evadare-c Înlocuiți caracterele lipsă cu un șir de format \uhhhh pentru
plan 0 caractere și \Uhhhhhhh pentru avioanele 1 și mai sus,
Unde hhhh și hhhhhhh sunt valorile hexazecimale ale Unicode
punct de cod.
escape-xml La fel ca escape-xml-hex.
escape-xml-hex Înlocuiți caracterele lipsă cu un șir de format &#Xhhhh;,
Unde hhhh este valoarea hexazecimală a punctului de cod Unicode.
escape-xml-dec Înlocuiți caracterele lipsă cu un șir de format &#nnnn;, În cazul în care
nnnn este valoarea zecimală a punctului de cod Unicode.
evadare-unicode Înlocuiți caracterele lipsă cu un șir de format {U+hhhh},
Unde hhhh este valoarea hexazecimală a punctului de cod Unicode. Acea
șirul hexazecimal este de lungime variabilă și poate folosi de la 4 la 6 cifre.
Acesta este formatul folosit universal pentru a desemna un punct de cod Unicode în
literatură, delimitată de bretele pentru recunoașterea ușoară a acestora
substituții în ieșire.
EXEMPLE
Convertiți datele dintr-un anumit codare la codificarea platformei:
$ uconv -f codare
Verificați dacă a fişier conține date valide pentru un anumit codare:
$ uconv -f codare -c fişier > / dev / null
Convertiți un UTF-8 fişier la un dat codare și asigurați-vă că textul rezultat este bun pentru
orice versiune de HTML:
$ uconv -f utf-8 -t codare \
--suna inapoi escape-xml-dec fişier
Afișați numele punctelor de cod Unicode într-un fișier UTF:
$ uconv -f utf-8 -x orice nume fişier
Tipăriți numele unui punct de cod Unicode a cărui valoare este cunoscută (U+30AB în acest exemplu):
$ ecou „\u30ab” | uconv -x 'hex-orice; orice nume'; ecou
{KATAKANA SCRISOARE KA}{LINE FEED}
$
(Numele sunt delimitate de acolade. De asemenea, numele terminatorului de linie este de asemenea
afișat.)
Normalizați datele UTF-8 folosind Unicode NFKC, eliminați toate caracterele de control și mapați Katakana
către Hiragana:
$ uconv -f utf-8 -t utf-8 \
-x '::nfkc; [:Cc:] >; ::katakana-hiragana;'
Avertismente AND GANDACI
uconv raportează erorile care apar la primul octet invalid întâlnit. Aceasta ar putea fi
confuz pentru utilizatorii GNU inconv(1), care raportează erorile care apar la primul octet al
o secvență nevalidă. Pentru seturi de caractere sau codificări multi-octeți, aceasta înseamnă că uconv
pozițiile de eroare pot fi la o compensare ulterioară în fluxul de intrare decât ar fi cazul
GNU inconv(1).
Raportarea pozițiilor de eroare atunci când este utilizat un transliterator poate fi inexactă sau
indisponibil, caz în care uconv va raporta offset-ul în fluxul de ieșire la care
a aparut o eroare.
AUTORI
Jonas Utterstroem
Yves Arrouye
VERSIUNE
55.1
DREPTURI DE AUTOR
Copyright (C) 2000-2005 IBM, Inc. și alții.
Utilizați uconv online folosind serviciile onworks.net
