InglesPransesEspanyol

Ad


OnWorks favicon

enca - Online sa Cloud

Patakbuhin ang enca sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na enca na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


enca -- tuklasin at i-convert ang pag-encode ng mga text file

SINOPSIS


enca [-L ANG WIKA] [OPTION]... [FILE] ...
enconv [-L ANG WIKA] [OPTION]... [FILE] ...

PANIMULA AT HALIMBAWA


Kung ikaw ay sapat na swerte, ang tanging dalawang bagay na kailangan mong malaman ay: utos

enca FILE

sasabihin sa iyo kung aling encoding file FILE gumagamit (nang hindi ito binabago), at

enconv FILE

ay magko-convert ng file FILE sa iyong lokal na katutubong encoding. Upang i-convert ang file sa iba pa
encoding gamitin ang -x pagpipilian (tingnan -x entry sa seksyon Opsyon at mga seksyon KONVERSYON at
MGA ENCODING para sa mga detalye).

Parehong gumagana sa maramihang mga file at karaniwang input (output) din. Hal

enca -x latin2

tinitiyak na ang file na `sometext' ay nasa ISO Latin 2 kapag ipinadala ito sa printer.

Ang pangunahing dahilan kung bakit mabibigo ang mga utos na ito at gagawing basura ang iyong mga file ay ang Enca
kailangang malaman ang kanilang wika upang matukoy ang pag-encode. Sinusubukan nitong tukuyin ang iyong wika
at ginustong charset mula sa mga setting ng lokal, na maaaring hindi ang gusto mo.

Maaari mong (o kailangang) gamitin -L opsyon na sabihin dito ang tamang wika. Kumbaga, nag-download ka
ilang Russian HTML file, `file.htm', sinasabi nitong windows-1251 pero hindi. Kaya tumakbo ka

enca -L ru file.htm

at alamin na ito ay KOI8-R (halimbawa). Mag-ingat, sa kasalukuyan ay hindi gaanong sinusuportahan
mga wika (tingnan ang seksyon WIKA).

Ang isa pang babala ay may kinalaman sa katotohanang ilang mga tampok ng Enca, lalo na ang charset conversion nito
mga kakayahan, ay lubos na nakadepende sa kung ano ang iba pang mga tool na naka-install sa iyong system (tingnan ang
seksyon CONVERSION)--takbo

enca --bersyon

upang makakuha ng listahan ng mga tampok (tingnan ang seksyon TAMPOK). Subukan din

enca --tulong

upang makakuha ng paglalarawan ng lahat ng iba pang mga opsyon sa Enca (at upang mahanap ang natitirang bahagi ng manwal na pahinang ito
kalabisan).

DESCRIPTION


Binabasa ng Enca ang ibinigay na mga text file, o karaniwang input kapag walang ibinigay, at gumagamit ng kaalaman
tungkol sa kanilang wika (dapat na suportahan mo) at isang halo ng pag-parse, istatistika
pagsusuri, paghula at black magic upang matukoy ang kanilang mga pag-encode, kung saan ito ipi-print pagkatapos
karaniwang output (o inamin nito na wala itong ideya kung ano ang maaaring maging pag-encode). Sa pamamagitan ng
default, ang Enca ay nagpapakita ng mga resulta bilang isang multiline na mga paglalarawang nababasa ng tao, marami pang iba
magagamit ang mga format--tingnan ang mga tagapili ng uri ng Output sa ibaba.

Ang Enca ay maaari ring mag-convert ng mga file sa ilang iba pang pag-encode ENC kapag hiniling mo ito--alinman sa paggamit ng a
built-in na converter, ilang library ng conversion, o sa pamamagitan ng pagtawag sa isang external na converter.

Ang pangunahing layunin ng Enca ay ang maging magagamit nang hindi nag-aalaga, bilang isang awtomatikong tool sa conversion, kahit na ito
marahil ay hindi pa umabot sa puntong ito (pakitingnan ang seksyon SEGURIDAD).

Pakitandaan maliban sa mga bihirang kaso, kailangan talagang malaman ni Enca ang wika ng mga input file na ibibigay
maaasahan mong sagot. Sa kabilang banda, maaari nitong makayanan nang maayos ang mga file na iyon
hindi puro textual o kahit na makita ang charset ng mga string ng teksto sa loob ng ilang binary file; ng
siyempre, depende ito sa katangian ng bahaging hindi teksto.

Walang pakialam ang Enca sa istruktura ng mga input file, tinitingnan nito ang mga ito bilang isang pare-parehong piraso ng
teksto/data. Sa kaso ng maraming bahagi na mga file (hal. mga mailbox), kailangan mong gumamit ng ilang tool sa pag-alam
ang istraktura upang kunin ang mga indibidwal na bahagi muna. Ito ang halaga ng kakayahang tuklasin
pag-encode ng anumang nasira, hindi kumpleto o kung hindi man ay maling mga file.

Opsyon


Mayroong ilang mga kategorya ng mga opsyon: mga opsyon sa mode ng pagpapatakbo, mga tagapili ng uri ng output,
mga parameter ng paghula, mga parameter ng conversion, pangkalahatang mga opsyon at listahan.

Ang lahat ng mahahabang opsyon ay maaaring paikliin hangga't ang mga ito ay hindi malabo, mga mandatoryong parameter
ng mga mahahabang opsyon ay sapilitan din para sa mga maiikling opsyon.

Operasyon mode
ay sumusunod:

-c, --auto-convert
Katumbas ng pagtawag kay Enca bilang enconv.

Kung walang tinukoy na tagapili ng uri ng output, tuklasin ang mga pag-encode ng file, hulaan mo
ginustong charset mula sa mga lokal, at i-convert ang mga file dito (magagamit lamang sa
+target-charset-auto na tampok).

-g, --hulaan
Katumbas ng pagtawag kay Enca bilang enca.

Kung walang tinukoy na tagapili ng uri ng output, tuklasin ang mga pag-encode ng file at iulat ang mga ito.

Pagbubuhos uri mga pipili
piliin kung anong aksyon ang gagawin ng Enca kapag natukoy nito ang pag-encode; karamihan lang sa kanila
pumili sa pagitan ng iba't ibang mga pangalan, format at kumbensyon kung paano maaaring i-print ang mga pag-encode, ngunit
isa sa kanila (-x) ay espesyal: sinasabi nito sa Enca na i-recode ang mga file sa ibang pag-encode ENC.
Ang mga pagpipiliang ito ay kapwa eksklusibo; kung tinukoy mo ang higit sa isang tagapili ng uri ng output
inuuna ang huli.

Ang ilang uri ng output ay kumakatawan sa pangalan ng charset na ginagamit ng ilang iba pang programa, ngunit hindi lahat ng ito
Alam ng mga programa ang lahat ng mga charset na kinikilala ng Enca. Mag-ingat, walang pinagkaiba ang Enca
sa pagitan ng hindi nakikilalang charset at charset na walang pangalan sa ibinigay na namespace sa naturang
sitwasyon.

-d, --mga detalye
Dati itong nagpi-print ng ilang pahina ng mga detalye tungkol sa proseso ng paghula, ngunit mula noong Enca
ay isang programa lamang na naka-link laban sa Enca library, hindi ito posible at ang pagpipiliang ito
ay halos katumbas ng --nababasa ng tao, maliban kung nag-uulat ito ng dahilan ng pagkabigo kung kailan
Hindi nakikilala ng Enca ang encoding.

-e, --enca-pangalan
Nag-print ng magandang pangalan ng charset ng Enca, ibig sabihin, marahil ang pinaka-karaniwang tinatanggap
at higit pa o mas kaunting charset identifier na nababasa ng tao, na may mga surface na nakadugtong.

Ginagamit din ang pangalang ito kapag tumatawag ng external converter.

-f, --nababasa ng tao
Nagpi-print ng pandiwang paglalarawan ng natukoy na charset at mga surface--isang bagay na tao
mas nakakaintindi. Ito ang default na pag-uugali.

Ang tumpak na format ay sumusunod: ang unang linya ay naglalaman ng pangalan ng charset lamang, at
sinusundan ito ng zero o higit pang mga naka-indent na linya na naglalaman ng mga pangalan ng mga nakitang surface.
Ang format na ito ay hindi, gayunpaman, angkop o inilaan para sa karagdagang pagpoproseso ng makina,
at ang mga paglalarawan ng verbal charset ay parang magbabago sa hinaharap.

-i, --iconv-pangalan
Nagpi-print kung paano iconv(3) (at/o iconv(1)) tumatawag sa nakitang charset. Mas tiyak,
nagpi-print ito ng isa, higit pa o hindi gaanong arbitraryong pinili, alias na tinanggap ng iconv. Isang charset
hindi kilala sa iconv ay binibilang na hindi kilala.

Ang uri ng output na ito ay may katuturan lamang kapag ang Enca ay pinagsama-sama ng iconv na suporta (feature
+iconv-interface).

-r, --rfc1345-pangalan
Nagpi-print ng pangalan ng charset ng RFC 1345. Kapag walang ganoong pangalan dahil RFC 1345
ay hindi tumutukoy sa isang ibinigay na pag-encode, ilang iba pang pangalan na tinukoy sa ilang iba pang RFC o lamang
ang pangalan na itinuturing ng may-akda na `the most canonical', ay nakalimbag.

Dahil hindi tinutukoy ng RFC 1345 ang mga surface, walang idinagdag na impormasyon sa ibabaw.

-m, --mime-name
Pini-print ang ginustong pangalan ng MIME ng nakitang charset. Ito ang dapat mong pangalan
karaniwang ginagamit kapag nag-aayos ng mga e-mail o web page.

Walang charset http://www.iana.org/assignments/character-sets binibilang bilang
hindi alam.

-s, --cstocs-name
Nagpi-print kung paano cstocs(1) tumatawag sa nakitang charset. Isang charset na hindi alam ng mga cstoc
binibilang na hindi kilala.

-n, --pangalan=WORD
Nagpi-print ng charset (encoding) na pangalan na pinili ni WORD (maaaring paikliin hangga't ito
hindi malabo). Para sa mga pangalang nakalista sa itaas, --pangalan=WORD ay katumbas ng --WORD.

paggamit alias dahil ang uri ng output ay nagiging sanhi ng Enca na mag-print ng listahan ng lahat ng tinatanggap na alias
ng nakitang charset.

-x, --convert-to=[..]ENC
Kino-convert ang file sa encoding ENC.

Ang opsyonal na `..' bago ang pag-encode ng pangalan ay walang espesyal na kahulugan, maliban kung magagamit mo
ito upang paalalahanan ang iyong sarili na, hindi katulad sa rekord(1), dapat mong tukuyin ninanais
encoding, sa halip na kasalukuyang.

Maaari mong gamitin ang rekord(1) recoding chain o anumang iba pang uri ng braindead recoding
pagtutukoy para sa ENC, sa kondisyon na sabihin mo sa Enca na gumamit ng ilang tool sa pag-unawa
ito para sa conversion (tingnan ang seksyon KONVERSYON).

Kapag nabigo ang Enca na matukoy ang pag-encode, nagpi-print ito ng babala at iniiwan ang
file bilang ay; kapag ito ay pinapatakbo bilang isang filter sinusubukan nitong gawin ang lahat ng makakaya upang kopyahin ang pamantayan
input sa karaniwang output na hindi nagbabago. Gayunpaman, hindi ka dapat umasa dito at gawin
backup

Nanghuhula parameter
May isa lamang: -L pagtatakda ng wika ng mga input file. Ang pagpipiliang ito ay sapilitan (ngunit tingnan
sa ibaba).

-L, --wika=WIKA
Itinatakda ang wika ng mga input file sa WIKA.

Mas tumpak, WIKA maaaring maging anumang wastong pangalan ng lokal (o alyas na may +locale-alias
feature) ng ilang sinusuportahang wika. Maaari mo ring tukuyin ang `wala' bilang pangalan ng wika,
ang mga multibyte na pag-encode lamang ang kinikilala noon. Takbo

enca --listahan ng mga wika

upang makakuha ng listahan ng mga sinusuportahang wika. Kapag wala kang tinukoy na wikang sinusubukan ni Enca
upang hulaan ang iyong wika mula sa mga setting ng lokal at ipinapalagay na ginagamit ito ng mga input file
wika. Tingnan ang seksyon WIKA para sa mga detalye.

Conversion parameter
bigyan ka ng mas pinong kontrol sa kung paano isasagawa ang charset conversion. Hindi sila nakakaapekto
kahit ano kapag -x ay hindi tinukoy bilang uri ng output. Mangyaring tingnan ang seksyon KONVERSYON para sa
madugong mga detalye ng conversion.

-C, --try-converters=LIST
Pinaghihiwalay ng kuwit LIST sa listahan ng mga converter na susubukan kapag ikaw
humingi ng conversion. Ang kanilang mga pangalan ay maaaring paikliin hangga't sila ay
hindi malabo. Takbo

enca --list converter

upang makakuha ng listahan ng lahat ng wastong pangalan ng converter (at tingnan ang seksyon KONVERSYON para sa kanilang
paglalarawan).

Ang default na listahan ay depende sa kung paano na-compile ang Enca, tumakbo

enca --tulong

para malaman ang default na listahan ng converter.

Tandaan na ang default na listahan ay ginagamit lamang kapag hindi mo tinukoy -C sa lahat. kung hindi,
ang listahan ay binuo na parang ito ay walang laman sa una at bawat -C nagdadagdag ng (mga) bagong converter
dito. Bukod dito, pagtukoy wala dahil ang pangalan ng converter ay nagiging sanhi ng pag-clear sa converter
listahan.

-E, --external-converter-program=PATH
Itinatakda ang pangalan ng external converter program sa PATH. Depende ang default na external converter
sa kung paano nasunod ang enca, at ang posibilidad na gumamit ng mga panlabas na converter ay maaaring
hindi magagamit sa lahat. Takbo

enca --tulong

para malaman ang default na converter program sa iyong enca build.

Pangkalahatan pagpipilian
hindi magkasya sa iba pang mga kategorya ng opsyon...

-p, --with-filename
Pinipilit ang Enca na i-prefix ang bawat resulta na may katumbas na pangalan ng file. Bilang default, Enca
mga prefix na resulta na may mga filename kapag tumatakbo sa maraming file.

Ang karaniwang input ay naka-print bilang STDIN at karaniwang output bilang STDOUT (ang huli ay maaaring
malamang na makikita sa mga mensahe ng error lamang).

-P, --walang-filename
Pinipilit ang Enca na huwag i-prefix ang mga resulta sa mga pangalan ng file. Bilang default, hindi prefix ang Enca
resulta na may pangalan ng file kapag tumakbo sa isang file (kabilang ang karaniwang input).

-V, --verbose
Pinapataas ang antas ng verbosity (bawat paggamit ay nagdaragdag nito ng isa).

Sa kasalukuyan, hindi masyadong kapaki-pakinabang ang opsyong ito dahil tumutugon ang iba't ibang bahagi ng Enca
naiiba sa parehong antas ng verbosity, karamihan ay hindi sa lahat.

Listahan
ang lahat ay terminal, ibig sabihin, kapag nakatagpo ng Enca ang ilan sa kanila ay ini-print nito ang kinakailangang listahan
at magwawakas nang hindi nagpoproseso ng anumang mga sumusunod na opsyon.

-h, - Tumulong
Nagpi-print ng maikling tulong sa paggamit.

-G, --lisensya
Nagpi-print ng buong lisensya ng Enca (sa pamamagitan ng pager, kung maaari).

-l, --listahan=WORD
Listahan ng mga print na tinukoy ni WORD (maaaring paikliin hangga't ito ay hindi malabo).
Kasama sa mga available na listahan ang:

built-in-charset. Ang lahat ng mga pag-encode ay mapapalitan ng built-in na converter, ayon sa pangkat (parehong
ang input at output encoding ay dapat mula sa listahang ito at nabibilang sa parehong grupo para sa
panloob na conversion).

built-in-encodings. Katumbas ng built-in-charset, ngunit itinuturing na hindi na ginagamit; kalooban
tanggapin nang may babala, pansamantala.

mga converter. Lahat ng wastong pangalan ng converter (gamitin sa -C).

mga charset. Lahat ng encodings (charsets). Maaari mong piliin kung anong mga pangalan ang ipi-print
sa --pangalan o anumang tagapili ng uri ng output ng pangalan (siyempre, ang mga pag-encode lamang na mayroong a
ang pangalan sa ibinigay na namespace ay ipi-print pagkatapos), dapat na tukuyin ang tagapili
bago --listahan.

mga encoding. Katumbas ng mga charset, ngunit itinuturing na hindi na ginagamit; ay tatanggapin kasama ng
isang babala, saglit.

wika. Lahat ng sinusuportahang wika kasama ng mga charset na pag-aari nila. Tandaan
Ang uri ng output ay pumipili ng estilo ng pangalan ng wika, hindi estilo ng pangalan ng charset dito.

pangalan. Lahat ng posibleng halaga ng --pangalan pagpipilian.

mga listahan. Lahat ng posibleng halaga ng opsyong ito. (Baliw?)

ibabaw. Lahat ng surface ay kinikilala ng Enca.

-v, --bersyon
Nagpi-print ng bersyon ng programa at listahan ng mga tampok (tingnan ang seksyon TAMPOK).

KONVERSYON


Kahit na ang Enca ay orihinal na idinisenyo bilang isang tool para sa paghula ng pag-encode lamang, ito na ngayon
nagtatampok ng ilang paraan ng pag-convert ng charset. Maaari mong kontrolin kung alin sa kanila ang magiging
ginamit sa -C.

Sunod-sunod na sinusubukan ng Enca ang mga converter mula sa listahang tinukoy ni -C hanggang sa makahanap ito ng ilan
ay nagagawa ang kinakailangang conversion o hanggang sa maubos nito ang listahan. Dapat mong tukuyin
ginustong mga nagko-convert muna, hindi gaanong ginusto sa ibang pagkakataon. Panlabas na converter (panlabas) ay dapat na
palaging tinutukoy ang huli, bilang huling paraan lamang, dahil kadalasan ay hindi ito posibleng mabawi
kapag nabigo ito. Ang default na listahan ng mga nagko-convert ay palaging nagsisimula sa built-in at pagkatapos ay
nagpapatuloy sa unang magagamit mula sa: librecode, iconv, wala.

Dapat pansinin kapag sinabi ni Enca na hindi nito kayang gawin ang conversion na ibig sabihin lamang nito
wala sa mga nagko-convert ang makakagawa nito. Posible pa ring maisagawa ang
kinakailangang conversion sa ilang hakbang, gamit ang ilang converter, ngunit para malaman kung paano,
kailangan siguro ng katalinuhan ng tao.

Built-in Kombertidor
ay ang pinakasimple at malayo ang pinakamabilis sa lahat, makakapagsagawa lamang ng ilang byte-to-byte
mga conversion at direktang binago ang mga file sa lugar (maaaring ituring na mapanganib, ngunit ito ay
medyo mabisa). Makakakuha ka ng listahan ng lahat ng pag-encode na maaari nitong i-convert

enca --list built-in

Bukod sa bilis, ang pangunahing bentahe nito (at kawalan din) ay wala itong pakialam: ito
nagko-convert lang ng mga character na may representasyon sa target na pag-encode, hindi na-touch
anumang bagay at hindi kailanman nagpi-print ng anumang mensahe ng error.

Ang converter na ito ay maaaring tukuyin bilang built-in sa -C.

Librecode Kombertidor
ay isang interface sa GNU recode library, na gumagawa ng aktwal na recoding na trabaho. Maaari o maaari
hindi isasama sa; tumakbo

enca --bersyon

para malaman ang availability nito sa iyong enca build (feature +librecode-interface).

Dapat pamilyar ka sa rekord(1) bago ito gamitin, dahil ang recode ay medyo
sopistikado at makapangyarihang charset conversion tool. Maaari kang magkaroon ng mga problema sa paggamit nito
kasama ang Enca lalo na dahil hindi 100% compatible ang suporta ng Enca para sa mga surface,
dahil ang recode ay sumusubok nang napakahirap na gawing mababalik ang pagbabago, dahil minsan ito
tahimik na binabalewala ang mga error sa I/O, at dahil ito ay hindi kapani-paniwalang buggy. Pakitingnan ang GNU recode
mga pahina ng impormasyon para sa mga detalye tungkol sa recode library.

Ang converter na ito ay maaaring tukuyin bilang librecode sa -C.

Iconv Kombertidor
ay isang interface sa UNIX98 iconv(3) conversion function, na gawin ang aktwal na recoding
trabaho. Ito ay maaaring o hindi maaaring pinagsama-sama sa; tumakbo

enca --bersyon

para malaman ang availability nito sa iyong enca build (feature +iconv-interface).

Bagama't ang iconv ay naroroon sa karamihan ng mga system ngayon, bihira lang itong mag-alok ng ilang kapaki-pakinabang na hanay ng
magagamit na mga conversion, ang tanging kapansin-pansing pagbubukod ay iconv mula sa GNU libc. Ito ay
kadalasan ay medyo mapili tungkol sa mga ibabaw, masyadong (habang, sa parehong oras, hindi nagpapatupad ng ibabaw
conversion). Gayunpaman, ito ay malamang na kumakatawan sa tanging standard(ized) na tool na kayang gawin
conversion mula/sa Unicode. Pakitingnan ang iconv na dokumentasyon tungkol sa para sa mga detalye tungkol dito
mga kakayahan sa iyong partikular na sistema.

Ang converter na ito ay maaaring tukuyin bilang iconv sa -C.

panlabas Kombertidor
ay isang arbitrary na panlabas na tool sa conversion na maaaring tukuyin gamit ang -E opsyon (hindi hihigit sa isa
maaaring tukuyin nang sabay-sabay). Mayroong ilang mga pamantayan, na ibinigay kasama ng enca:
cstocs, rekord, mapa, umap, at piconv. Ang lahat ay mga script ng wrapper: para sa cstocsNa (1), rekordNa (1),
mapaNa (1), umap(1), at piconvNa (1).

Pakitandaan na ang enca ay may maliit na kontrol kung ano talaga ang ginagawa ng external converter. Kung itinakda mo
ito sa /bin/rm ikaw ay ganap na responsable para sa mga kahihinatnan.

Kung gusto mong gumawa ng sarili mong converter para gamitin sa enca, dapat mong malaman na ito ay palagi
tinatawag

KONVERTER ENC_CURRENT ENC FILE [-]

saan KONVERTER ay kung ano ang itinakda ng -E, ENC_CURRENT ay nakitang pag-encode, ENC ay ano
ay tinukoy na may -x, at FILE ay ang file na iko-convert, ibig sabihin, ito ay tinatawag para sa bawat isa
hiwalay na file. Ang opsyonal na ikaapat na parameter, -, ay dapat maging sanhi (kapag naroroon) ang pagpapadala
resulta ng conversion sa karaniwang output sa halip na i-overwrite ang file FILE. ang
Dapat ding pangalagaan ng converter ang hindi pagbabago ng mga pahintulot ng file, pagbabalik ng error code 1
kapag nabigo ito at nililinis ang mga pansamantalang file nito. Pakitingnan ang karaniwang panlabas
mga converter para sa mga halimbawa.

Ang converter na ito ay maaaring tukuyin bilang panlabas sa -C.

default target charset
Ang direktang paraan ng pagtukoy ng target na charset ay ang -x opsyon, na lumalampas sa alinman
mga default. Kapag tinawag si Enca bilang enconv, ang default na target na charset ay pinili nang eksakto ang
katulad ng rekord(1) ginagawa ito.

Kung ang DEFAULT_CHARSET Nakatakda ang environment variable, ginagamit ito bilang target na charset.

Kung hindi, kung ang iyong system ay nagbibigay ng nl_langinfo(3) function, ang kasalukuyang locale's native
charset ay ginagamit bilang ang target na charset.

Kapag nabigo ang parehong pamamaraan, nagrereklamo si Enca at tinapos.

Pagkabago mga tala
Kung ang reversibility ay mahalaga para sa iyo, hindi mo dapat gamitin ang enca bilang converter (o marahil
magagawa mo, na may napaka partikular na disenyo rekord(1) pambalot). Kung hindi, dapat mong sa
hindi bababa sa alam na mayroong apat na pangunahing paraan ng paghawak ng mga hindi mapapalitang character entity:

mabibigo--ito ay isang posibilidad, masyadong, at hindi sinasadya ito ay eksakto kung ano ang kasalukuyang GNU libc
ginagawa ng pagpapatupad ng iconv (maaari ding sabihin ang recode na gawin ito)

huwag hawakan ang mga ito--ito ang palaging ginagawa at kayang gawin ng enca internal converter;
kahit na ito ay hindi nababaligtad, ang isang tao ay karaniwang kayang buuin muli ang orihinal (sa
hindi bababa sa prinsipyo)

tantiyahin ang mga ito--ito ang maaaring gawin ng cstocs, at mag-recode din, kahit na naiiba; at ang
pinakamahusay na pagpipilian kung gusto mo lang gawing nababasa ang sinumpaang teksto

i-drop out ang mga ito--ito ang maaaring gawin ng parehong recode at cstocs (maaari ding palitan ng cstocs ang mga ito
mga character sa pamamagitan ng ilang nakapirming karakter sa halip na balewalain lamang); kapaki-pakinabang kapag ang
ang mga character na dapat aalisin ay naglalaman lamang ng ingay.

Mangyaring kumonsulta sa iyong paboritong converter manual para sa mga detalye ng isyung ito. Sa pangkalahatan, kung
hindi ka mapalad na magkaroon ng lahat ng mapapalitan na mga character sa iyong file, manual
kailangan pa rin ng interbensyon.

pagganap mga tala
Ang mahinang pagganap ng mga available na converter ay isa sa mga pangunahing dahilan ng pagsasama
built-in na converter sa enca. Subukang gamitin ito hangga't maaari, ibig sabihin, kapag nakapasok ang mga file
ang pagsasaalang-alang ay sapat na malinis ang charset o sapat na magulo ang charset upang ang zero built-in nito
hindi mahalaga ang katalinuhan. Hindi ito nangangailangan ng dagdag na espasyo sa disk o dagdag na memorya at maaari
Lumabas rekord(1) higit sa 10 beses sa malalaking file at Perl na bersyon (ibig sabihin ang mas mabilis
isa sa cstocs(1) higit sa 400 beses sa maliliit na file (sa katunayan ito ay halos kasing bilis lamang
cp(1)).

Subukang iwasan ang mga panlabas na converter kapag ito ay hindi ganap na kinakailangan dahil ang lahat ng mga forking
at ang paglipat ng mga bagay-bagay sa paligid ay hindi kapani-paniwalang mabagal.

MGA ENCODING


Makakakuha ka ng listahan ng mga kinikilalang set ng character na may

enca --listahan ang mga charset

at paggamit --pangalan parameter maaari kang pumili ng anumang pangalan na gusto mong gamitin sa listahan.
Maaari mo ring ilista ang lahat ng surface na may

enca --list surface

Ang pag-encode at mga pangalan sa ibabaw ay case insensitive at ang mga hindi alphanumeric na character ay hindi
isinasaalang-alang. Gayunpaman, ang mga hindi alphanumeric na character ay kadalasang hindi pinapayagan.
Ang tanging pinapayagan ay: `-', `_', `.', `:', at `/' (bilang charset/surface separator). Kaya
Ang `ibm852' at `IBM-852' ay pareho, habang ang `IBM 852' ay hindi tinatanggap.

Mga Charset
Ang sumusunod na listahan ng mga kinikilalang charset ay gumagamit ng mga pangalan ni Enca (-e) at pandiwang paglalarawan bilang
iniulat ni Enca (-f):

ASCII 7bit ASCII na mga character
ISO-8859-2 ISO 8859-2 standard; ISO Latin 2
ISO-8859-4 pamantayang ISO 8859-4; Latin 4
ISO-8859-5 ISO 8859-5 standard; ISO Cyrillic
ISO-8859-13 ISO 8859-13 pamantayan; ISO Baltic; Latin 7
ISO-8859-16 ISO 8859-16 na pamantayan
CP1125 MS-Windows code na pahina 1125
CP1250 MS-Windows code na pahina 1250
CP1251 MS-Windows code na pahina 1251
CP1257 MS-Windows code na pahina 1257; WinBaltRim
IBM852 IBM/MS code page 852; PC (DOS) Latin 2
IBM855 IBM/MS code page 855
IBM775 IBM/MS code page 775
IBM866 IBM/MS code page 866
baltic ISO-IR-179; Baltic
KEYBCS2 Kamenicky encoding; KEYBCS2
macce Macintosh Central European

maccyr Macintosh Cyrillic
ECMA-113 Ecma Cyrillic; ECMA-113
KOI-8_CS_2 KOI8-CS2 code (`T602')
KOI8-R KOI8-R Cyrillic
KOI8-U KOI8-U Cyrillic
KOI8-UNI KOI8-Pinag-isang Cyrillic
TeX (La)TeX control sequence
UCS-2 Universal character set 2 byte; UCS-2; BMP
UCS-4 Universal character set 4 bytes; UCS-4; ISO-10646
UTF-7 Universal transformation format 7 bits; UTF-7
UTF-8 Universal transformation format 8 bits; UTF-8
CORK Cork encoding; T1
GBK Simplified Chinese National Standard; GB2312
BIG5 Traditional Chinese Industrial Standard; Malaki5
Na-encode ng HZ HZ ang GB2312
hindi kilalang Hindi nakikilalang pag-encode

saan hindi kilala ay hindi anumang tunay na pag-encode, ito ay naiulat kapag ang Enca ay hindi makapagbigay ng a
maaasahang sagot.

Mga ibabaw
Ang Enca ay may ilang pang-eksperimentong suporta para sa tinatawag na mga ibabaw (tingnan sa ibaba). Nakikita nito
sumusunod na mga ibabaw (hindi lahat ay maaaring ilapat sa lahat ng charset):

/CR CR line terminators
/LF LF line terminators
/CRLF Mga terminator ng linya ng CRLF
NA Mixed line terminator
NA Napapaligiran ng/kahalo ng hindi text na data
/21 Byte order ay binaligtad sa mga pares (1,2 -> 2,1)
/4321 Byte order na binaliktad sa quadruples (1,2,3,4 -> 4,3,2,1)
NA Parehong maliit at malalaking endian chunks, pinagsama-sama
/qp Naka-quote-napi-print na naka-encode

Tandaan na ang ilang mga ibabaw ay may NA bilang kapalit ng identifier--hindi sila maaaring tukuyin sa command
line, pwede lang silang i-report ni Enca. Ito ay sinadya dahil ipinapaalam lamang nila sa iyo
bakit hindi maituturing na surface-consistent ang file sa halip na kumakatawan sa isang real
ibabaw.

Ang bawat charset ay may natural na ibabaw nito (tinatawag na `implied' sa recode) na hindi iniuulat,
hal, para sa IBM 852 charset ito ay `CRLF line terminators'. Para sa mga pag-encode ng UCS, ang malaking endian ay
itinuturing na natural na ibabaw; Ang mga hindi pangkaraniwang byte na order ay binuo mula 21 at 4321
permutations: 2143 ay iniulat bilang 21, habang 3412 ay iniulat bilang kumbinasyon ng 4321
at 21.

Ang dobleng naka-encode na UTF-8 ay hindi charset o surface, iniulat lamang ito.

tungkol sa mga charset, mga encoding at ibabaw
Ang Charset ay isang hanay ng mga entity ng character habang ang pag-encode ay ang representasyon nito sa mga termino
ng mga byte at bits. Sa Enca, ang salita pag-encode pareho ang ibig sabihin ng `representasyon ng teksto',
ie ang kaugnayan sa pagitan ng pagkakasunod-sunod ng mga entity ng character na bumubuo sa teksto at
pagkakasunud-sunod ng mga byte (bits) na bumubuo sa file.

Kaya, ang pag-encode ay parehong set ng character at tinatawag na surface (line terminators, byte order,
pagsasama-sama, pagbabagong-anyo ng Base64, atbp.). Gayunpaman, ito ay nagpapatunay na maginhawa upang magtrabaho kasama
ilang {charset,surface} pares tulad ng sa mga tunay na charset. So, as in rekord(1), lahat ng UCS- at
Ang mga UTF-encoding ng Universal character set ay tinatawag na mga charset. Pakitingnan ang recode
dokumentasyon para sa higit pang mga detalye ng isyung ito.

Ang tanging magandang bagay tungkol sa mga surface ay: kapag hindi ka nagsimulang makipaglaro sa kanila, hindi rin
Hindi magsisimula ang Enca at susubukan nitong kumilos hangga't maaari bilang isang walang kamalayan
program, kahit na nakikipag-usap sa recode.

WIKA


Kailangang malaman ng Enca ang wika ng mga input file upang gumana nang mapagkakatiwalaan, kahit na sa kaso ng
regular na 8bit na pag-encode. Dapat kilalanin ang mga multibyte na encoding para sa anumang Latin, Cyrillic
o wikang Griyego.

Maaari mong (o kailangang) gamitin -L opsyon na sabihin kay Enca ang wika. Dahil madalas ang mga tao
gumana sa mga file sa parehong wika kung saan na-configure nila ang mga lokal, sinusubukan ni Enca
sinusubukang hulaan ang wika sa pamamagitan ng pagsusuri sa halaga ng LC_CTYPE at iba pang lokal na kategorya
(pakitingnan lokal(7)) at ginagamit ito para sa wika kapag wala kang tinukoy. Ng
Siyempre, maaaring ito ay ganap na mali at magbibigay sa iyo ng walang kapararakan na mga sagot at makapinsala sa iyong
file, kaya mangyaring huwag kalimutang gamitin ang -L opsyon. Maaari mo ring gamitin ENCAOPT kapaligiran
variable upang magtakda ng default na wika (tingnan ang seksyon Kapaligiran).

Ang mga sumusunod na wika ay sinusuportahan ng Enca (bawat wika ay nakalista kasama ng suportado
8bit na pag-encode).

Belarusian CP1251 IBM866 ISO-8859-5 KOI8-UNI maccyr IBM855
Bulgarian CP1251 ISO-8859-5 IBM855 maccyr ECMA-113
Czech ISO-8859-2 CP1250 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
Estonian ISO-8859-4 CP1257 IBM775 ISO-8859-13 macce baltic
Croatian CP1250 ISO-8859-2 IBM852 macce CORK
Hungarian ISO-8859-2 CP1250 IBM852 macce CORK
Lithuanian CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
Latvian CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
Polish ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 baltic CORK
Russian KOI8-R CP1251 ISO-8859-5 IBM866 maccyr
Slovak CP1250 ISO-8859-2 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
Slovene ISO-8859-2 CP1250 IBM852 macce CORK
Ukrainian CP1251 IBM855 ISO-8859-5 CP1125 KOI8-U maccyr
Chinese GBK BIG5 HZ
wala

Ang espesyal na wika wala maaaring paikliin sa __, wala itong 8bit na pag-encode, kaya lang
ang mga multibyte na encoding ay nakita.

Maaari ka ring gumamit ng mga pangalan ng lokal sa halip na mga wika:

Belarusian maging
Bulgarian bg
Czech cs
Estonian et
Croatian hr
Hungarian hu
Lithuanian lt
Latvian lv
Polish pl
Russian ru
Slovak sk
Slovene sl
Ukrainian uk
Chinese zh

TAMPOK


Nakadepende ang ilang feature ng Enca sa kung ano ang available sa iyong system at kung paano ito
pinagsama-sama. Makukuha mo ang kanilang listahan kasama ng

enca --bersyon

Ang plus sign bago ang isang feature name ay nangangahulugang available ito, ang minus sign ay nangangahulugang kulang ang build na ito
ang partikular na tampok.

librecode-interface. Ang Enca ay may interface sa GNU recode library charset conversion
function.

iconv-interface. Ang Enca ay may interface sa UNIX98 iconv charset conversion functions.

panlabas na-converter. Maaaring gumamit ang Enca ng mga panlabas na programa ng conversion (kung mayroon kang angkop
naka-install).

pagtuklas ng wika. Sinusubukang hulaan ni Enca ang wika (-L) mula sa mga lokal. Hindi mo kailangan ang
--wika opsyon, hindi bababa sa prinsipyo.

locale-alias. Nagagawa ng Enca na i-decrypt ang mga lokal na alyas na ginagamit para sa mga pangalan ng wika.

target-charset-auto. Sinusubukan ng Enca na makita ang iyong ginustong charset mula sa mga lokal. Pagpipilian
--auto-convert at pagtawag kay Enca bilang enconv gumagana, hindi bababa sa prinsipyo.

ENCAOPT. Nagagawa ng Enca na mai-parse nang tama ang environment variable na ito bago ang command line
mga parameter. Mga simpleng bagay tulad ng ENCAOPT="-L uk" gagana kahit wala ang feature na ito.

Kapaligiran


Ang variable ENCAOPT maaaring humawak ng set ng mga default na opsyon sa Enca. Ang nilalaman nito ay binibigyang kahulugan
bago ang mga argumento ng command line. Sa kasamaang palad, hindi ito gumagana sa lahat ng dako (dapat mayroon
tampok na +ENCAOPT).

LC_CTYPE, LC_COLLATE, LC_MESSAGES (posibleng namana mula sa LC_ALL or WIKA) ay ginagamit para sa
paghula sa iyong wika (dapat may tampok na +language-detection).

Ang variable DEFAULT_CHARSET maaaring magamit ng enconv bilang default na target na charset.

DIAGNOSTICS


Ibinabalik ng Enca ang exit code 0 kapag matagumpay na naipagpatuloy ang lahat ng input file (ibig sabihin, lahat
ang mga pag-encode ay nakita at ang lahat ng mga file ay na-convert sa kinakailangang pag-encode, kung conversion
tinanong). Ibinabalik ang exit code 1 kapag hindi nahulaan ni Enca ang pag-encode o
magsagawa ng conversion sa anumang input file dahil hindi ito sapat na matalino. Ang exit code 2 ay
ibinalik sa kaso ng malubhang (hal. I/O) na mga problema.

SEGURIDAD


Posibleng hayaang magtrabaho si Enca nang walang pag-aalaga, ito ang layunin nito. Gayunpaman:

Walang warranty ang pagtuklas ay gumagana ng 100%. Huwag kang tumaya, madali kang matatalo
mahalagang data.

Huwag gumamit ng enca (ang programa), i-link sa libenca sa halip kung gusto mo ng anumang bagay na kahawig
seguridad. Kailangan mong gawin ang huli na conversion sa iyong sarili pagkatapos.

Huwag gumamit ng mga panlabas na converter. Sa isip, huwag paganahin ang mga ito sa oras ng pag-compile.

Magkaroon ng kamalayan ng ENCAOPT at lahat ng built-in na awtomatikong paghula ng iba't ibang bagay mula sa
kapaligiran, katulad ng mga lokal.

Gumamit ng enca online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

  • 1
    itop - ITSM CMDB OpenSource
    itop - ITSM CMDB OpenSource
    IT Operations Portal: isang kumpletong bukas
    pinagmulan, ITIL, web based na serbisyo
    tool sa pamamahala kabilang ang isang ganap
    napapasadyang CMDB, isang helpdesk system at
    isang taong dokumento...
    I-download ang itop - ITSM CMDB OpenSource
  • 2
    Clementine
    Clementine
    Ang Clementine ay isang multi-platform na musika
    player at library organizer na inspirasyon ni
    Amarok 1.4. Mayroon itong mabilis at
    madaling gamitin na interface, at pinapayagan kang
    maghanap at...
    I-download ang Clementine
  • 3
    XISMuS
    XISMuS
    PANSIN: May pinagsama-samang pag-update 2.4.3
    pinalaya!! Ang pag-update ay gumagana para sa anumang
    nakaraang 2.xx na bersyon. Kung mag-upgrade
    mula sa bersyon v1.xx, mangyaring i-download at
    i ...
    I-download ang XISMuS
  • 4
    facetracknoir
    facetracknoir
    Modular headtracking program na
    sumusuporta sa maramihang mga tagasubaybay ng mukha, mga filter
    at laro-protocol. Kabilang sa mga tagasubaybay
    ay ang SM FaceAPI, AIC Inertial Head
    Tagasubaybay...
    I-download ang facetracknoir
  • 5
    PHP QR Code
    PHP QR Code
    Ang PHP QR Code ay open source (LGPL)
    library para sa pagbuo ng QR Code,
    2-dimensional na barcode. Batay sa
    libqrencode C library, nagbibigay ng API para sa
    paggawa ng QR Code barc...
    I-download ang PHP QR Code
  • 6
    freeciv
    freeciv
    Ang Freeciv ay isang libreng turn-based
    Multiplayer diskarte laro, kung saan ang bawat isa
    ang manlalaro ay nagiging pinuno ng a
    kabihasnan, pakikipaglaban upang makuha ang
    pangwakas na layunin: maging...
    I-download ang Freeciv
  • Marami pa »

Linux command

Ad