EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

enc2xs - Online în cloud

Rulați enc2xs în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda enc2xs care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


enc2xs -- Perl Encode Module Generator

REZUMAT


enc2xs -[opțiuni]
enc2xs -M Fișiere de hartă ModName...
enc2xs -C

DESCRIERE


enc2xs construiește o extensie Perl pentru utilizare de către Encode din oricare dintre Unicode Character Mapping
fișiere (.ucm) sau Tcl Encoding Files (.enc). Pe lângă faptul că este folosit intern în timpul construcției
proces al modulului Codificare, puteți utiliza enc2xs pentru a adăuga propria codificare la perl. Nu
cunoașterea XS este necesară.

Rapid Ghid


Dacă doriți să știți cât mai puține despre Perl, dar trebuie să adăugați o nouă codificare, doar
citește acest capitol și uită de restul.

0. Pregătiți un fișier .ucm. Îl poți obține de undeva sau îl poți scrie pe al tău
zgâria sau puteți lua unul din distribuția Encode și îl personalizați. Pentru
Format UCM, vezi capitolul următor. În exemplul de mai jos, îmi voi numi teoretic
codificarea myascii, definită în meu.ucm. „$” este un prompt de shell.

$ ls -F
meu.ucm

1. Emiteți o comandă după cum urmează;

$ enc2xs -M My my.ucm
generând Makefile.PL
generând My.pm
generând README
generând Schimbări

Acum aruncați o privire la directorul dvs. actual. Ar trebui să arate așa.

$ ls -F
Makefile.PL My.pm my.ucm t/

Au fost create următoarele fișiere.

Makefile.PL - script MakeMaker
My.pm - Submodul de codificare
t/My.t - fișier de testare

1.1.
Dacă doriți să instalați *.ucm împreună cu modulele, procedați după cum urmează;

$ mkdir Encode
$ mv *.ucm Codificare
$ enc2xs -M My Encode/*ucm

2. Editați fișierele generate. Nu trebuie să faci asta dacă nu ai timp ȘI nicio intenție
da-l altcuiva. Dar este o idee bună să editați podul și să adăugați mai multe teste.

3. Acum lansați o comandă pe care toți Perl Mongers iubesc:

$ perl Makefile.PL
Scrierea Makefile pentru Encode::My

4. Acum tot ce trebuie să faci este să faci.

$ face
cp My.pm blib/lib/Encode/My.pm
/usr/local/bin/perl /usr/local/bin/enc2xs -Q -O \
-o encode_t.c -f encode_t.fnm
Citirea myascii (myascii)
Scrierea formularului compilat
128 de octeți în tabelele cu șiruri
384 de octeți (75%) au salvat duplicatele de detectare
1 octeți (0.775%) salvati folosind subșiruri
....
chmod 644 blib/arch/auto/Encode/My/My.bs
$

Timpul necesar variază în funcție de cât de rapid este mașina dvs. și cât de mare este
codificarea este. Dacă nu lucrezi la ceva mare precum euc-tw, nu va dura prea mult
lung.

5. Puteți deja „face instalarea”, dar ar trebui să testați mai întâi.

$ make test
PERL_DL_NONLAZY=1 /usr/local/bin/perl -Iblib/arch -Iblib/lib \
-e 'use Test::Harness qw(&runtests $verbose); \
$verbos=0; runtests @ARGV;' t/*.t
t/Meu....ok
Toate testele au reușit.
Fișiere=1, Teste=2, 0 sec
( 0.09 cusr + 0.01 csys = 0.09 CPU)

6. Dacă sunteți mulțumit de rezultatul testului, doar „faceți instalarea”

7. Dacă doriți să adăugați codificarea la lista de încărcare la cerere a Encode (deci nu trebuie să
„utilizați Encode::YourEncoding”), rulați

enc2xs -C

pentru a actualiza Encode::ConfigLocal, un modul care controlează setările locale. După care,
"utilizați Encode;" este suficient pentru a vă încărca codificările la cerere.

Unicode Caracter Hartă


Codificare utilizează formatul Unicode Character Map (UCM) pentru mapările sursă de caractere. Acest
formatul este utilizat de pachetul ICU al IBM și a fost adoptat de Nick Ing-Simmons pentru a fi utilizat cu
Modul de codificare. Deoarece UCM este mai flexibil decât Harta de codificare a lui Tcl și mult mai mult
prietenos, acesta este formatul recomandat pentru Encode acum.

Un fișier UCM arată astfel.

#
# Comentarii
#
„US-ascii” # Necesar
„ascii” # Opțional
1 # Necesar; de obicei 1
1 # Max. # de octeți/car
\x3F # Înlocuire caracter
#
CHARMAP
\x0000 |00 #
\x0001 |01 #
\x0002 |02 #
....
\x007C |7 # LINIE VERTICALĂ
\x007D |7 # BRACKET DREPT
\x007E |7 # TILDE
\x007F |7 #
END CHARMAP

· Orice lucru care urmează după „#” este tratat ca un comentariu.

· Secțiunea antet continuă până la o linie care conține cuvântul CHARMAP. Aceasta sectiune
are o formă de valoare, o pereche pe linie. Șirurile folosite ca valori trebuie să fie
citat. Cuvintele goale sunt tratate ca numere. \xXX reprezintă un octet.

Majoritatea cuvintelor cheie se explică de la sine. subcar înseamnă caracter de substituție, nu
subpersonaj. Când decodați o secvență Unicode la această codificare, dar nu se potrivește
caracterul este găsit, se va folosi secvența de octeți definită aici. Pentru cele mai multe cazuri,
valoarea aici este \x3F; în ASCII, acesta este un semn de întrebare.

· CHARMAP începe secțiunea hărții de caractere. Fiecare linie are o formă după cum urmează:

\xXX.. |0 # comentariu
^ ^ ^
| | +- Steagul de rezervă
| +-------- Secvență de octeți codificat
+-------------- ID caracter Unicode în hex

Formatul este aproximativ același cu o secțiune antet, cu excepția semnalizatorului de rezervă: |
urmat de 0..3. Semnificația valorilor posibile este următoarea:

|0 Seif dus-întors. Un caracter decodat la Unicode se codifică înapoi la același octet
secvenţă. Majoritatea personajelor au acest steag.

|1 Rezervă pentru Unicode -> codificare. Când este văzut, enc2xs adaugă acest caracter pentru
codificați numai harta.

|2 Omiteți maparea sub-car dacă nu există niciun punct de cod.

|3 Rezervă pentru codificare -> unicode. Când este văzut, enc2xs adaugă acest caracter pentru
doar decodați harta.

· Și în sfârșit, END OF CHARMAP încheie secțiunea.

Când creați manual un fișier UCM, ar trebui să copiați ascii.ucm sau un fișier existent
codificare care este apropiată de a ta, mai degrabă decât să scrii pe a ta de la zero.

Când faci asta, asigură-te că pleci măcar U0000 la U0020 așa cum este, cu excepția cazului în care mediul dvs
este EBCDIC.

AVERTISMENT: nu toate caracteristicile din UCM sunt implementate. De exemplu, icu:state nu este folosit.
Din acest motiv, trebuie să scrieți un modul perl dacă doriți să acceptați algoritmic
codificări, în special seria ISO-2022. Astfel de module includ Encode::JP::2022_JP,
Codificare::KR::2022_KR și Codificare::TW::HZ.

Copiind cu duplicat mapări
Când creați o hartă, TREBUIE să vă faceți mapările dus-întors în siguranță. Acesta este,
"encode('codificarea ta', decodare('codificarea ta', $date)) eq $date" reprezintă toate
caractere care sunt marcate ca „|0”. Iată cum să vă asigurați:

· Sortați harta în ordinea Unicode.

· Când aveți o intrare duplicată, marcați fie una cu „|1” sau „|3”.

· Și asigurați-vă că intrarea „|1” sau „|3” URMEAZĂ intrarea „|0”.

Iată un exemplu de la big5-eten.

\xF2550\xF9 |9
\xA2550\xA2 |4

Codificarea internă -> Unicode și Unicode -> Harta de codificare arată astfel;

E la UU la E
--------------------------------------
\xF9\xF9 => U2550 U2550 => \xF9\xF9
\xA2\xA4 => U2550

Deci, este sigur dus-întors pentru \xF9\xF9. Dar dacă linia de mai sus este cu susul în jos, iată ce
se întâmplă.

E la UU la E
--------------------------------------
\xA2\xA4 => U2550 U2550 => \xF9\xF9
(\xF9\xF9 => U2550 este acum suprascris!)

Pachetul Encode vine cu ucmlint, o utilitate brută, dar suficientă pentru a verifica
integritatea unui fișier UCM. Verificați acest lucru în directorul Encode/bin.

Când aveți îndoieli, puteți utiliza ucmsort, încă un utilitar din directorul Encode/bin.

Marcaje


· Pagina de pornire a UTIhttp://www.icu-project.org/>

· Tabele de cartografiere a caracterelor ICUhttp://site.icu-project.org/charts/charset>

· UTI: Date de conversiehttp://www.icu-project.org/userguide/conversion-data.html>

Utilizați enc2xs online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

  • 1
    Pluginul Eclipse Tomcat
    Pluginul Eclipse Tomcat
    Pluginul Eclipse Tomcat oferă
    integrare simplă a unui servlet tomcat
    container pentru dezvoltarea java
    aplicatii web. Ne poți alătura pentru
    discutie...
    Descărcați pluginul Eclipse Tomcat
  • 2
    Desktop WebTorrent
    Desktop WebTorrent
    WebTorrent Desktop este pentru streaming
    torrente pe Mac, Windows sau Linux. Aceasta
    se conectează atât la BitTorrent, cât și la
    colegii WebTorrent. Acum nu există
    trebuie sa astepti...
    Descărcați WebTorrent Desktop
  • 3
    GenX
    GenX
    GenX este un program științific de rafinat
    reflexivitatea razelor X, neutroni
    reflectivitate și raze X de suprafață
    date de difracție folosind diferența
    algoritm de evolutie....
    Descărcați GenX
  • 4
    pspp4windows
    pspp4windows
    PSPP este un program de statistică
    analiza datelor eșantionate. Este gratuit
    înlocuitor pentru programul proprietar
    SPSS. PSPP are atât bazate pe text, cât și
    ne grafice...
    Descărcați pspp4windows
  • 5
    Extensii Git
    Extensii Git
    Git Extensions este un instrument UI de sine stătător
    pentru gestionarea depozitelor Git. De asemenea
    se integrează cu Windows Explorer și
    Microsoft Visual Studio
    (2015/2017/2019). E...
    Descărcați extensii Git
  • 6
    eSpeak: sinteza vorbirii
    eSpeak: sinteza vorbirii
    Motor Text to Speech pentru engleză și
    multe alte limbi. Dimensiune compactă cu
    pronunție clară, dar artificială.
    Disponibil ca program de linie de comandă cu
    mulți ...
    Descărcați eSpeak: sinteza vorbirii
  • Mai mult »

Comenzi Linux

Ad