Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

enc2xs — online w chmurze

Uruchom enc2xs w bezpłatnym dostawcy hostingu OnWorks w systemie Ubuntu Online, Fedora Online, emulatorze online systemu Windows lub emulatorze online systemu MAC OS

To jest polecenie enc2xs, które można uruchomić w darmowym dostawcy usług hostingowych OnWorks przy użyciu jednej z wielu naszych bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online MAC OS

PROGRAM:

IMIĘ


enc2xs -- Perl Encode Generator modułów

STRESZCZENIE


enc2xs - [opcje]
enc2xs -M ModName pliki map...
en2xs -C

OPIS


en2xs buduje rozszerzenie Perla do użytku przez Encode z mapowania znaków Unicode
pliki (.ucm) lub pliki kodowania Tcl (.enc). Oprócz tego, że jest używany wewnętrznie podczas kompilacji
proces modułu Encode, którego możesz użyć en2xs dodać własne kodowanie do perla. NIE
wymagana jest znajomość XS.

Szybki przewodnik


Jeśli chcesz wiedzieć jak najmniej o Perlu, ale musisz dodać nowe kodowanie, po prostu
przeczytaj ten rozdział i zapomnij o reszcie.

0. Przygotuj plik .ucm. Możesz go skądś pobrać lub napisać własny
scratch lub możesz pobrać jeden z dystrybucji Encode i dostosować go. Dla
formacie UCM, patrz następny rozdział. W poniższym przykładzie nazwę moją teorię
kodowanie myascii, zdefiniowane w mój.ucm. „$” to monit powłoki.

$ ls -F
mój.ucm

1. Wydaj polecenie w następujący sposób;

$ enc2xs -M Mój my.ucm
generowanie Makefile.PL
generowanie My.pm
generowanie pliku README
generowanie zmian

Teraz spójrz na swój bieżący katalog. To powinno wyglądać tak.

$ ls -F
Makefile.PL Mój.pm mój.ucm t/

Utworzono następujące pliki.

Makefile.PL - skrypt MakeMakera
My.pm — Zakoduj submoduł
t/My.t - plik testowy

1.1.
Jeśli chcesz zainstalować *.ucm razem z modułami, wykonaj następujące czynności;

$ mkdir Kodowanie
$mv *.ucm Kodowanie
$ enc2xs -M Moje kodowanie/*ucm

2. Edytuj wygenerowane pliki. Nie musisz, jeśli nie masz czasu I nie masz zamiaru
daj to komuś innemu. Ale dobrym pomysłem jest edycja poda i dodanie większej liczby testów.

3. Teraz wydaj polecenie, które uwielbiają wszyscy Perl Mongers:

$perl Makefile.PL
Pisanie Makefile dla Encode::My

4. Teraz wszystko, co musisz zrobić, to zrobić.

$ make
cp Mój.pm blib/lib/Kodowanie/Mój.pm
/usr/local/bin/perl /usr/local/bin/enc2xs -Q -O \
-o kod_t.c -f kod_t.fnm
Czytanie myascii (myascii)
Pisanie skompilowanego formularza
128 bajtów w tablicach ciągów
384 bajty (75%) zapisanych duplikatów wykrywania
Zapisano 1 bajt (0.775%) przy użyciu podłańcuchów
....
chmod 644 blib/arch/auto/Encode/My/My.bs
$

Czas potrzebny do tego różni się w zależności od tego, jak szybka jest twoja maszyna i jak duża jest twoja
kodowanie jest. Jeśli nie pracujesz nad czymś dużym, takim jak euc-tw, nie zajmie to zbyt wiele
długo.

5. Możesz już "make install" ale najpierw powinieneś przetestować.

$ Zrób test
PERL_DL_NONLAZY=1 /usr/local/bin/perl -Iblib/arch -Iblib/lib \
-e 'użyj Test::Harness qw(&runtests $verbose); \
$pełny=0; runtests @ARGV;' t/*.t
t/Mój... ok
Wszystkie testy pomyślne.
Pliki=1, Testy=2, 0 sekund zegara ściennego
( 0.09 csr + 0.01 csys = 0.09 procesora)

6. Jeśli jesteś zadowolony z wyniku testu, po prostu „make install”

7. Jeśli chcesz dodać swoje kodowanie do listy ładowanych na żądanie Encode (aby nie musisz
„użyj Kodowania::TwojeKodowanie”), uruchom

en2xs -C

zaktualizować Encode::ConfigLocal, moduł kontrolujący ustawienia lokalne. Po tym,
„użyj kodowania;” wystarczy, aby załadować kodowanie na żądanie.

Połączenia Unicode Postać Mapa


Kodowanie używa formatu Unicode Character Map (UCM) do mapowania znaków źródłowych. Ten
Format jest używany przez pakiet IBM ICU i został przyjęty przez Nicka Ing-Simmonsa do użytku z
Moduł kodowania. Ponieważ UCM jest bardziej elastyczny niż mapa kodowania Tcl i znacznie bardziej
friendly, jest to zalecany format dla Encode now.

Plik UCM wygląda tak.

#
# Uwagi
#
"US-ascii" # Wymagane
"ascii" # Opcjonalne
1 # Wymagane; zwykle 1
1 # Maks. Liczba bajtów/znak
\x3F # Znak zastępczy
#
CHARMAPA
\x0000 |00 #
\x0001 |01 #
\x0002 |02 #
....
\x007C |7 # LINIA PIONOWA
\x007D |7 # PRAWY NAwias klamrowy
\x007E |7 # TYLDA
\x007F |7 #
KONIEC CHARMAPY

· Wszystko, co następuje po „#”, jest traktowane jako komentarz.

· Sekcja nagłówka jest kontynuowana aż do wiersza zawierającego słowo CHARMAP. Ta sekcja
ma postać wartość, jedna para na linię. Ciągi używane jako wartości muszą być
zacytowany. Barewords są traktowane jako liczby. \xXX reprezentuje bajt.

Większość słów kluczowych jest oczywista. znak podrzędny oznacza znak zastępczy, nie
podznak. Podczas dekodowania sekwencji Unicode do tego kodowania, ale bez dopasowania
zostanie znaleziony znak, zostanie użyta zdefiniowana tutaj sekwencja bajtów. W większości przypadków tzw
wartość tutaj to \x3F; w ASCII jest to znak zapytania.

· CHARMAP rozpoczyna sekcję mapy postaci. Każda linia ma postać w następujący sposób:

\xXX.. |0 # komentarza
^ ^ ^
| | +- Flaga awaryjna
| +-------- Zakodowana sekwencja bajtów
+-------------- Identyfikator znaku Unicode w formacie szesnastkowym

Format jest mniej więcej taki sam, jak sekcja nagłówka, z wyjątkiem flagi rezerwowej: |
następnie 0..3. Znaczenie możliwych wartości jest następujące:

|0 Bezpieczna podróż w obie strony. Znak zdekodowany do Unicode jest kodowany z powrotem do tego samego bajtu
sekwencja. Większość postaci ma tę flagę.

|1 Powrót do Unicode -> kodowanie. Kiedy jest widoczny, enc2xs dodaje ten znak do
zakoduj tylko mapę.

|2 Pomiń mapowanie znaków podrzędnych, jeśli nie ma punktu kodowego.

|3 Powrót do kodowania -> unicode. Kiedy jest widoczny, enc2xs dodaje ten znak do
dekodować tylko mapę.

· I wreszcie END OF CHARMAP kończy sekcję.

Podczas ręcznego tworzenia pliku UCM należy skopiować ascii.ucm lub istniejący plik
kodowanie, które jest zbliżone do twojego, zamiast pisać własne od zera.

Kiedy to zrobisz, upewnij się, że przynajmniej wyjdziesz U0000 do U0020 tak jak jest, chyba że twoje środowisko
jest EBCDIC.

OSTRZEŻENIE: nie wszystkie funkcje UCM są zaimplementowane. Na przykład icu: stan nie jest używany.
Z tego powodu musisz napisać moduł perla, jeśli chcesz obsługiwać algorytm
kodowania, w szczególności serii ISO-2022. Takie moduły obejmują Encode::JP::2022_JP,
Kodowanie::KR::2022_KR i Kodowanie::TW::HZ.

Korona w duplikat mapowania
Kiedy tworzysz mapę, POWINIENEŚ zapewnić bezpieczeństwo mapowania w obie strony. To jest,
„encode('twoje-kodowanie', dekodowanie('twoje-kodowanie', $dane)) eq $data” oznacza wszystko
znaków oznaczonych jako „|0”. Oto jak się upewnić:

· Sortuj mapę w porządku Unicode.

· Jeśli masz zduplikowany wpis, zaznacz jeden z nich za pomocą '|1' lub '|3'.

· I upewnij się, że wpis '|1' lub '|3' WYSTĘPUJE PO wpisie '|0'.

Oto przykład z big5-eten.

\xF2550\xF9 |9
\xA2550\xA2 |4

Kodowanie wewnętrzne -> Unicode i Unicode -> Mapa kodowania wygląda tak;

E do UU do E
--------------------------------------
\xF9\xF9 => U2550 U2550 => \xF9\xF9
\xA2\xA4 => U2550

Jest więc bezpieczny w obie strony dla \xF9\xF9. Ale jeśli powyższa linia jest do góry nogami, oto co
dzieje się.

E do UU do E
--------------------------------------
\xA2\xA4 => U2550 U2550 => \xF9\xF9
(\xF9\xF9 => U2550 jest teraz nadpisywane!)

Pakiet Encode jest dostarczany z ucmlint, prymitywne, ale wystarczające narzędzie do sprawdzania
integralność pliku UCM. Sprawdź to w katalogu Encode/bin.

W razie wątpliwości możesz użyć ucmsort, kolejne narzędzie w katalogu Encode/bin.

Zakładki


· Strona główna OIThttp://www.icu-project.org/>

· Tabele mapowania znaków OIOMhttp://site.icu-project.org/charts/charset>

· ICU: dane konwersjihttp://www.icu-project.org/userguide/conversion-data.html>

Korzystaj z enc2xs online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

  • 1
    Wtyczka Eclipse Tomcat
    Wtyczka Eclipse Tomcat
    Zapewnia wtyczka Eclipse Tomcat
    prosta integracja serwletu Tomcat
    kontener do programowania java
    Aplikacje internetowe. Możesz do nas dołączyć
    dyskusja...
    Pobierz wtyczkę Eclipse Tomcat
  • 2
    WebTorrent Desktop
    WebTorrent Desktop
    WebTorrent Desktop służy do przesyłania strumieniowego
    torrenty na Mac, Windows lub Linux. To
    łączy się zarówno z BitTorrent, jak i
    rówieśnicy WebTorrent. Teraz nie ma
    trzeba czekać na...
    Pobierz pulpit WebTorrent
  • 3
    GenX
    GenX
    GenX to program naukowy do udoskonalenia
    współczynnik odbicia promieniowania rentgenowskiego, neutron
    współczynnik odbicia i rentgen powierzchni
    dane dyfrakcyjne za pomocą różnicy
    algorytm ewolucji...
    Pobierz GenX
  • 4
    pspp4windows
    pspp4windows
    PSPP to program statystyczny
    analiza próbkowanych danych. To jest darmowe
    zamiennik autorskiego programu
    SPSS. PSPP ma zarówno tekstowe, jak i
    graficznie nas...
    Pobierz pspp4windows
  • 5
    Rozszerzenia Gita
    Rozszerzenia Gita
    Git Extensions to samodzielne narzędzie interfejsu użytkownika
    do zarządzania repozytoriami Git. To także
    integruje się z Eksploratorem Windows i
    Microsoft Visual Studio
    (2015/2017/2019). To...
    Pobierz rozszerzenia Gita
  • 6
    eSpeak: synteza mowy
    eSpeak: synteza mowy
    Silnik zamiany tekstu na mowę dla języka angielskiego i
    wiele innych języków. Kompaktowy rozmiar z
    wyraźna, ale sztuczna wymowa.
    Dostępny jako program wiersza poleceń z
    wiele ...
    Pobierz eSpeak: syntezator mowy
  • więcej »

Komendy systemu Linux

Ad