EnglishFrenchSpanyol

Ad


Favicon OnWorks

enc2xs - Dalam Talian di Awan

Jalankan enc2xs dalam penyedia pengehosan percuma OnWorks melalui Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

Ini ialah perintah enc2xs yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.

JADUAL:

NAMA


enc2xs -- Penjana Modul Pengekodan Perl

SINOPSIS


enc2xs -[pilihan]
enc2xs -M ModName fail peta...
enc2xs -C

DESCRIPTION


enc2xs membina sambungan Perl untuk digunakan oleh Encode daripada sama ada Pemetaan Aksara Unicode
fail (.ucm) atau Fail Pengekodan Tcl (.enc). Selain digunakan secara dalaman semasa pembinaan
proses modul Encode, anda boleh gunakan enc2xs untuk menambah pengekodan anda sendiri pada perl. Tidak
pengetahuan tentang XS adalah perlu.

Pantas Panduan


Jika anda ingin mengetahui sedikit sebanyak mungkin tentang Perl tetapi perlu menambah pengekodan baharu, cuma
baca bab ini dan lupakan yang lain.

0. Sediakan fail .ucm. Anda boleh mendapatkannya dari suatu tempat atau anda boleh menulis sendiri dari
gores atau anda boleh ambil satu daripada pengedaran Encode dan sesuaikan ia. Untuk
Format UCM, lihat Bab seterusnya. Dalam contoh di bawah, saya akan memanggil teori saya
pengekodan myascii, ditakrifkan dalam my.ucm. "$" ialah gesaan shell.

$ ls -F
my.ucm

1. Keluarkan arahan seperti berikut;

$ enc2xs -M My.ucm saya
menjana Makefile.PL
menjana My.pm
menjana README
menjana Perubahan

Sekarang lihat direktori semasa anda. Ia sepatutnya kelihatan seperti ini.

$ ls -F
Makefile.PL Saya.pm saya.ucm t/

Fail berikut telah dibuat.

Makefile.PL - Skrip MakeMaker
My.pm - Kod submodul
t/My.t - fail ujian

1.1.
Jika anda mahu *.ucm dipasang bersama-sama dengan modul, lakukan seperti berikut;

$ mkdir Encode
$ mv *.ucm Pengekodan
$ enc2xs -M Pengekodan Saya/*ucm

2. Edit fail yang dihasilkan. Anda tidak perlu jika anda tiada masa DAN tiada niat
berikan kepada orang lain. Tetapi adalah idea yang baik untuk mengedit pod dan menambah lebih banyak ujian.

3. Sekarang keluarkan perintah yang disukai oleh semua Perl Monger:

$ perl Makefile.PL
Menulis Makefile untuk Encode::My

4. Sekarang anda hanya perlu membuat.

$ make
cp Saya.pm blib/lib/Encode/My.pm
/usr/local/bin/perl /usr/local/bin/enc2xs -Q -O \
-o encode_t.c -f encode_t.fnm
Membaca myascii (myascii)
Menulis borang yang disusun
128 bait dalam jadual rentetan
384 bait (75%) menyimpan pendua pengesanan
1 bait (0.775%) disimpan menggunakan subrentetan
....
chmod 644 blib/arch/auto/Encode/My/My.bs
$

Masa yang diambil berbeza-beza bergantung pada kelajuan mesin anda dan saiz mesin anda
pengekodan adalah. Melainkan anda sedang mengerjakan sesuatu yang besar seperti euc-tw, ia tidak akan mengambil masa juga
lama.

5. Anda sudah boleh "membuat pemasangan" tetapi anda harus menguji terlebih dahulu.

$ buat ujian
PERL_DL_NONLAZY=1 /usr/local/bin/perl -Iblib/arch -Iblib/lib \
-e 'use Test::Harness qw(&runtests $verbose); \
$verbose=0; ujian lari @ARGV;' t/*.t
t/Saya....ok
Semua ujian berjaya.
Fail=1, Ujian=2, 0 saat jam dinding
( 0.09 cusr + 0.01 csys = 0.09 CPU)

6. Jika anda berpuas hati dengan keputusan ujian, hanya "buat pemasangan"

7. Jika anda ingin menambah pengekodan anda ke senarai pemuatan permintaan Encode (jadi anda tidak perlu
"use Encode::YourEncoding"), jalankan

enc2xs -C

untuk mengemas kini Encode::ConfigLocal, modul yang mengawal tetapan setempat. Selepas itu,
"gunakan Encode;" sudah cukup untuk memuatkan pengekodan anda atas permintaan.

. Unicode Watak Peta


Encode menggunakan format Peta Aksara Unikod (UCM) untuk pemetaan aksara sumber. ini
format digunakan oleh pakej ICU IBM dan telah diterima pakai oleh Nick Ing-Simmons untuk digunakan dengan
Modul pengekodan. Memandangkan UCM lebih fleksibel daripada Peta Pengekodan Tcl dan lebih banyak pengguna-
mesra, ini ialah format yang disyorkan untuk Encode sekarang.

Fail UCM kelihatan seperti ini.

#
# Komen
#
"US-ascii" # Diperlukan
"ascii" # Pilihan
1 # Diperlukan; selalunya 1
1 # Maks. # daripada bait/char
\x3F # Penggantian char
#
CHARMAP
\x0000 |00 #
\x0001 |01 #
\x0002 |02 #
....
\x007C |7 # GARISAN MENEGAK
\x007D |7 # KURUNG KERINTING KANAN
\x007E |7 # TILDE
\x007F |7 #
TAMAT CHARMAP

· Apa-apa sahaja yang mengikuti "#" dianggap sebagai ulasan.

· Bahagian pengepala diteruskan sehingga satu baris yang mengandungi perkataan CHARMAP. Bahagian ini
mempunyai bentuk nilai, sepasang setiap baris. Rentetan yang digunakan sebagai nilai mestilah
dipetik. Kata kosong dianggap sebagai nombor. \xXX mewakili bait.

Kebanyakan kata kunci adalah jelas. subchar bermaksud watak pengganti, bukan
sub aksara. Apabila anda menyahkod jujukan Unicode kepada pengekodan ini tetapi tiada padanan
aksara ditemui, jujukan bait yang ditakrifkan di sini akan digunakan. Bagi kebanyakan kes, yang
nilai di sini ialah \x3F; dalam ASCII, ini adalah tanda tanya.

· CHARMAP memulakan bahagian peta aksara. Setiap baris mempunyai bentuk seperti berikut:

\xXX.. |0 # ulasan
^^
| | +- Bendera Fallback
| +-------- Urutan bait yang dikodkan
+-------------- ID Aksara Unikod dalam hex

Formatnya lebih kurang sama dengan bahagian pengepala kecuali untuk bendera sandaran: |
diikuti dengan 0..3. Maksud nilai yang mungkin adalah seperti berikut:

|0 Perjalanan pergi dan balik selamat. Aksara yang dinyahkodkan kepada Unicode mengekod kembali kepada bait yang sama
urutan. Kebanyakan watak mempunyai bendera ini.

|1 Sandaran untuk unikod -> pengekodan. Apabila dilihat, enc2xs menambah watak ini untuk
peta kod sahaja.

|2 Langkau pemetaan sub-char sekiranya tiada titik kod.

|3 Fallback untuk pengekodan -> unicode. Apabila dilihat, enc2xs menambah watak ini untuk
decode peta sahaja.

· Dan akhirnya, END OF CHARMAP menamatkan bahagian.

Apabila anda membuat fail UCM secara manual, anda harus menyalin ascii.ucm atau yang sedia ada
pengekodan yang hampir dengan anda, bukannya menulis anda sendiri dari awal.

Apabila anda berbuat demikian, pastikan anda meninggalkan sekurang-kurangnya U0000 kepada U0020 sebagaimana adanya, melainkan persekitaran anda
ialah EBCDIC.

CAVEAT: tidak semua ciri dalam UCM dilaksanakan. Contohnya, icu:state tidak digunakan.
Kerana itu, anda perlu menulis modul perl jika anda ingin menyokong algoritma
pengekodan, terutamanya siri ISO-2022. Modul tersebut termasuk Encode::JP::2022_JP,
Encode::KR::2022_KR, dan Encode::TW::HZ.

Menangani bersama salinan pemetaan
Apabila anda membuat peta, anda HARUS menjadikan pemetaan anda pergi dan balik selamat. Itu dia,
"encode('your-encoding', decode('your-encoding', $data)) eq $data" bermaksud semua
aksara yang ditandakan sebagai "|0". Inilah cara untuk memastikan:

· Isih peta anda dalam susunan Unicode.

· Apabila anda mempunyai entri pendua, tandakan sama ada satu dengan '|1' atau '|3'.

· Dan pastikan entri '|1' atau '|3' MENGIKUTI entri '|0'.

Berikut adalah contoh dari big5-eten.

\xF2550\xF9 |9
\xA2550\xA2 |4

Pengekodan Dalaman -> Unikod dan Unikod -> Peta Pengekodan kelihatan seperti ini;

E ke UU ke E
--------------------------------------
\xF9\xF9 => U2550 U2550 => \xF9\xF9
\xA2\xA4 => U2550

Jadi ia selamat pergi dan balik untuk \xF9\xF9. Tetapi jika garis di atas terbalik, ini adalah apa
berlaku.

E ke UU ke E
--------------------------------------
\xA2\xA4 => U2550 U2550 => \xF9\xF9
(\xF9\xF9 => U2550 kini ditimpa!)

Pakej Encode disertakan dengan ucmlint, utiliti mentah tetapi mencukupi untuk menyemak
integriti fail UCM. Semak di bawah direktori Encode/bin untuk ini.

Apabila ragu-ragu, anda boleh menggunakan ucmsort, satu lagi utiliti di bawah Encode/bin direktori.

Penanda buku


· Laman Utama ICUhttp://www.icu-project.org/>

· Jadual Pemetaan Karakter ICUhttp://site.icu-project.org/charts/charset>

· ICU: Data Penukaranhttp://www.icu-project.org/userguide/conversion-data.html>

Gunakan enc2xs dalam talian menggunakan perkhidmatan onworks.net


Pelayan & Stesen Kerja Percuma

Muat turun apl Windows & Linux

  • 1
    Plugin Eclipse Tomcat
    Plugin Eclipse Tomcat
    Pemalam Eclipse Tomcat menyediakan
    penyepaduan mudah servlet tomcat
    bekas untuk pembangunan java
    aplikasi web. Anda boleh sertai kami untuk
    perbincangan...
    Muat turun Pemalam Eclipse Tomcat
  • 2
    Desktop WebTorrent
    Desktop WebTorrent
    WebTorrent Desktop adalah untuk penstriman
    torrents pada Mac, Windows atau Linux. Ia
    menyambung kepada kedua-dua BitTorrent dan
    WebTorrent rakan sebaya. Sekarang tidak ada
    perlu menunggu...
    Muat turun Desktop WebTorrent
  • 3
    GenX
    GenX
    GenX ialah program saintifik untuk memperhalusi
    refelcetivity sinar-x, neutron
    pemantulan dan sinar-x permukaan
    data pembelauan menggunakan pembezaan
    algoritma evolusi....
    Muat turun GenX
  • 4
    pspp4windows
    pspp4windows
    PSPP ialah program untuk statistik
    analisis data sampel. Ia adalah percuma
    penggantian untuk program proprietari
    SPSS. PSPP mempunyai kedua-dua berasaskan teks dan
    grafik kami...
    Muat turun pspp4windows
  • 5
    Sambungan Git
    Sambungan Git
    Sambungan Git ialah alat UI kendiri
    untuk menguruskan repositori Git. Ia juga
    berintegrasi dengan Windows Explorer dan
    Microsoft Visual Studio
    (2015/2017/2019). ke...
    Muat turun Sambungan Git
  • 6
    eSpeak: sintesis pertuturan
    eSpeak: sintesis pertuturan
    Teks ke Enjin Pertuturan untuk Bahasa Inggeris dan
    banyak bahasa lain. Saiz padat dengan
    sebutan yang jelas tetapi buatan.
    Tersedia sebagai program baris arahan dengan
    banyak ...
    Muat turun eSpeak: sintesis pertuturan
  • Lebih »

Arahan Linux

Ad