InggrisPerancisSpanyol

Ad


favorit OnWorks

enc2xs - Online di Cloud

Jalankan enc2xs di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

Ini adalah perintah enc2xs yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


enc2xs -- Perl Encode Modul Generator

RINGKASAN


enc2xs -[opsi]
enc2xs -M ModName file peta...
enc2xs -C

DESKRIPSI


enc2xs membangun ekstensi Perl untuk digunakan oleh Encode baik dari Pemetaan Karakter Unicode
file (.ucm) atau File Encoding Tcl (.enc). Selain digunakan secara internal selama build
proses modul Encode, Anda dapat menggunakan enc2xs untuk menambahkan pengkodean Anda sendiri ke Perl. Tidak
pengetahuan tentang XS diperlukan.

Cepat Panduan


Jika Anda ingin tahu sesedikit mungkin tentang Perl tetapi perlu menambahkan penyandian baru, cukup
baca bab ini dan lupakan sisanya.

0. Siapkan file .ucm. Anda bisa mendapatkannya dari suatu tempat atau Anda bisa menulis sendiri dari
awal atau Anda dapat mengambilnya dari distribusi Encode dan menyesuaikannya. Untuk
Format UCM, lihat Bab berikutnya. Dalam contoh di bawah ini, saya akan menyebut teori saya
pengkodean myascii, didefinisikan dalam saya.ucm. "$" adalah prompt shell.

$ ls -F
saya.ucm

1. Keluarkan perintah sebagai berikut;

$ enc2xs -M My.ucm
menghasilkan Makefile.PL
menghasilkan My.pm
menghasilkan README
menghasilkan Perubahan

Sekarang lihat direktori Anda saat ini. Seharusnya terlihat seperti ini.

$ ls -F
Makefile.PL Saya.pm saya.ucm t/

File berikut telah dibuat.

Makefile.PL - skrip MakeMaker
My.pm - Enkodekan submodul
t/My.t - file tes

1.1.
Jika Anda ingin *.ucm diinstal bersama dengan modul, lakukan hal berikut;

$ mkdir Enkode
$mv *.ucm Encode
$ enc2xs -M Enkode Saya/*ucm

2. Edit file yang dihasilkan. Gak usah kalo gak ada waktu DAN gak niat
memberikannya kepada orang lain. Tetapi ada baiknya untuk mengedit pod dan menambahkan lebih banyak tes.

3. Sekarang berikan perintah yang disukai semua Perl Mongers:

$perl Makefile.PL
Menulis Makefile untuk Encode::My

4. Sekarang yang harus Anda lakukan adalah membuatnya.

$ make
cp My.pm blib/lib/Encode/My.pm
/usr/local/bin/Perl /usr/local/bin/enc2xs -Q -O \
-o encode_t.c -f encode_t.fnm
Membaca myascii (myascii)
Menulis formulir yang dikompilasi
128 byte dalam tabel string
384 byte (75%) menyimpan duplikat bercak
1 byte (0.775%) disimpan menggunakan substring
....
chmod 644 blib/arch/auto/Encode/My/My.bs
$

Waktu yang dibutuhkan bervariasi tergantung pada seberapa cepat mesin Anda dan seberapa besar Anda
pengkodean adalah. Kecuali jika Anda mengerjakan sesuatu yang besar seperti euc-tw, itu tidak akan memakan waktu terlalu lama
panjang.

5. Anda sudah dapat "melakukan instalasi" tetapi Anda harus mengujinya terlebih dahulu.

$ buat tes
PERL_DL_NONNAZY=1 /usr/local/bin/perl -Iblib/arch -Iblib/lib \
-e 'gunakan Test::Harness qw(&runtests $verbose); \
$verbose=0; uji coba @ARGV;' t/*.t
t/Saya.... oke
Semua tes berhasil.
File=1, Tes=2, 0 detik jam dinding
( 0.09 cusr + 0.01 csys = 0.09 CPU)

6. Jika sudah puas dengan hasil tesnya, tinggal "make install"

7. Jika Anda ingin menambahkan penyandian Anda ke daftar pemuatan permintaan Encode (jadi Anda tidak perlu
"gunakan Encode::YourEncoding"), jalankan

enc2xs -C

untuk memperbarui Encode::ConfigLocal, modul yang mengontrol pengaturan lokal. Setelah itu,
"gunakan Enkode;" sudah cukup untuk memuat penyandian Anda sesuai permintaan.

Grafik Unicode Karakter Lokasi


Encode menggunakan format Unicode Character Map (UCM) untuk pemetaan karakter sumber. Ini
format ini digunakan oleh paket ICU IBM dan diadopsi oleh Nick Ing-Simmons untuk digunakan dengan:
Modul pengkodean. Karena UCM lebih fleksibel daripada Peta Encoding Tcl dan jauh lebih banyak pengguna
friendly, ini adalah format yang disarankan untuk Encode sekarang.

File UCM terlihat seperti ini.

#
# Komentar
#
"US-ascii" # Wajib diisi
"ascii" # Opsional
1 # Diperlukan; biasanya 1
1 # Maks. # byte/char
\x3F # Karakter substitusi
#
CHARMAP
\x0000 |00 #
\x0001 |01 #
\x0002 |02 #
....
\x007C |7 # GARIS VERTIKAL
\x007D |7 # KUrung KANAN KANAN
\x007E |7 # TILDE
\x007F |7 #
AKHIR CHARMAP

· Apa pun yang mengikuti "#" diperlakukan sebagai komentar.

· Bagian header berlanjut sampai baris yang berisi kata CHARMAP. Bagian ini
memiliki bentuk nilai, satu pasang per baris. String yang digunakan sebagai nilai harus
dikutip. Barewords diperlakukan sebagai angka. \xXX mewakili satu byte.

Sebagian besar kata kunci cukup jelas. subchar berarti karakter pengganti, bukan
subkarakter. Saat Anda memecahkan kode urutan Unicode ke penyandian ini tetapi tidak ada yang cocok
karakter ditemukan, urutan byte yang ditentukan di sini akan digunakan. Untuk kebanyakan kasus,
nilai di sini adalah \x3F; di ASCII, ini adalah tanda tanya.

· CHARMAP memulai bagian peta karakter. Setiap baris memiliki bentuk sebagai berikut:

\xXX.. |0 # komentar
^ ^ ^
| | +- Bendera mundur
| +-------- Urutan byte yang disandikan
+-------------- ID Karakter Unicode dalam hex

Formatnya kira-kira sama dengan bagian header kecuali untuk flag fallback: |
diikuti oleh 0..3. Arti dari nilai yang mungkin adalah sebagai berikut:

|0 Pulang pergi aman. Karakter yang didekodekan ke Unicode dikodekan kembali ke byte yang sama
urutan. Sebagian besar karakter memiliki bendera ini.

|1 Pengganti untuk unicode -> encoding. Jika dilihat, enc2xs menambahkan karakter ini untuk
mengkodekan peta saja.

|2 Lewati pemetaan sub-char jika tidak ada titik kode.

|3 Penggantian untuk penyandian -> unicode. Jika dilihat, enc2xs menambahkan karakter ini untuk
memecahkan kode peta saja.

· Dan akhirnya, END OF CHARMAP mengakhiri bagian ini.

Saat Anda membuat file UCM secara manual, Anda harus menyalin ascii.ucm atau yang sudah ada
pengkodean yang dekat dengan Anda, daripada menulis sendiri dari awal.

Ketika Anda melakukannya, pastikan Anda pergi setidaknya U0000 untuk U0020 apa adanya, kecuali lingkungan Anda
adalah EBCDIC.

PERINGATAN: tidak semua fitur di UCM diimplementasikan. Misalnya, icu:state tidak digunakan.
Karena itu, Anda perlu menulis modul perl jika Anda ingin mendukung algoritma
pengkodean, terutama seri ISO-2022. Modul tersebut termasuk Encode::JP::2022_JP,
Encode::KR::2022_KR, dan Encode::TW::HZ.

Mengatasi dengan duplikat pemetaan
Saat Anda membuat peta, Anda HARUS membuat pemetaan Anda pulang pergi dengan aman. Itu adalah,
"encode('your-encoding', decode('your-encoding', $data)) eq $data" adalah singkatan dari semua
karakter yang ditandai sebagai "|0". Berikut cara memastikannya:

· Urutkan peta Anda dalam urutan Unicode.

· Bila Anda memiliki entri duplikat, tandai salah satu dengan '|1' atau '|3'.

· Dan pastikan entri '|1' atau '|3' MENGIKUTI entri '|0'.

Berikut adalah contoh dari big5-eten.

\xF2550\xF9 |9
\xA2550\xA2 |4

Encoding Internal -> Unicode dan Unicode -> Encoding Map terlihat seperti ini;

E ke UU ke E
--------------------------------------
\xF9\xF9 => U2550 U2550 => \xF9\xF9
\xA2\xA4 => U2550

Jadi pulang-pergi aman untuk \xF9\xF9. Tapi kalau garis di atas terbalik, begini caranya
terjadi

E ke UU ke E
--------------------------------------
\xA2\xA4 => U2550 U2550 => \xF9\xF9
(\xF9\xF9 => U2550 sekarang ditimpa!)

Paket Encode dilengkapi dengan uclint, utilitas yang kasar tetapi cukup untuk memeriksa
integritas file UCM. Periksa di bawah direktori Encode/bin untuk ini.

Jika ragu, Anda dapat menggunakan ucmsort, utilitas lain di bawah direktori Encode/bin.

bookmark


· Halaman Rumah ICUhttp://www.icu-project.org/>

· Tabel Pemetaan Karakter ICUhttp://site.icu-project.org/charts/charset>

· ICU: Data Konversihttp://www.icu-project.org/userguide/conversion-data.html>

Gunakan enc2xs online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

  • 1
    Plugin Eclipse Tomcat
    Plugin Eclipse Tomcat
    Plugin Eclipse Tomcat menyediakan
    integrasi sederhana dari servlet Tomcat
    wadah untuk pengembangan java
    aplikasi web. Anda dapat bergabung dengan kami untuk
    diskusi...
    Unduh Plugin Eclipse Tomcat
  • 2
    Desktop WebTorrent
    Desktop WebTorrent
    WebTorrent Desktop adalah untuk streaming
    torrent di Mac, Windows atau Linux. Dia
    terhubung ke BitTorrent dan
    rekan-rekan WebTorrent. Sekarang tidak ada
    perlu menunggu...
    Unduh Desktop WebTorrent
  • 3
    GenX
    GenX
    GenX adalah program ilmiah untuk menyempurnakan
    reflektivitas sinar-x, neutron
    reflektifitas dan permukaan x-ray
    data difraksi menggunakan diferensial
    algoritma evolusi....
    Unduh GenX
  • 4
    pspp4windows
    pspp4windows
    PSPP adalah program untuk statistik
    analisis data sampel. Ini gratis
    pengganti program berpemilik
    SPSS. PSPP memiliki basis teks dan
    grafis kami...
    Unduh pspp4windows
  • 5
    Ekstensi Git
    Ekstensi Git
    Ekstensi Git adalah alat UI mandiri
    untuk mengelola repositori Git. Juga
    terintegrasi dengan Windows Explorer dan
    Microsoft Visual Studio
    (2015/2017/2019). NS...
    Unduh Ekstensi Git
  • 6
    eSpeak: sintesis ucapan
    eSpeak: sintesis ucapan
    Mesin Text to Speech untuk bahasa Inggris dan
    banyak bahasa lainnya. Ukuran kompak dengan
    pengucapan yang jelas tapi artifisial.
    Tersedia sebagai program baris perintah dengan
    banyak ...
    Unduh eSpeak: sintesis ucapan
  • Lebih banyak lagi »

Perintah Linux

Ad