İngilizceFransızcaİspanyolca

Ad


OnWorks favicon'u

enc2xs - Bulutta Çevrimiçi

Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında enc2xs çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü gibi birden çok ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen enc2xs komutudur.

Program:

ADI


enc2xs -- Perl Kodlama Modülü Oluşturucu

SİNOPSİS


enc2xs -[seçenekler]
enc2xs -M ModName harita dosyaları...
enc2xs -C

TANIM


enc2xs Unicode Karakter Eşlemesinden Encode tarafından kullanılmak üzere bir Perl uzantısı oluşturur
dosyalar (.ucm) veya Tcl Kodlama Dosyaları (.enc). Yapım sırasında dahili olarak kullanılmasının yanı sıra
Encode modülünün işlemi, kullanabilirsiniz enc2xs perl'e kendi kodlamanızı eklemek için. Numara
XS bilgisi gereklidir.

Hızlı Başlangıç Kılavuzu


Perl hakkında mümkün olduğunca az şey bilmek istiyor ancak yeni bir kodlama eklemeniz gerekiyorsa,
bu bölümü okuyun ve gerisini unutun.

0. Bir .ucm dosyası hazırlayın. Bir yerden alabilirsin veya kendin yazabilirsin
sıfırlayın veya Encode dağıtımından bir tane alıp özelleştirebilirsiniz. İçin
UCM formatı, sonraki Bölüme bakın. Aşağıdaki örnekte, teorik bilgimi arayacağım
myascii'yi kodlama, içinde tanımlanan benim.ucm. "$" bir kabuk istemidir.

$ l -F
benim.ucm

1. Aşağıdaki gibi bir komut verin;

$ enc2xs -M my.ucm'm
Makefile.PL oluşturma
My.pm oluşturuluyor
BENİOKU oluşturma
Değişiklikler oluşturma

Şimdi mevcut dizininize bir göz atın. Bu şekilde görünmelidir.

$ l -F
Makefile.PL My.pm my.ucm t/

Aşağıdaki dosyalar oluşturuldu.

Makefile.PL - MakeMaker komut dosyası
My.pm - Alt modülü kodla
t/My.t - test dosyası

1.1
*.ucm'nin modüllerle birlikte yüklenmesini istiyorsanız aşağıdakileri yapın;

$ mkdir Kodla
$ mv *.ucm Kodlama
$ enc2xs -M Kodlamam/*ucm

2. Oluşturulan dosyaları düzenleyin. Vaktin yoksa VE niyetin yoksa yapmana gerek yok
başkasına ver. Ancak bölmeyi düzenlemek ve daha fazla test eklemek iyi bir fikirdir.

3. Şimdi tüm Perl Tacirlerinin sevdiği bir komut verin:

$ perl Makefile.PL
Encode::My için Makefile Yazma

4. Şimdi tek yapmanız gereken yapmak.

Yap $
cp My.pm blib/lib/Encode/My.pm
/usr/local/bin/Perl /usr/local/bin/enc2xs -Q -O \
-o kodlama_t.c -f kodlama_t.fnm
myascii (myascii) okuma
Derlenmiş form yazma
dize tablolarında 128 bayt
384 bayt (%75) kaydedilen tespit kopyaları
1 bayt (%0.775) alt dizeler kullanılarak kaydedildi
....
chmod 644 blib/arch/auto/Encode/My/My.bs
$

Bu süre, makinenizin ne kadar hızlı olduğuna ve ne kadar büyük olduğuna bağlı olarak değişir.
kodlamadır. euc-tw gibi büyük bir şey üzerinde çalışmadığınız sürece, çok uzun sürmeyecektir.
uzun.

5. Zaten "kurulum" yapabilirsiniz, ancak önce test etmelisiniz.

$ testi yap
PERL_DL_NONLAZY=1 /usr/local/bin/Perl -Iblib/arch -Iblib/lib \
-e 'Test::Harness qw(&runtests $verbose); \
$ayrıntılı=0; çalıştırma testleri @ARGV;' t/*.t
t/Benim....tamam
Tüm testler başarılı.
Dosyalar=1, Testler=2, 0 duvar saati saniye
(0.09 cusr + 0.01 csys = 0.09 CPU)

6. Test sonucundan memnunsanız, sadece "kurulum yapın"

7. Kodlamanızı Encode'un talep yükleme listesine eklemek istiyorsanız (böylece
"Encode::YourEncoding'i kullanın"), çalıştırın

enc2xs -C

yerel ayarları kontrol eden bir modül olan Encode::ConfigLocal'ı güncellemek için. Daha sonra,
"Kodlama kullan;" kodlamalarınızı talep üzerine yüklemek için yeterlidir.

The Unicode Karakter Harita


Encode, kaynak karakter eşlemeleri için Unicode Karakter Eşlem (UCM) biçimini kullanır. Bu
biçim, IBM'in ICU paketi tarafından kullanılır ve Nick Ing-Simmons tarafından
Modülü kodlayın. UCM, Tcl'nin Kodlama Haritasından daha esnek olduğundan ve çok daha fazla kullanıcı-
dostu, şimdi Encode için önerilen format budur.

Bir UCM dosyası şöyle görünür.

#
# Yorumlar
#
"US-ascii" # Gerekli
"ascii" # İsteğe bağlı
1 # Gerekli; genellikle 1
1 # Maks. # bayt/karakter
\x3F # Yerine koyma karakteri
#
ÇEKİCİLİK
\x0000 |00 #
\x0001 |01 #
\x0002 |02 #
....
\x007C |7 # DİKEY HAT
\x007D |7 # SAĞ Kıvırcık KULAK
\x007E |7 # TILDE
\x007F |7 #
BİÇİM ÇEKİCİLİK

· "#" işaretinden sonra gelen her şey yorum olarak kabul edilir.

· Başlık bölümü, CHARMAP kelimesini içeren bir satıra kadar devam eder. Bu bölüm
bir formu var değer, satır başına bir çift. Değer olarak kullanılan dizeler
alıntı. Barewords sayı olarak kabul edilir. \xXX bir baytı temsil eder.

Anahtar kelimelerin çoğu açıklayıcıdır. alt karakter ikame karakteri anlamına gelir, değil
alt karakter. Bu kodlamaya bir Unicode dizisinin kodunu çözdüğünüzde ancak eşleşme olmadığında
karakter bulunursa, burada tanımlanan bayt dizisi kullanılacaktır. Çoğu durumda,
buradaki değer \x3F'dir; ASCII'de bu bir soru işaretidir.

· CHARMAP, karakter haritası bölümünü başlatır. Her satırın aşağıdaki gibi bir formu vardır:

\xXX.. |0 # yorum
^ ^ ^
| | +- Geri dönüş bayrağı
| +------- Şifreli bayt dizisi
+------------- Onaltılı Unicode Karakter Kimliği

Biçim, geri dönüş bayrağı dışında başlık bölümüyle kabaca aynıdır: |
ardından 0..3 gelir. Olası değerlerin anlamı aşağıdaki gibidir:

|0 Gidiş-dönüş kasası. Unicode'a kodu çözülen bir karakter, aynı bayta kodlanır
sıra. Çoğu karakterde bu bayrağa sahiptir.

|1 Unicode için geri dönüş -> kodlama. Enc2xs görüldüğünde bu karakteri ekler.
yalnızca haritayı kodlayın.

|2 Kod noktası olmaması durumunda alt karakter eşlemesini atlayın.

|3 Kodlama için geri dönüş -> unicode. Enc2xs görüldüğünde bu karakteri ekler.
sadece haritanın kodunu çöz.

· Ve son olarak, END OF CHARMAP bölümü bitiriyor.

Manuel olarak bir UCM dosyası oluştururken, ascii.ucm veya mevcut bir dosyayı kopyalamanız gerekir.
sıfırdan kendinizinkini yazmak yerine, sizinkine yakın kodlama.

Bunu yaptığınızda, en azından ayrıldığınızdan emin olun. U0000 için U0020 olduğu gibi, çevreniz sürece
EBCDIC'dir.

UYARI: UCM'deki tüm özellikler uygulanmaz. Örneğin, icu:durum kullanılmaz.
Bu nedenle, algoritmik desteği desteklemek istiyorsanız bir Perl modülü yazmanız gerekir.
kodlamalar, özellikle ISO-2022 serisi. Bu tür modüller şunları içerir: Encode::JP::2022_JP,
Encode::KR::2022_KR ve Encode::TW::HZ.

Başa Çıkma ile çift eşleştirmeleri
Bir harita oluşturduğunuzda, haritalarınızı gidiş-dönüş güvenli hale getirmelisiniz. Yani,
"encode('your-encoding', decode('your-encoding', $veri)) eq $veri", tümü anlamına gelir
"|0" olarak işaretlenmiş karakterler. İşte nasıl emin olacağınız:

· Haritanızı Unicode düzeninde sıralayın.

· Yinelenen bir girişiniz varsa, birini '|1' veya '|3' ile işaretleyin.

· Ve '|1' veya '|3' girişinin '|0' girişini TAKİP ETTİĞİNDEN emin olun.

İşte big5-eten'den bir örnek.

\xF2550\xF9 |9
\xA2550\xA2 |4

Dahili Olarak Kodlama -> Unicode ve Unicode -> Kodlama Haritası şöyle görünür;

E'den UU'ya E'ye
--------------------------------------
\xF9\xF9 => U2550 U2550 => \xF9\xF9
\xA2\xA4 => U2550

Bu nedenle \xF9\xF9 için gidiş-dönüş güvenlidir. Ancak yukarıdaki satır baş aşağı ise, işte bu
olur.

E'den UU'ya E'ye
--------------------------------------
\xA2\xA4 => U2550 U2550 => \xF9\xF9
(\xF9\xF9 => U2550'nin artık üzerine yazılır!)

Encode paketi ile birlikte gelir uclintkontrol etmek için kaba ancak yeterli bir yardımcı program
UCM dosyasının bütünlüğü. Bunun için Encode/bin dizininin altına bakın.

Şüphe duyduğunuzda, kullanabilirsiniz üç sıralama, Encode/bin dizini altındaki başka bir yardımcı program.

Yer imleri


· YBÜ Ana Sayfasıhttp://www.icu-project.org/>

· YBÜ Karakter Eşleme Tablolarıhttp://site.icu-project.org/charts/charset>

· ICU:Dönüşüm Verilerihttp://www.icu-project.org/userguide/conversion-data.html>

onworks.net hizmetlerini kullanarak enc2xs'i çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad