āļāļĩāđāļāļ·āļāļāļģāļŠāļąāđāļ enc2xs āļāļĩāđāļŠāļēāļĄāļēāļĢāļāđāļĢāļĩāļĒāļāđāļāđāđāļāļāļđāđāđāļŦāđāļāļĢāļīāļāļēāļĢāđāļŪāļŠāļāļīāđāļāļāļĢāļĩāļāļāļ OnWorks āđāļāļĒāđāļāđāļŦāļāļķāđāļāđāļāđāļ§āļīāļĢāđāļāļŠāđāļāļāļąāļāļāļāļāđāļĨāļāđāļāļĢāļĩāļāļāļāđāļĢāļē āđāļāđāļ Ubuntu Online, Fedora Online, āđāļāļĢāđāļāļĢāļĄāļāļģāļĨāļāļāļāļāļāđāļĨāļāđāļāļāļ Windows āļŦāļĢāļ·āļāđāļāļĢāđāļāļĢāļĄāļāļģāļĨāļāļāļāļāļāđāļĨāļāđāļāļāļ MAC OS
āđāļāļĢāļāļāļēāļĢ:
āļāļ·āđāļ
enc2xs - āļāļąāļ§āļŠāļĢāđāļēāļāđāļĄāļāļđāļĨāđāļāđāļēāļĢāļŦāļąāļŠ Perl
āđāļĢāļ·āđāļāļāļĒāđāļ
enc2xs - [āļāļąāļ§āđāļĨāļ·āļāļ]
āđāļāļĨāđāđāļāļāļāļĩāđ enc2xs -M ModName...
enc2xs -C
DESCRIPTION
enc2xs āļŠāļĢāđāļēāļāļŠāđāļ§āļāļāļĒāļēāļĒ Perl āļŠāļģāļŦāļĢāļąāļāđāļāđāđāļāļĒāđāļāđāļēāļĢāļŦāļąāļŠāļāļēāļ Unicode Character Mapping
āđāļāļĨāđ (.ucm) āļŦāļĢāļ·āļāđāļāļĨāđāđāļāđāļēāļĢāļŦāļąāļŠ Tcl (.enc) āļāļāļāļāļēāļāļāļ°āļāļđāļāđāļāđāļ āļēāļĒāđāļāļĢāļ°āļŦāļ§āđāļēāļāļāļēāļĢāļŠāļĢāđāļēāļ
āļāļĢāļ°āļāļ§āļāļāļēāļĢāļāļāļāđāļĄāļāļđāļĨāđāļāđāļēāļĢāļŦāļąāļŠ āļāļļāļāļŠāļēāļĄāļēāļĢāļāđāļāđ enc2xs āđāļāļ·āđāļāđāļāļīāđāļĄāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāļāļāļāļāļļāļāđāļāļāđāļ Perl āđāļĨāļāļāļĩāđ
āļāļ§āļēāļĄāļĢāļđāđāđāļāļĩāđāļĒāļ§āļāļąāļ XS āđāļāđāļāļŠāļīāđāļāļāļģāđāļāđāļ
āļĢāļ§āļāđāļĢāđāļ§ āđāļāļ°āļāļģ
āļŦāļēāļāļāļļāļāļāđāļāļāļāļēāļĢāļāļĢāļēāļāđāļāļĩāđāļĒāļ§āļāļąāļ Perl āđāļŦāđāļāđāļāļĒāļāļĩāđāļŠāļļāļ āđāļāđāļāđāļāļāđāļāļīāđāļĄāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāđāļŦāļĄāđ just
āļāđāļēāļāļāļāļāļĩāđāđāļĨāļ°āļĨāļ·āļĄāļŠāđāļ§āļāļāļĩāđāđāļŦāļĨāļ·āļ
0. āđāļāļĢāļĩāļĒāļĄāđāļāļĨāđ .ucm āđāļŦāđāļāļĢāđāļāļĄ āļŦāļēāđāļāđāļāļēāļāļāļĩāđāđāļŦāļāļŠāļąāļāđāļŦāđāļāļŦāļĢāļ·āļāđāļāļĩāļĒāļāđāļāļāļāļēāļ
āļāļĩāļāļāđāļ§āļāļŦāļĢāļ·āļāļāļļāļāļŠāļēāļĄāļēāļĢāļāļāļ§āđāļēāļŦāļāļķāđāļāļāļąāļāļāļēāļāļāļēāļĢāļāļĢāļ°āļāļēāļĒāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāđāļĨāļ°āļāļĢāļąāļāđāļāđāļāđāļāđ āļŠāļģāļŦāļĢāļąāļ
āļĢāļđāļāđāļāļ UCM āļāļđāļāļāļāđāļāđāļ āđāļāļāļąāļ§āļāļĒāđāļēāļāļāđāļēāļāļĨāđāļēāļ āļāļąāļāļāļ°āđāļĢāļĩāļĒāļāļāļĪāļĐāļāļĩāļāļāļāļāļąāļāļ§āđāļē
āļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠ myascii āļāļģāļŦāļāļāđāļ my.ucm. "$" āđāļāđāļāļāļĢāļāļĄāļāđāļāļāļāđāļāļĨāļĨāđ
$ ls -F
my.ucm
1. āļāļāļāļāļģāļŠāļąāđāļāļāļąāļāļāđāļāđāļāļāļĩāđ
$ enc2xs -M my.ucm . āļāļāļāļāļąāļ
āļāļģāļĨāļąāļāļŠāļĢāđāļēāļ Makefile.PL
āļāļģāļĨāļąāļāļŠāļĢāđāļēāļ My.pm
āļāļģāļĨāļąāļāļŠāļĢāđāļēāļ README
āļāļģāđāļŦāđāđāļāļīāļāļāļēāļĢāđāļāļĨāļĩāđāļĒāļāđāļāļĨāļ
āļāļāļāļāļĩāđāļāļđāļāļĩāđāđāļāđāļĢāđāļāļāļāļĢāļĩāļāļąāļāļāļļāļāļąāļāļāļāļāļāļļāļ āļāļ§āļĢāļĄāļĩāļĨāļąāļāļĐāļāļ°āđāļāđāļāļāļĩāđ
$ ls -F
Makefile.PL My.pm my.ucm t/
āđāļāļĨāđāļāđāļāđāļāļāļĩāđāļāļđāļāļŠāļĢāđāļēāļāļāļķāđāļ
Makefile.PL - āļŠāļāļĢāļīāļāļāđ MakeMaker
My.pm - āđāļĄāļāļđāļĨāļĒāđāļāļĒāđāļāđāļēāļĢāļŦāļąāļŠ
t/My.t - āđāļāļĨāđāļāļāļŠāļāļ
1.1.
āļŦāļēāļāļāļļāļāļāđāļāļāļāļēāļĢ *.ucm āļāļīāļāļāļąāđāļāļāļĢāđāļāļĄāļāļąāļāđāļĄāļāļđāļĨ āđāļŦāđāļāļģāļāļąāļāļāļĩāđ
$ mkdir āđāļāđāļēāļĢāļŦāļąāļŠ
$ mv *.ucm āđāļāđāļēāļĢāļŦāļąāļŠ
$ enc2xs -M āđāļāđāļēāļĢāļŦāļąāļŠāļāļāļāļāļąāļ/*ucm
2. āđāļāđāđāļāđāļāļĨāđāļāļĩāđāļŠāļĢāđāļēāļāļāļķāđāļ āļāļļāļāđāļĄāđāļāļģāđāļāđāļāļāđāļāļāļāļģāļāđāļēāļāļļāļāđāļĄāđāļĄāļĩāđāļ§āļĨāļēāđāļĨāļ°āđāļĄāđāļĄāļĩāļāļ§āļēāļĄāļāļąāđāļāđāļāļāļĩāđāļāļ°
āđāļŦāđāļāļąāļāļāļāļāļ·āđāļ āđāļāđāļāļ§āļĢāđāļāđāđāļāļāđāļāļāđāļĨāļ°āđāļāļīāđāļĄāļāļēāļĢāļāļāļŠāļāļāđāļāļīāđāļĄāđāļāļīāļĄ
3. āļāļāļāļāļĩāđāļāļāļāļāļģāļŠāļąāđāļ Perl Mongers āļāļĩāđāļĢāļąāļ:
$perl Makefile.PL
āļāļēāļĢāđāļāļĩāļĒāļ Makefile āļŠāļģāļŦāļĢāļąāļ Encode::My
4. āļāļāļāļāļĩāđāļŠāļīāđāļāļāļĩāđāļāļļāļāļāđāļāļāļāļģāļāļ·āļāļāļģ
$ āđāļāđāļāļŦāļāđāļē
cp My.pm blib/lib/Encode/My.pm
/usr/local/bin/perl /usr/local/bin/enc2xs -Q -O \
-o encode_t.c -f encode_t.fnm
āļāđāļēāļ myascii (myascii)
āļāļēāļĢāđāļāļĩāļĒāļāđāļāļāđāļĢāļĩāļĒāļāđāļĢāļĩāļĒāļ
128 āđāļāļāđāđāļāļāļēāļĢāļēāļāļŠāļāļĢāļīāļ
384 āđāļāļāđ (75%) āļāļąāļāļāļķāļāļāļēāļĢāļāļģāļĢāļēāļĒāļāļēāļĢāļāļĩāđāļāđāļģāļāļąāļ
āļāļąāļāļāļķāļ 1 āđāļāļāđ (0.775%) āđāļāļĒāđāļāđāļŠāļāļĢāļīāļāļĒāđāļāļĒ
....
chmod 644 blib/arch/auto/Encode/My/My.bs
$
āđāļ§āļĨāļēāļāļĩāđāđāļāđāļāļ°āđāļāļāļāđāļēāļāļāļąāļāđāļāļāļķāđāļāļāļĒāļđāđāļāļąāļāļāļ§āļēāļĄāđāļĢāđāļ§āļāļāļāđāļāļĢāļ·āđāļāļāđāļĨāļ°āļāļāļēāļāļāļāļāđāļāļĢāļ·āđāļāļ
āļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāļāļ·āļ āļāđāļēāļāļļāļāđāļĄāđāļāļģāđāļĢāļ·āđāļāļāđāļŦāļāđāđ āļāļĒāđāļēāļ euc-tw āļāđāļāļāđāļĄāđāļĒāļļāđāļāđāļāđāļāļāļąāļ
āļĒāļēāļ§.
5. āļāļļāļāļŠāļēāļĄāļēāļĢāļ "āļāļģāļāļēāļĢāļāļīāļāļāļąāđāļ" āđāļāđāđāļĨāđāļ§ āđāļāđāļāļļāļāļāļ§āļĢāļāļāļŠāļāļāļāđāļāļ
$ āļāļģāļāļēāļĢāļāļāļŠāļāļ
PERL_DL_NONLAZY=1 /usr/local/bin/perl -Iblib/arch -Iblib/lib \
-e 'āđāļāđ Test::Harness qw(&runtests $verbose); \
$verbose=0; āļĢāļąāļāđāļāļŠ @ARGV;' t/*.t
t/My....āļāļāļĨāļ
āļāļēāļĢāļāļāļŠāļāļāļāļąāđāļāļŦāļĄāļāļāļĢāļ°āļŠāļāļāļ§āļēāļĄāļŠāļģāđāļĢāđāļ
āđāļāļĨāđ=1, āļāļāļŠāļāļ=2, 0 āļāļēāļŽāļīāļāļēāđāļāļ§āļāļ§āļīāļāļēāļāļĩ
( 0.09 cusr + 0.01 csys = 0.09 āļāļĩāļāļĩāļĒāļđ)
6. āļŦāļēāļāļāļļāļāļāļāđāļāļāļąāļāļāļĨāļāļēāļĢāļāļāļŠāļāļ āđāļāļĩāļĒāļāđāļāđ "āļāļģāļāļēāļĢāļāļīāļāļāļąāđāļ"
7. āļŦāļēāļāļāļļāļāļāđāļāļāļāļēāļĢāđāļāļīāđāļĄāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāļāļāļāļāļļāļāđāļāļĢāļēāļĒāļāļēāļĢāđāļŦāļĨāļāļāļ§āļēāļĄāļāđāļāļāļāļēāļĢāļāļāļāđāļāđāļēāļĢāļŦāļąāļŠ (āļāļąāļāļāļąāđāļāļāļļāļāđāļĄāđāļāļģāđāļāđāļāļāđāļāļ
"āđāļāđ Encode::YourEncoding") āđāļŦāđāđāļĢāļĩāļĒāļāđāļāđ
enc2xs -C
āđāļāļ·āđāļāļāļąāļāđāļāļ Encode::ConfigLocal āļāļķāđāļāđāļāđāļāđāļĄāļāļđāļĨāļāļĩāđāļāļ§āļāļāļļāļĄāļāļēāļĢāļāļąāđāļāļāđāļēāđāļāđāļāļĢāļ·āđāļāļ āļŦāļĨāļąāļāļāļēāļāļāļąāđāļ,
"āđāļāđāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠ" āļāđāđāļāļĩāļĒāļāļāļāļāļĩāđāļāļ°āđāļŦāļĨāļāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāļāļāļāļāļļāļāđāļāđāļāļēāļĄāļāđāļāļāļāļēāļĢ
āļāļ·āđāļāļāļĩāđ Unicode āļāļēāđāļĢāļāđāļāļāļĢāđ āđāļāļāļāļĩāđ
āļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāđāļāđāļĢāļđāļāđāļāļ Unicode Character Map (UCM) āļŠāļģāļŦāļĢāļąāļāļāļēāļĢāđāļĄāļāļāļąāļāļāļĢāļ°āļāđāļāļāļēāļ āļāļĩāđ
āļĢāļđāļāđāļāļāļāļđāļāđāļāđāđāļāļĒāđāļāđāļāđāļāļ ICU āļāļāļ IBM āđāļĨāļ°āļāļđāļāļāļģāļĄāļēāđāļāđāđāļāļĒ Nick Ing-Simmons āđāļāļ·āđāļāđāļāđāļāļąāļ
āđāļĄāļāļđāļĨāđāļāđāļēāļĢāļŦāļąāļŠ āđāļāļ·āđāļāļāļāļēāļ UCM āļĄāļĩāļāļ§āļēāļĄāļĒāļ·āļāļŦāļĒāļļāđāļāļĄāļēāļāļāļ§āđāļē Encoding Map āļāļāļ Tcl āđāļĨāļ°āļāļđāđāđāļāđāļĄāļēāļāļāļ§āđāļēāļĄāļēāļ
āđāļāđāļāļĄāļīāļāļĢ āļāļĩāđāļāļ·āļāļĢāļđāļāđāļāļāļāļĩāđāđāļāļ°āļāļģāļŠāļģāļŦāļĢāļąāļāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāđāļāļāļāļ°āļāļĩāđ
āđāļāļĨāđ UCM āļĄāļĩāļĨāļąāļāļĐāļāļ°āļāļąāļāļāļĩāđ
#
#āļāļāļĄāđāļĄāļāļāđ
#
"US-ascii" # āļāļģāđāļāđāļ
"ascii" # āđāļĄāđāļāļģāđāļāđāļ
1 # āļāļģāđāļāđāļ; āļāļāļāļī1
1 # āļŠāļđāļāļŠāļļāļ # āđāļāļāđ/āļāļąāļāļāļĢāļ°
\x3F # āļāļąāļāļāļĢāļ°āļāļāđāļāļ
#
āļāļēāļĢāđāđāļĄāļ
\x0000 |00 #
\x0001 |01 #
\x0002 |02 #
....
\x007C |7 # āđāļŠāđāļāđāļāļ§āļāļąāđāļ
\x007D |7 # āļ§āļāđāļĨāđāļāļāļĩāļāļāļēāļāļ§āļē
\x007E |7 # TILDE
\x007F |7 #
āļāļāļāļēāļĢāđāđāļĄāļ
· āļŠāļīāđāļāļāļĩāđāļāļēāļĄāļŦāļĨāļąāļ "#" āļāļ°āļāļ·āļāđāļāđāļāļāļ§āļēāļĄāļāļīāļāđāļŦāđāļ
· āļŠāđāļ§āļāļŦāļąāļ§āļāļ°āļāļģāđāļāļīāļāļāđāļāđāļāļāļāļāļķāļāļāļĢāļĢāļāļąāļāļāļĩāđāļĄāļĩāļāļģāļ§āđāļē CHARMAP āļŠāđāļ§āļāļāļĩāđ
āļĄāļĩāļĢāļđāļāđāļāļāļāļāļ āļāļ§āļēāļĄāļāļļāđāļĄāļāđāļē, āļŦāļāļķāđāļāļāļđāđāļāđāļāļāļĢāļĢāļāļąāļ āļŠāļāļĢāļīāļāļāļĩāđāđāļāđāđāļāđāļāļāđāļēāļāđāļāļāđāļāđāļ
āļĒāļāļĄāļē āļĻāļąāļāļāđāđāļŠāļāļāļ·āļāđāļāđāļāļāļąāļ§āđāļĨāļ \xXX āđāļŠāļāļāļāļķāļāđāļāļāđ
āļāļģāļŦāļĨāļąāļāļŠāđāļ§āļāđāļŦāļāđāļāļāļīāļāļēāļĒāļāļāđāļāļāđāļāđ āļāļąāļāļāļĢāļ°āļĒāđāļāļĒ āļŦāļĄāļēāļĒāļāļķāļ āļāļąāļāļāļĢāļ°āđāļāļāļāļąāļ§ āđāļĄāđāđāļāđ
āļāļąāļāļāļĢāļ°āļĒāđāļāļĒ āđāļĄāļ·āđāļāļāļļāļāļāļāļāļĢāļŦāļąāļŠāļĨāļģāļāļąāļ Unicode āđāļāđāļāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāļāļĩāđ āđāļāđāđāļĄāđāļĄāļĩāļāļēāļĢāļāļąāļāļāļđāđ
āļāļāļāļąāļāļāļĢāļ° āļĨāļģāļāļąāļāđāļāļāđāļāļĩāđāļāļģāļŦāļāļāđāļ§āđāļāļĩāđāļāļĩāđāļāļ°āļāļđāļāđāļāđ āđāļāļāļĢāļāļĩāļŠāđāļ§āļāđāļŦāļāđ
āļāđāļēāļāļĩāđāļāļĩāđāļāļ·āļ \x3F; āđāļ ASCII āļāļĩāđāļāļ·āļāđāļāļĢāļ·āđāļāļāļŦāļĄāļēāļĒāļāļģāļāļēāļĄ
· CHARMAP āđāļĢāļīāđāļĄāļŠāđāļ§āļāđāļāļāļāļĩāđāļāļąāļ§āļĨāļ°āļāļĢ āđāļāđāļĨāļ°āļāļĢāļĢāļāļąāļāļĄāļĩāļĢāļđāļāđāļāļāļāļąāļāļāļĩāđ:
\xXX.. |0 # āļāļ§āļēāļĄāļāļīāļāđāļŦāđāļ
-
| | +- āđāļāļĨāđāļāļŠāļģāļĢāļāļ
| +--------- āļĨāļģāļāļąāļāđāļāļāđāļāļĩāđāđāļāđāļēāļĢāļŦāļąāļŠ
+-------------- āļĢāļŦāļąāļŠāļāļąāļāļāļĢāļ° Unicode āđāļ hex
āļĢāļđāļāđāļāļāļāļ°āđāļŦāļĄāļ·āļāļāļāļąāļāļŠāđāļ§āļāļŦāļąāļ§āđāļāļĒāļāļĢāļ°āļĄāļēāļ āļĒāļāđāļ§āđāļāđāļāļĨāđāļāļāļēāļāđāļĨāļ·āļāļ: |
āļāļēāļĄāļāđāļ§āļĒ 0..3. āļāļ§āļēāļĄāļŦāļĄāļēāļĒāļāļāļāļāđāļēāļāļĩāđāđāļāđāļāđāļāđāļāđāļĄāļĩāļāļąāļāļāļĩāđ:
|0 āļāļĨāļāļāļ āļąāļĒāļāļąāđāļāđāļāđāļĨāļ°āļāļĨāļąāļ āļāļąāļāļāļĢāļ°āļāļĩāđāļāļāļāļĢāļŦāļąāļŠāđāļāđāļ Unicode āļāļ°āđāļāđāļēāļĢāļŦāļąāļŠāļāļĨāļąāļāđāļāđāļāđāļ byte . āđāļāļĩāļĒāļ§āļāļąāļ
āļĨāļģāļāļąāļ. āļāļąāļāļāļĢāļ°āļŠāđāļ§āļāđāļŦāļāđāļĄāļĩāđāļāļĨāđāļāļāļĩāđ
|1 āļāļēāļāđāļĨāļ·āļāļāļŠāļģāļĢāļāļāļŠāļģāļŦāļĢāļąāļ Unicode -> āļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠ āđāļĄāļ·āđāļāđāļŦāđāļ enc2xs āđāļāļīāđāļĄāļāļąāļāļāļĢāļ°āļāļĩāđāļŠāļģāļŦāļĢāļąāļ
āđāļāđāļēāļĢāļŦāļąāļŠāđāļāļāļāļĩāđāđāļāđāļēāļāļąāđāļ
|2 āļāđāļēāļĄāļāļēāļĢāđāļĄāļāļāđāļēāļāļĒāđāļāļĒāļŦāļēāļāđāļĄāđāļĄāļĩāļāļļāļāđāļāđāļ
|3 āļāļēāļāđāļĨāļ·āļāļāļŠāļģāļŦāļĢāļąāļāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠ -> āļĒāļđāļāļīāđāļāđāļ āđāļĄāļ·āđāļāđāļŦāđāļ enc2xs āđāļāļīāđāļĄāļāļąāļāļāļĢāļ°āļāļĩāđāļŠāļģāļŦāļĢāļąāļ
āļāļāļāļĢāļŦāļąāļŠāđāļāļāļāļĩāđāđāļāđāļēāļāļąāđāļ
· āđāļĨāļ°āļŠāļļāļāļāđāļēāļĒ END OF CHARMAP āļāļāļŠāđāļ§āļāļāļĩāđ
āđāļĄāļ·āđāļāļāļļāļāļŠāļĢāđāļēāļāđāļāļĨāđ UCM āļāđāļ§āļĒāļāļāđāļāļ āļāļļāļāļāļ§āļĢāļāļąāļāļĨāļāļ ascii.ucm āļŦāļĢāļ·āļāđāļāļĨāđāļāļĩāđāļĄāļĩāļāļĒāļđāđ
āļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāļāļĩāđāđāļāļĨāđāđāļāļĩāļĒāļāļāļąāļāļāļāļāļāļļāļāļĄāļēāļāļāļ§āđāļēāļāļēāļĢāđāļāļĩāļĒāļāļāļāļāļāļļāļāđāļāļāļāļąāđāļāđāļāđāđāļĢāļīāđāļĄāļāđāļ
āđāļĄāļ·āđāļāļāļļāļāļāļģāđāļāđāļāļāļąāđāļ āđāļŦāđāđāļāđāđāļāļ§āđāļēāļāļļāļāļāļāļāđāļāļāļĒāđāļēāļāļāđāļāļĒ U0000 āđāļāļĒāļąāļ U0020 āļāļēāļĄāļāļĩāđāđāļāđāļāļāļĒāļđāđāđāļ§āđāļāđāļāđāļŠāļ āļēāļāđāļ§āļāļĨāđāļāļĄāļāļāļāļāļļāļ
āļāļ·āļ EBCDI
āļāđāļāđāļĄāđ: āđāļĄāđāđāļāđāđāļāđāļāļēāļāļāļļāļāļĨāļąāļāļĐāļāļ°āļāļąāđāļāļŦāļĄāļāđāļ UCM āļāļąāļ§āļāļĒāđāļēāļāđāļāđāļ icu:state āļāļ°āđāļĄāđāļāļđāļāđāļāđ
āļāđāļ§āļĒāđāļŦāļāļļāļāļĩāđ āļāļļāļāļāđāļāļāđāļāļĩāļĒāļāđāļĄāļāļđāļĨ Perl āļŦāļēāļāļāļļāļāļāđāļāļāļāļēāļĢāļŠāļāļąāļāļŠāļāļļāļāļāļąāļĨāļāļāļĢāļīāļāļķāļĄ
āļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠ āđāļāļĒāđāļāļāļēāļ°āļāļļāļ ISO-2022 āđāļĄāļāļđāļĨāļāļąāļāļāļĨāđāļēāļ§āļĢāļ§āļĄāļāļķāļ Encode::JP::2022_JP,
āđāļāđāļēāļĢāļŦāļąāļŠ::KR::2022_KR āđāļĨāļ°āđāļāđāļēāļĢāļŦāļąāļŠ::TW::HZ
āļāļēāļĢāļĢāļąāļāļĄāļ·āļ āļāļąāļ āļāđāļģ āļāļēāļĢāđāļĄāļ
āđāļĄāļ·āđāļāļāļļāļāļŠāļĢāđāļēāļāđāļāļāļāļĩāđ āļāļļāļāļāļ§āļĢāļāļģāđāļŦāđāđāļāļāļāļĩāđāļāļāļāļāļļāļāđāļ-āļāļĨāļąāļāļāļĨāļāļāļ āļąāļĒ āļāļąāđāļāļāļ·āļ,
"encode('your-encoding', decode('your-encoding', $data)) eq $data" āļŦāļĄāļēāļĒāļāļķāļāļāļąāđāļāļŦāļĄāļ
āļāļąāļāļāļĢāļ°āļāļĩāđāļĄāļĩāđāļāļĢāļ·āđāļāļāļŦāļĄāļēāļĒ "|0" āļāļĩāđāļāļ·āļāļ§āļīāļāļĩāļāļēāļĢāļāļĢāļ§āļāļŠāļāļāđāļŦāđāđāļāđāđāļ:
· āļāļąāļāđāļĢāļĩāļĒāļāđāļāļāļāļĩāđāļāļāļāļāļļāļāđāļāļĨāļģāļāļąāļ Unicode
· āđāļĄāļ·āđāļāļāļļāļāļĄāļĩāļĢāļēāļĒāļāļēāļĢāļāļĩāđāļāđāļģāļāļąāļ āđāļŦāđāļāļģāđāļāļĢāļ·āđāļāļāļŦāļĄāļēāļĒāļĢāļēāļĒāļāļēāļĢāđāļāļĢāļēāļĒāļāļēāļĢāļŦāļāļķāđāļāļāđāļ§āļĒ '|1' āļŦāļĢāļ·āļ '|3'
· āđāļĨāļ°āļāļĢāļ§āļāļŠāļāļāđāļŦāđāđāļāđāđāļāļ§āđāļēāļĢāļēāļĒāļāļēāļĢ '|1' āļŦāļĢāļ·āļ '|3' āđāļāđāļāđāļāļāļēāļĄāļĢāļēāļĒāļāļēāļĢ '|0'
āļāļĩāđāļāļ·āļāļāļąāļ§āļāļĒāđāļēāļāļāļēāļ big5-eten
\xF2550\xF9 |9
\xA2550\xA2 |4
āļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāļ āļēāļĒāđāļ -> Unicode āđāļĨāļ° Unicode -> āđāļāļāļāļĩāđāļāļēāļĢāđāļāđāļēāļĢāļŦāļąāļŠāļĄāļĩāļĨāļąāļāļĐāļāļ°āļāļąāļāļāļĩāđ
E āļāļķāļ UU āļāļķāļ E
--------------------------------------
\xF9\xF9 => U2550 U2550 => \xF9\xF9
\xA2\xA4 => U2550
āļāļąāļāļāļąāđāļāļāļķāļāļāļĨāļāļāļ āļąāļĒāļāļąāđāļāđāļāđāļĨāļ°āļāļĨāļąāļāļŠāļģāļŦāļĢāļąāļ \xF9\xF9 āđāļāđāļāđāļēāđāļŠāđāļāļāđāļēāļāļāļāļāļĨāļąāļāļŦāļąāļ§ āļāļĩāđāļāļ·āļāļŠāļīāđāļāļāļĩāđ
āļāļĩāđāđāļāļīāļāļāļķāđāļ
E āļāļķāļ UU āļāļķāļ E
--------------------------------------
\xA2\xA4 => U2550 U2550 => \xF9\xF9
(\xF9\xF9 => U2550 āļāļđāļāđāļāļĩāļĒāļāļāļąāļāđāļĨāđāļ§!)
āđāļāđāļāđāļāļāđāļāđāļēāļĢāļŦāļąāļŠāļĄāļēāļāļĢāđāļāļĄāļāļąāļ āļĒāļđāļāļĨāļīāļāļāđ, āļĒāļđāļāļīāļĨāļīāļāļĩāđāļāļĩāđāļŦāļĒāļēāļ āđāļāđāđāļāļĩāļĒāļāļāļāļāļĩāđāļāļ°āļāļĢāļ§āļāļŠāļāļ
āļāļ§āļēāļĄāļŠāļĄāļāļđāļĢāļāđāļāļāļāđāļāļĨāđ UCM āļāļĢāļ§āļāļŠāļāļāļ āļēāļĒāđāļāđāđāļāđāļĢāđāļāļāļāļĢāļĩ Encode/bin āļŠāļģāļŦāļĢāļąāļāļŠāļīāđāļāļāļĩāđ
āđāļĄāļ·āđāļāļĄāļĩāļāđāļāļŠāļāļŠāļąāļĒāļāļļāļāļŠāļēāļĄāļēāļĢāļāđāļāđ ucmsortāļĒāļđāļāļīāļĨāļīāļāļĩāđāļāļ·āđāļāļ āļēāļĒāđāļāđāđāļāđāļĢāļāļāļāļĢāļĩ Encode/bin
Bookmarks
· āļŦāļāđāļēāđāļĢāļāļāļāļāđāļāļāļĩāļĒāļđhttp://www.icu-project.org/>
· āļāļēāļĢāļēāļāļāļēāļĢāđāļĄāļāļāļąāļāļāļĢāļ° ICUhttp://site.icu-project.org/charts/charset>
· ICU: āļāđāļāļĄāļđāļĨāļāļēāļĢāđāļāļĨāļhttp://www.icu-project.org/userguide/conversion-data.html>
āđāļāđ enc2xs āļāļāļāđāļĨāļāđāđāļāļĒāđāļāđāļāļĢāļīāļāļēāļĢ onworks.net