Amazon Best VPN GoSearch

Favicon OnWorks

uni2ascii - Dalam talian di Awan

Jalankan uni2ascii dalam penyedia pengehosan percuma OnWorks melalui Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

Ini ialah perintah uni2ascii yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.

JADUAL:

NAMA


uni2ascii - tukar UTF-8 Unicode kepada pelbagai perwakilan ASCII 7-bit

SINOPSIS


uni2ascii [pilihan] ( fail nama>)

DESCRIPTION


uni2ascii menukar UTF-8 Unicode kepada pelbagai perwakilan ASCII 7-bit. Jika tiada format
ditentukan, format heksadesimal piawai (cth 0x00e9) digunakan. Ia membaca dari standard
input dan menulis kepada output standard.

Pilihan baris arahan ialah:

-A Senaraikan anggaran aksara tunggal yang dijalankan oleh bendera -y.

-a
Tukar kepada format yang ditentukan. Format boleh ditentukan melalui perkara berikut
kod aksara tunggal sewenang-wenangnya, melalui nama seperti "SGML_decimal", dan oleh
contoh format yang dikehendaki.

A Hasilkan nombor perenambelasan dengan awalan U dalam kurungan sudut ( ).

B Hasilkan \x-escaped hex (cth \x00E9)

C Hasilkan \x nombor heksadesimal yang terlepas dalam pendakap (cth \x{00E9}).

D Hasilkan rujukan aksara angka HTML perpuluhan (cth é)

E Hasilkan perenambelasan dengan awalan U (U00E9).

F Hasilkan perenambelasan dengan awalan u (u00E9).

G Tukar perenambelasan dalam petikan tunggal dengan awalan X (cth X'00E9').

H Hasilkan rujukan aksara angka HTML perenambelasan (cth é)

I Hasilkan heksadesimal UTF-8 dengan heks setiap bait didahului oleh tanda =-(cth.
=C3=A9) . Ini ialah format Boleh Cetak Dipetik yang ditakrifkan oleh RFC 2045.

J Hasilkan heksadesimal UTF-8 dengan heks setiap bait didahului oleh tanda % (cth.
%C3%A9). Ini ialah format melarikan diri URI yang ditakrifkan oleh RFC 2396.

K Hasilkan UTF-8 perlapanan dengan setiap bait dilepaskan oleh garis serong ke belakang (cth \303\251)

L Hasilkan \U-escaped hex di luar BMP, \u-escaped hex dalam BMP
(U+0000-U+FFFF).

M Hasilkan rujukan aksara angka SGML heksadesimal (cth \#xE9;)

N Hasilkan rujukan aksara angka SGML perpuluhan (cth \#233;)

O Hasilkan pelarian perlapanan untuk tiga bait rendah dalam susunan big-endian(cth
\000\000\351))

P Hasilkan nombor perenambelasan dengan awalan U+ (cth U+00E9)

Q Hasilkan entiti aksara (cth é) jika boleh, jika tidak perenambelasan
rujukan aksara angka.

R Hasilkan nombor heksadesimal mentah (cth 00E9)

S Hasilkan pelepasan heksadesimal untuk tiga bait rendah dalam susunan besar-endian (cth
\x00\x00\xE9)

T Hasilkan pelarian perpuluhan untuk tiga bait rendah dalam susunan besar-endian (cth
\d000\d000\d233)

U Hasilkan \u-escaped nombor heksadesimal (cth \u00E9).

V Hasilkan \u-escaped nombor perpuluhan (cth \u00233).

X Hasilkan nombor perenambelasan piawai (cth 0x00E9).

0 Hasilkan heksadesimal UTF-8 dengan setiap heks bait disertakan dalam kurungan sudut
(cth ).

1 Hasilkan nombor heksadesimal format Lisp Biasa (cth #x00E9).

2 Hasilkan nombor perpuluhan format Perl dengan awalan v (cth v233).

3 Hasilkan nombor perenambelasan dengan awalan $ (cth $00E9).

4 Hasilkan nombor perenambelasan format Postskrip dengan awalan 16# (cth 16#00E9).

5 Hasilkan nombor heksadesimal format Lisp Biasa dengan awalan #16r (cth #16r00E9).

6 Hasilkan nombor perenambelasan format ADA dengan awalan 16# dan akhiran # (cth
16#00E9#).

7 Hasilkan heksadesimal UTF-8 format log Apache dengan heks setiap bait didahului dengan a
sengkang terbalik-x (cth \xC3\xA9).

8 Hasilkan nombor perenambelasan format Microsoft OOXML dengan awalan _x dan akhiran _
(cth _x00E9_).

9 Hasilkan %\u-escaped nombor heksadesimal (cth %\u00E9).

-B Tukar kepada ASCII jika boleh. Pilihan ini bersamaan dengan gabungan cdefx.

-c Tukar aksara bulatan dan kurungan kepada aksara yang tidak tertutup.

-d Diakritik jalur. Ini menukar titik kod tunggal yang mewakili aksara dengan
diakritik kepada aksara ASCII yang sepadan dan padam secara berasingan dikodkan
diakritik.

-e Tukar aksara kepada anggaran setara ASCII, seperti berikut:
U+0085 baris seterusnya 0x0A baris baharu
U+00A0 tiada ruang rehat 0x20 ruang
U+00AB tanda petikan dua sudut bersudut kiri 0x22 petikan
U+00AD tanda sempang lembut 0x2D tolak
U+00AF makron 0x2D tolak
U+00B7 titik tengah 0x2E noktah
U+00BB tanda petikan dua sudut bersudut kanan 0x22 petikan
U+1361 ruang perkataan ethiopik 0x20 ruang
U+1680 ogham space 0x20 space
U+2000 en quad 0x20 ruang
U+2001 dengan ruang empat 0x20
U+2002 en ruang 0x20 ruang
U+2003 em ruang 0x20 ruang
U+2004 ruang tiga per em 0x20 ruang
U+2005 ruang empat per em 0x20 ruang
U+2006 ruang enam per-em 0x20 ruang
Ruang angka U+2007 ruang 0x20
Ruang tanda baca U+2008 ruang 0x20
U+2009 ruang nipis 0x20 ruang
U+200A ruang rambut 0x20 ruang
U+200B ruang lebar sifar 0x20 ruang
U+2010 tanda sempang 0x2D tolak
U+2011 tanda sempang tidak putus 0x2D tolak
Sempang angka U+2012 0x2D tolak
U+2013 en dash 0x2D tolak
U+2014 em sempang 0x2D tolak
U+2018 meninggalkan tanda petikan tunggal 0x60 kiri petikan tunggal
Tanda petikan tunggal kanan U+2019 0x27 tunggal kanan atau neutral
memetik
U+201A tanda petikan tunggal rendah-9 0x60 kiri petikan tunggal
U+201B tunggal tinggi-terbalik-9 tanda petikan 0x60 kiri petikan tunggal
U+201C meninggalkan tanda petikan berganda 0x22 petikan berganda
U+201D tanda petikan berganda kanan 0x22 petikan berganda
U+201E double low-9 tanda petikan 0x22 double quote
U+201F double high-reversed-9 tanda petikan 0x22 double quotation
U+2022 peluru 0x6F huruf kecil o
U+2028 pemisah baris 0x0A baris baharu
petikan berganda 2033x0 perdana berganda U+22
U+2039 tanda petikan sudut tuding kiri tunggal 0x60 petikan tunggal kiri
U+203A tanda petikan sudut tuding kanan tunggal 0x27 kanan atau tunggal neutral
memetik
U+204E asterisk rendah 0x2A asterisk
U+2212 tanda tolak 0x2D tolak
Set U+2216 tolak 0x5C sengkang terbalik
U+2217 pengendali asterisk 0x2A asterisk
U+2223 membahagikan garis menegak 0x7C
Lampu lukisan kotak U+2500 mendatar 0x2D tolak
Kotak U+2501 melukis berat mendatar 0x2D tolak
U+2502 kotak cahaya menegak garis menegak 0x7C
Kotak U+2503 melukis garisan menegak menegak berat 0x7C
U+2731 asterisk berat 0x2A asterisk
U+275D dua kali berat bertukar koma tanda petikan 0x22 dua petikan
U+275E tanda petikan dua koma berat 0x22 petikan dua
Ruang ideografi U+3000 ruang 0x20
U+FE60 ampersand kecil dan 0x26 ampersand
U+FE61 asterisk kecil 0x2A asterisk
tanda tambah kecil U+FE62 tanda tambah 0x2B

-E Senaraikan pengembangan yang dilakukan oleh bendera -x.

-f Tukar varian gaya kepada ASCII biasa. Kesetaraan gaya termasuk:
borang superskrip dan subskrip, huruf besar kecil (cth U+1D04), borang skrip (cth
U+212C), bentuk huruf hitam (cth U+212D), bentuk lebar penuh (cth U+FF01), separuh lebar
borang (cth U+FF7B), dan simbol alfanumerik matematik (cth U+1D400).

-h Tolong. Cetak mesej penggunaan dan keluar.

-l Gunakan huruf kecil af apabila menjana nombor perenambelasan.

-n Tukar baris baharu juga. Secara lalai, mereka dibiarkan bersendirian.

-P Lewati Unicode daripada menukar kepada ASCII escapes jika aksara itu
tidak ditukar kepada aksara ASCII dengan transformasi seperti diakritik
menanggalkan. Ambil perhatian bahawa jika pilihan ini digunakan, output mungkin bukan ASCII tulen.

-p tulen. Tukar aksara dalam julat ASCII kecuali ruang dan baris baharu sebagai
serta yang di atas.

-q Senyap. Jangan bersembang yang tidak perlu semasa bekerja.

-s Tukar aksara ruang juga. Secara lalai, mereka dibiarkan bersendirian.

-S
Tentukan penggantian tersuai. Hujah harus terdiri daripada titik kod Unicode
untuk diganti diikuti dengan kod ASCII bagi aksara yang akan digunakan sebagai
penggantian, dipisahkan oleh kolon. Jika tiada kod ASCII mengikut titik bertindih, kod
aksara Unicode yang ditentukan akan dipadamkan. Nilai kod mungkin ada dalam
perenambelasan, perlapanan atau perpuluhan mengikut konvensyen biasa (setepatnya, mereka
of strtoul(3)). Pilihan ini boleh diulang seberapa banyak kali yang dikehendaki untuk ditakrifkan
beberapa penggantian.

-v Cetak maklumat versi program dan keluar.

-w Tambahkan ruang selepas setiap item ditukar.

-x Kembangkan aksara tertentu kepada jujukan berbilang aksara. Watak yang terjejas ialah
sama seperti yang terjejas oleh pilihan -y.
TANDA U+00A2 SEN -> sen
TANDA U+00A3 PON -> paun
TANDA U+00A5 YEN -> yen
SIMBOL HAK CIPTA U+00A9 -> (c)
SIMBOL BERDAFTAR U+00AE -> (R)
U+00BC SATU SUKU -> 1/4
U+00BD SATU SETENGAH -> 1/2
U+00JADI TIGA SUKU -> 3/4
U+00C6 HURUF BESAR ASH -> AE
U+00DF HURUF KECIL SHARP S -> ss
U+00E6 ABU HURUF KECIL -> ae
U+0132 LIGATUR IJ -> IJ
U+0133 LIGATUR ij -> ij
U+0152 LIGATUR OE -> OE
U+0153 LIGATUR oe -> oe
U+01F1 HURUF BESAR DZ -> DZ
U+01F2 HURUF CAMPUR Dz -> Dz
U+01F3 HURUF KECIL DZ -> dz
U+02A6 HURUF KECIL TS DIGRAF -> ts
U+2026 ELLIPSIS MENDATAR -> ...
TANDA EURO U+20AC -> euro
U+22EF ELLIPSIS MENDATAR TENGAH -> ...
U+2190 ANAK KE KIRI -> <-
U+2192 ANAK KE KANAN -> ->
U+21D0 KE KIRI ANAK BERGANDA -> <=
U+21D2 ANAK BERGANDA KE KANAN -> =>
U+FB00 LIGATUR KECIL LATIN FF -> ff
U+FB01 LIGATUR KECIL LATIN FI -> fi
U+FB02 LIGATUR KECIL LATIN FL -> fl
U+FB03 LIGATUR KECIL LATIN FFI -> ffi
U+FB04 LIGATUR KECIL LATIN FFL -> ffl
U+FB06 LIGATUR KECIL LATIN ST -> st

-y Tukar aksara tertentu yang mempunyai pengembangan berbilang aksara kepada aksara tunggal
anggaran ascii sebaliknya (cth untuk mengekalkan kedudukan aksara). The
aksara yang terjejas adalah sama seperti yang dipengaruhi oleh pilihan -x.
TANDA SEN U+00A2 -> c
TANDA U+00A3 PON -> #
TANDA U+00A5 YEN -> Y
U+00A9 SIMBOL HAK CIPTA -> C
SIMBOL BERDAFTAR U+00AE -> R
U+00BC SATU SUKU -> -
U+00BD SATU SETENGAH -> -
U+00JADI TIGA SUKU -> -
U+00C6 HURUF BESAR ASH -> A
U+00DF HURUF KECIL SHARP S -> s
U+00E6 ABU HURUF KECIL -> a
U+0132 LIGATUR IJ -> I
U+0133 LIGATUR ij -> i
U+0152 LIGATUR OE -> O
U+0153 LIGATUR oe -> o
U+01F1 HURUF BESAR DZ -> D
U+01F2 HURUF CAMPUR Dz -> D
U+01F3 HURUF KECIL DZ -> d
U+02A6 HURUF KECIL TS DIGRAF -> t
U+2026 ELLIPSIS MENDATAR -> .
TANDA EURO U+20AC -> E
U+22EF ELLIPSIS MENDATAR TENGAH -> .
U+2190 ANAK KE KIRI ->
U+2192 ANAK KE KANAN -> >
U+21D0 ANAK BERGANDA KE KIRI ->
U+21D2 ANAK BERGANDA KE KANAN -> >

-Z
Hasilkan output menggunakan format yang dibekalkan. Format yang ditentukan akan digunakan sebagai
format rentetan dalam panggilan ke Printf(3) dengan satu hujah yang terdiri daripada satu
integer panjang tidak bertanda. Sebagai contoh, untuk mendapatkan output yang sama seperti dengan bendera -U,
formatnya ialah: \u%04X.

Jika penukaran ruang dilumpuhkan (seperti yang berlaku secara lalai), jika ruang aksara di luar
Julat ASCII ditemui (ruang ideografi U+3000, ruang perkataan Ethiopic U+1351 dan
tanda ruang U+1680 ogham), ia digantikan dengan aksara ruang ASCII (0x20) supaya
pastikan output tulen 7-bit ASCII.

Ambil perhatian bahawa entiti aksara angka XML dan XHTML adalah seperti entiti HTML dengan dua
sekatan. Pertama, dalam X(HT)ML koma bertitik penamat tidak boleh ditinggalkan. Kedua, dalam
X(HT)ML "x" mestilah huruf kecil, manakala dalam HTML ia mungkin sama ada huruf besar atau huruf kecil.
Kami sentiasa menjana koma bertindih penamat dan menggunakan huruf kecil "x", jadi pilihan
digelar "HTML" menghasilkan XML dan XHTML yang sah juga.

EXIT STATUS


Nilai berikut dikembalikan semasa keluar:

0 KEJAYAAN
Input telah berjaya ditukar.

2 RALAT I/O
Ralat sistem berlaku semasa input atau output.

3 INFO Pengguna meminta maklumat seperti nombor versi atau sinopsis penggunaan dan
ini telah disediakan.

5 PILIHAN BURUK
Bendera pilihan yang salah telah diberikan pada baris arahan.

8 REKOD BURUK
UTF-8 yang tidak terbentuk telah dikesan dalam input.

Gunakan uni2ascii dalam talian menggunakan perkhidmatan onworks.net


Pelayan & Stesen Kerja Percuma

Muat turun apl Windows & Linux

Arahan Linux

Ad




×
Pengiklanan
❤ ️Beli, tempah atau beli di sini — tanpa kos, membantu memastikan perkhidmatan percuma.