Ini ialah arahan mbconv yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
mbconv - Penukar skema pengekodan aksara
SINOPSIS
mbconv [pilihan] ...
DESCRIPTION
Ini adalah aplikasi perpustakaan untuk mengendalikan pengekodan aksara oktet berbilang:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
terutamanya ditulis untuk penyahpepijatan perpustakaan.
Ia membaca oktet demi oktet daripada fail yang diberikan pada baris arahan (atau input standard jika tiada fail
ditentukan), menukar skema pengekodan aksara (CES) seperti yang ditentukan oleh pilihan baris arahan
(diterangkan di bawah), dan output kepada output standard (atau fail yang ditentukan oleh -t pilihan atau -a
pilihan).
Pilihan
-?, -h, - membantu
paparan ringkasan pilihan dan keluar.
-a fail, --tambah-kepada=fail
output dilampirkan pada fail.
-c penukar, --Tukar kepada=penukar
menentukan penukaran pengekodan aksara. penukar mesti dipisahkan koma senarai
perkataan yang diterangkan dalam "Penentukan penukaran".
-f bendera, --bendera=bendera
menentukan bendera untuk menukar tingkah laku penukaran. bendera mesti senarai dipisahkan koma
perkataan yang diterangkan dalam "Penentukan bendera".
-i, --input
pilihan yang berjaya digunakan pada aliran input.
-m rentetan, --mime-charset=rentetan
pengekodan mime yang mematuhi RFC2047 dilakukan. digunakan sebagai nama charset.
-n, --nombor garisan
nombor baris (>= 1) disisipkan ke permulaan setiap baris.
-o, --pengeluaran
pilihan yang berjaya digunakan untuk aliran keluaran.
-t fail, --kepada=fail
output ke fail (dipotong).
-w, --lebar
lebar keluaran setiap baris.
-cs , --charset=rentetan
menentukan nama charset. Beberapa spesifikasi bahasa juga diterima serta
Nama charset MIME, yang digunakan untuk menyekat calon skim pengekodan input
aliran. Bahasa yang boleh diterima disenaraikan dalam "Bahasa yang boleh diterima".
--format=rentetan
menentukan format output
--yang
nama charset keluaran setiap aliran input kepada stderr, dalam bentuk
fail nama"" carta nama
jika dua atau lebih fail dinyatakan pada baris arahan, atau
carta nama
sebaliknya.
--regex=kerap ungkapan
menentukan ungkapan biasa untuk menapis output. Pengekodan aksara bagi kerap
ungkapan boleh ditentukan dengan meletakkan rentetan borang
"*"carta nama"*"
pada permulaan ungkapan biasa, jika tidak UTF-8. Pengekodan aksara bagi
ungkapan ditukar kepada aliran keluaran sebelum dipadankan.
Penukaran khusus
Penukaran digunakan sejurus sebelum setiap aksara dikeluarkan untuk distrim. Persediaan penukaran ialah
dilakukan secara automatik berdasarkan CES. Jadi dalam kebanyakan kes, anda tidak perlu menentukan penukar
secara eksplisit.
ASCII
ASCII domestik ditukar kepada AS-ASCII,
ini ditukar dengan sewajarnya mengikut CES terikat kepada aliran input/output,
kepada-ucs
ditukar kepada Unicode,
f2h, penuh hingga separuh
Aksara keserasian lebar penuh ditukar kepada aksara separuh lebar yang sepadan,
h2f, separuh hingga penuh
Aksara keserasian separuh lebar ditukar kepada aksara lebar penuh yang sepadan,
jisx0213
Titik kod dalam JIS C 6226 atau dalam JIS X 0208 yang terikat kepada tiada aksara adalah
ditukar kepada JIS X 0213 satah 1,
jisx0213-agresif
Semua titik kod dalam JIS C 6226 atau dalam JIS X 0208 ditukar kepada JIS X 0213 satah 1,
ms-latin1
Aksara Unikod titik kod antara 0x80 dan 0x9F (kedua-duanya termasuk) ditukar
kepada aksara Unicode lain seolah-olah ia adalah aksara titik kod tersebut dalam Microsoft
Windows Codepage 1252.
ucs-to-jis0208-extra, jis0208-ke-ucs-extra
Penukar antara beberapa aksara JIS X 0208 dan Unicode yang mempunyai glyph serupa (oleh
ihsan Ambrose Li[e-mel dilindungi]>).
Bendera khusus
use-0x28-for-94x94inG0, 28
gunakan "1/11 2/4 2/8 F" dan bukannya "1/11 2/4 F" untuk menetapkan charset dengan oktet akhir
4/0, 4/1 atau 4/2 kepada G0,
ac, ascii-at-control
urutan melarikan diri "1/11 2/8 4/2" adalah output sebelum setiap aksara kawalan,
nossl, abaikan-7bit-single-shift
urutan melarikan diri untuk 7 bit anjakan tunggal diabaikan,
dnc, buang-notprefered-char
buang aksara yang CES terikat kepada aliran keluaran tidak boleh menyahkod.
Diterima bahasa
Perkataan berikut boleh diberikan sebagai ganti nama charset MIME untuk aliran input. Dalam itu
kes, skim pengekodan dikesan secara automatik (mudah-mudahan) antara yang berjaya.
c, cn, china, cina
x-gb-18030-2000, cn-big5, utf-8 atau x-euc-tw.
j, ja, jp, jepun, jepun
euc-jp, shift_jis, atau utf-8.
k, ko, kr, korea, korean
euc-kr, x-johab, utf-8, atau x-unified-hangul.
cjk iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul, atau utf-8.
Gunakan mbconv dalam talian menggunakan perkhidmatan onworks.net