Ito ang command na mbconv na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
mbconv - Tagapagpalit ng scheme ng pag-encode ng character
SINOPSIS
mbconv [mga opsyon] ...
DESCRIPTION
Ito ay isang application ng isang library upang mahawakan ang maramihang octets character encoding:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
pangunahing nakasulat para sa pag-debug ng library.
Nagbabasa ito ng octet sa pamamagitan ng octet mula sa mga file na ibinigay sa command line (o karaniwang input kung walang file
tinukoy), nagko-convert ng character encoding scheme (CES) gaya ng tinukoy ng mga opsyon sa command line
(inilarawan sa ibaba), at output sa karaniwang output (o isang file na tinukoy ni -t pagpipilian o -a
pagpipilian).
Options
-?, -h, - Tumulong
ipakita ang buod ng mga opsyon at paglabas.
-a file, --idagdag-sa=file
ang output ay idinagdag sa file.
-c mga converter, --convert-to=mga converter
tumutukoy sa conversion ng pag-encode ng character. mga converter dapat na pinaghihiwalay ng kuwit na listahan ng
mga salitang inilarawan sa "Mga tagatukoy ng conversion."
-f flag, --bandila=flag
tumutukoy sa mga flag upang baguhin ang gawi ng conversion. flag dapat ay comma separated list
ng mga salitang inilalarawan sa "Mga tagapagtukoy ng bandila".
-i, --input
nalalapat ang mga susunod na opsyon sa input stream.
-m pisi, --mime-charset=pisi
isinagawa ang mime encoding na tumutugma sa RFC2047. ay ginagamit bilang pangalan ng charset.
-n, --numero ng linya
Ang numero ng linya (>= 1) ay ipinasok sa simula ng bawat linya.
-o, --output
nalalapat ang mga susunod na opsyon sa output stream.
-t file, --sa=file
output sa file (pinutol).
-w, --lapad
lapad ng output ng bawat linya.
-cs , --charset=pisi
tumutukoy sa pangalan ng charset. Ang ilang mga pagtutukoy ng wika ay tinatanggap din pati na rin
Mga pangalan ng charset ng MIME, na ginagamit upang paghigpitan ang mga kandidato ng scheme ng pag-encode ng input
stream. Ang mga katanggap-tanggap na wika ay nakalista sa "Mga katanggap-tanggap na wika."
--format=pisi
tumutukoy sa format ng output
--alin
pangalan ng output charset ng bawat input stream sa stderr, sa form
file pangalan"" charset pangalan
kung dalawa o higit pang mga file ang tinukoy sa command line, o
charset pangalan
kung hindi man.
--regex=regular pagpapahayag
tumutukoy sa regular na expression upang i-filter ang output. Encoding ng character ng regular
pagpapahayag maaaring tukuyin sa pamamagitan ng paglalagay ng string ng form
"*"charset pangalan"*"
sa simula ng regular na expression, kung hindi man UTF-8. Encoding ng character ng
ang expression ay na-convert sa output stream bago tumugma.
Conversion mga detalye
Ang conversion ay inilapat bago ang bawat character ay output sa stream. Ang pag-setup ng conversion ay
awtomatikong gumanap batay sa CES. Kaya sa karamihan ng mga kaso, hindi mo kailangang tukuyin ang mga nagko-convert
tahasang
ASCII
domestic ASCII na na-convert sa US-ASCII,
ces na-convert nang naaangkop ayon sa CES na nakatali sa input/output stream,
to-ucs
na-convert sa Unicode,
f2h, buo hanggang kalahati
Ang mga fullwidth compatibility character ay kino-convert sa katumbas na kalahating lapad,
h2f, kalahating-puno
Ang mga character na compatibility ng kalahating lapad ay kino-convert sa mga katumbas na fullwidth,
jisx0213
Ang mga codepoint sa JIS C 6226 o sa JIS X 0208 na nakatali sa walang character ay
na-convert sa JIS X 0213 plane 1,
jisx0213-agresibo
Ang lahat ng codepoint sa JIS C 6226 o sa JIS X 0208 ay na-convert sa JIS X 0213 plane 1,
ms-latin1
Ang mga Unicode na character ng code point sa pagitan ng 0x80 at 0x9F (parehong kasama) ay kino-convert
sa iba pang mga Unicode na character na parang mga character sila ng mga code point na iyon sa Microsoft
Windows Codepage 1252.
ucs-to-jis0208-extra, jis0208-to-ucs-extra
Mga converter sa pagitan ng ilang JIS X 0208 at Unicode na character na may mga katulad na glyph (ni
ang kagandahang-loob ni Ambrose Li[protektado ng email]>).
Bandila mga detalye
use-0x28-for-94x94inG0, 28
gamitin ang "1/11 2/4 2/8 F" sa halip na "1/11 2/4 F" para magtalaga ng mga charset na may panghuling octet
4/0, 4/1, o 4/2 hanggang G0,
ac, ascii-at-control
escape sequence "1/11 2/8 4/2" ay output bago ang bawat control character,
nossl, huwag pansinin-7bit-single-shift
Ang escape sequence para sa 7 bit single shift ay binabalewala,
DNC, itapon-notprefered-char
itapon ang mga character na hindi ma-decode ng CES sa output stream.
Kasiya-siya wika
Ang mga sumusunod na salita ay maaaring ibigay sa halip na MIME charset name para sa input stream. Sa ganyan
kaso, ang encoding scheme ay awtomatikong nakita (sana) sa mga susunod.
c, cn, porselana, Tsino
x-gb-18030-2000, cn-big5, utf-8, o x-euc-tw.
j, ja, jp, magbarnis, Hapones
euc-jp, shift_jis, o utf-8.
k, ko, kr, Korea, Koreano
euc-kr, x-johab, utf-8, o x-unified-hangul.
cjk iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul, o utf-8.
Gamitin ang mbconv online gamit ang mga serbisyo ng onworks.net