Это команда mbconv, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
mbconv - конвертер схем кодировки символов
СИНТАКСИС
mbconv [параметры] ...
ОПИСАНИЕ
Это приложение библиотеки для обработки нескольких октетов кодировки символов:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
в основном написан для отладки библиотеки.
Он читает октет за октетом из файлов, заданных в командной строке (или стандартном вводе, если файл не
указано), преобразует схему кодировки символов (CES) в соответствии с параметрами командной строки
(описано ниже) и вывод на стандартный вывод (или в файл, указанный -t Вариант или -a
опция).
Опции
-?, -h, --Помогите
отображать сводку опций и выходов.
-a файл, --добавить в=файл
вывод добавляется к файл.
-c Преобразователи, --преобразовать в=Преобразователи
определяет преобразование кодировки символов. Преобразователи должен быть список разделенных запятыми
слова, описанные в «Спецификаторах преобразования».
-f Флаги, --флаг=Флаги
указывает флаги для изменения поведения преобразования. Флаги должен быть список, разделенный запятыми
слов описать в «Спецификаторах флагов».
-i, --Вход
следующие параметры применяются к входному потоку.
-m string, --MIME-кодировка=string
выполняется кодирование mime в соответствии с RFC2047. используется как имя набора символов.
-n, --номер строки
номер строки (> = 1) вставляется в начало каждой строки.
-o, --выход
следующие параметры применяются к выходному потоку.
-t файл, --к=файл
вывод в файл (усеченный).
-w, --ширина
ширина вывода каждой строки.
-cs , --charset=string
указывает имя набора символов. Некоторые языковые спецификации также принимаются, а также
Имена кодировок MIME, которые используются для ограничения кандидатов схемы кодирования ввода
транслировать. Допустимые языки перечислены в разделе «Допустимые языки».
--формат=string
определяет выходной формат
--который
имя кодировки вывода каждого входного потока в stderr в форме
файл имя«» кодировок имя
если в командной строке указаны два или более файла, или
кодировок имя
в противном случае.
--regex=регулярный выражение
задает регулярное выражение для фильтрации вывода. Кодировка символов регулярный
выражение можно указать, поместив строку в форме
"*"кодировок имя"*"
в начале регулярного выражения, иначе UTF-8. Кодировка символов
перед сопоставлением выражение преобразуется в выражение выходного потока.
Конверсия спецификаторы
Преобразование применяется непосредственно перед выводом каждого символа в поток. Настройка преобразования
автоматически выполняется на основе CES. Поэтому в большинстве случаев указывать преобразователи не требуется.
явно.
ASCII
внутренний ASCII преобразован в US-ASCII,
CES преобразован соответствующим образом в соответствии с CES, привязанным к потоку ввода / вывода,
to-ucs
преобразован в Unicode,
f2h, полный до половины
Символы совместимости с полной шириной преобразуются в соответствующие символы с половинной шириной,
h2f, от половины до полного
Символы совместимости с половинной шириной преобразуются в соответствующие символы с полной шириной,
jisx0213
Кодовые точки в JIS C 6226 или JIS X 0208, которые не связаны ни с каким символом,
преобразован в самолет 0213 JIS X 1,
jisx0213-агрессивный
Все кодовые точки в JIS C 6226 или JIS X 0208 преобразуются в плоскость 0213 JIS X 1,
мс-латин1
Преобразовываются символы Unicode кодовой точки между 0x80 и 0x9F (оба включительно)
к другим символам Unicode, как если бы они были символами этой кодовой точки в Microsoft
Кодовая страница Windows 1252.
ucs-to-jis0208-дополнительно, jis0208-to-ucs-дополнительно
Преобразователи между некоторыми символами JIS X 0208 и Unicode, имеющими похожие глифы (по
любезно предоставлено Амвросием Ли[электронная почта защищена]>).
Флаг спецификаторы
use-0x28-for-94x94inG0, 28
используйте «1/11 2/4 2/8 F» вместо «1/11 2/4 F» для обозначения кодировки с последним октетом
4/0, 4/1 или 4/2 до G0,
ac, ascii-at-control
escape-последовательность "1/11 2/8 4/2" выводится перед каждым управляющим символом,
носсл, игнорировать-7bit-single-shift
escape-последовательность для 7-битного одиночного сдвига игнорируется,
DNC, отказаться от предпочтительного символа
отбрасывать символы, которые CES, привязанные к выходному потоку, не могут декодировать.
Приемлемо языки
Следующие слова могут быть указаны вместо имени кодировки MIME для входного потока. В этом
В этом случае схема кодирования автоматически определяется (надеюсь) среди последующих.
c, cn, Китай, китайский
x-gb-18030-2000, cn-big5, utf-8 или x-euc-tw.
j, ja, jp, Япония, Японский
euc-jp, shift_jis или utf-8.
k, ko, kr, Корея, Корейский
euc-kr, x-johab, utf-8 или x-unified-hangul.
Дальневосточные iso-8859-1, xgb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul или utf-8.
Используйте mbconv онлайн с помощью сервисов onworks.net