mbconv - Интернет в облаке

Это команда mbconv, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


mbconv - конвертер схем кодировки символов

СИНТАКСИС


mbconv [параметры] ...

ОПИСАНИЕ


Это приложение библиотеки для обработки нескольких октетов кодировки символов:

http://pub.ks-and-ks.ne.jp/prog/libmoe/

в основном написан для отладки библиотеки.

Он читает октет за октетом из файлов, заданных в командной строке (или стандартном вводе, если файл не
указано), преобразует схему кодировки символов (CES) в соответствии с параметрами командной строки
(описано ниже) и вывод на стандартный вывод (или в файл, указанный -t Вариант или -a
опция).

Опции
-?, -h, --Помогите
отображать сводку опций и выходов.

-a файл, --добавить в=файл
вывод добавляется к файл.

-c Преобразователи, --преобразовать в=Преобразователи
определяет преобразование кодировки символов. Преобразователи должен быть список разделенных запятыми
слова, описанные в «Спецификаторах преобразования».

-f Флаги, --флаг=Флаги
указывает флаги для изменения поведения преобразования. Флаги должен быть список, разделенный запятыми
слов описать в «Спецификаторах флагов».

-i, --Вход
следующие параметры применяются к входному потоку.

-m string, --MIME-кодировка=string
выполняется кодирование mime в соответствии с RFC2047. используется как имя набора символов.

-n, --номер строки
номер строки (> = 1) вставляется в начало каждой строки.

-o, --выход
следующие параметры применяются к выходному потоку.

-t файл, --к=файл
вывод в файл (усеченный).

-w, --ширина
ширина вывода каждой строки.

-cs , --charset=string
указывает имя набора символов. Некоторые языковые спецификации также принимаются, а также
Имена кодировок MIME, которые используются для ограничения кандидатов схемы кодирования ввода
транслировать. Допустимые языки перечислены в разделе «Допустимые языки».

--формат=string
определяет выходной формат

--который
имя кодировки вывода каждого входного потока в stderr в форме

файл имя«» кодировок имя

если в командной строке указаны два или более файла, или

кодировок имя

в противном случае.

--regex=регулярный выражение
задает регулярное выражение для фильтрации вывода. Кодировка символов регулярный
выражение можно указать, поместив строку в форме

"*"кодировок имя"*"

в начале регулярного выражения, иначе UTF-8. Кодировка символов
перед сопоставлением выражение преобразуется в выражение выходного потока.

Конверсия спецификаторы
Преобразование применяется непосредственно перед выводом каждого символа в поток. Настройка преобразования
автоматически выполняется на основе CES. Поэтому в большинстве случаев указывать преобразователи не требуется.
явно.

ASCII
внутренний ASCII преобразован в US-ASCII,

CES преобразован соответствующим образом в соответствии с CES, привязанным к потоку ввода / вывода,

to-ucs
преобразован в Unicode,

f2h, полный до половины
Символы совместимости с полной шириной преобразуются в соответствующие символы с половинной шириной,

h2f, от половины до полного
Символы совместимости с половинной шириной преобразуются в соответствующие символы с полной шириной,

jisx0213
Кодовые точки в JIS C 6226 или JIS X 0208, которые не связаны ни с каким символом,
преобразован в самолет 0213 JIS X 1,

jisx0213-агрессивный
Все кодовые точки в JIS C 6226 или JIS X 0208 преобразуются в плоскость 0213 JIS X 1,

мс-латин1
Преобразовываются символы Unicode кодовой точки между 0x80 и 0x9F (оба включительно)
к другим символам Unicode, как если бы они были символами этой кодовой точки в Microsoft
Кодовая страница Windows 1252.

ucs-to-jis0208-дополнительно, jis0208-to-ucs-дополнительно
Преобразователи между некоторыми символами JIS X 0208 и Unicode, имеющими похожие глифы (по
любезно предоставлено Амвросием Лиacli@ada.dhs.org>).

Флаг спецификаторы
use-0x28-for-94x94inG0, 28
используйте «1/11 2/4 2/8 F» вместо «1/11 2/4 F» для обозначения кодировки с последним октетом
4/0, 4/1 или 4/2 до G0,

ac, ascii-at-control
escape-последовательность "1/11 2/8 4/2" выводится перед каждым управляющим символом,

носсл, игнорировать-7bit-single-shift
escape-последовательность для 7-битного одиночного сдвига игнорируется,

DNC, отказаться от предпочтительного символа
отбрасывать символы, которые CES, привязанные к выходному потоку, не могут декодировать.

Приемлемо языки
Следующие слова могут быть указаны вместо имени кодировки MIME для входного потока. В этом
В этом случае схема кодирования автоматически определяется (надеюсь) среди последующих.

c, cn, Китай, китайский
x-gb-18030-2000, cn-big5, utf-8 или x-euc-tw.

j, ja, jp, Япония, Японский
euc-jp, shift_jis или utf-8.

k, ko, kr, Корея, Корейский
euc-kr, x-johab, utf-8 или x-unified-hangul.

Дальневосточные iso-8859-1, xgb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul или utf-8.

Используйте mbconv онлайн с помощью сервисов onworks.net



Новейшие онлайн-программы для Linux и Windows