Це команда mbconv, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS.
ПРОГРАМА:
ІМ'Я
mbconv - конвертер схеми кодування символів
СИНТАКСИС
mbconv [параметри] ...
ОПИС
Це програма бібліотеки для роботи з кількома октетами кодування символів:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
в основному написаний для налагодження бібліотеки.
Він читає октет за октетом із файлів, наданих у командному рядку (або стандартний вхід, якщо файлу немає
зазначено), перетворює схему кодування символів (CES), як зазначено параметрами командного рядка
(описано нижче) і вивести на стандартний вихід (або файл, зазначений у -t варіант або -a
варіант).
Опції
-?, -h, --допомога
відобразити підсумок варіантів і виходів.
-a файл, --приєднати до=файл
висновок додається до файл.
-c перетворювачів, --convert-to=перетворювачів
визначає перетворення кодування символів. перетворювачів має бути розділений комами список
слова, описані в розділі "Специфікатори перетворення".
-f прапори, -- прапор=прапори
визначає прапорці для зміни поведінки перетворення. прапори список має бути розділений комами
слів, описаних у "Специфікаторах прапорів".
-i, --вхід
наступні параметри застосовуються до вхідного потоку.
-m рядок, --mime-charset=рядок
виконується MIME-кодування, що відповідає RFC2047. використовується як ім'я набору символів.
-n, --номер рядка
номер рядка (>= 1) вставляється на початок кожного рядка.
-o, - вихід
наступні параметри застосовуються до вихідного потоку.
-t файл, --до=файл
виведення у файл (урізане).
-w, --ширина
вихідна ширина кожного рядка.
-cs , --набір символів=рядок
вказує назву набору символів. Деякі мовні специфікації також приймаються
Імена кодувань MIME, які використовуються для обмеження кандидатів схеми кодування введення
потік. Допустимі мови перелічено в розділі "Дозволені мови".
--формат=рядок
визначає формат виведення
--який
вивести назву кодування кожного вхідного потоку в stderr у формі
файл ім'я«» набір ім'я
якщо в командному рядку вказано два або більше файлів, або
набір ім'я
інакше.
--регулярний вираз=регулярний вираз
визначає регулярний вираз для фільтрації виводу. Кодування символів регулярний
вираз можна вказати, додавши рядок форми
"*"набір ім'я"*"
на початку регулярного виразу, інакше UTF-8. Кодування символів
вираз перетворюється на вихідний потік перед встановленням відповідності.
Перетворення специфікатори
Перетворення застосовується безпосередньо перед виведенням кожного символу в потік. Налаштування перетворення є
автоматично виконується на основі CES. Тому в більшості випадків вам не потрібно вказувати конвертори
явно.
ASCII
внутрішній ASCII, перетворений на US-ASCII,
CES належним чином перетворено відповідно до CES, прив'язаного до потоку введення/виведення,
to-ucs
конвертовано в Unicode,
f2h, повністю до половини
Символи сумісності повної ширини конвертуються у відповідні символи половинної ширини,
h2f, наполовину до повного
Символи сумісності з половинною шириною перетворюються у відповідні символи повної ширини,
jisx0213
Кодові точки в JIS C 6226 або в JIS X 0208, які не прив'язані до жодного символу,
перетворений на площину 0213 JIS X 1,
jisx0213-агресивний
Усі кодові точки в JIS C 6226 або в JIS X 0208 перетворюються в площину 0213 JIS X 1,
ms-latin1
Символи Unicode кодової точки від 0x80 до 0x9F (обидва включно) перетворюються
до інших символів Unicode, як ніби вони є символами цієї кодової точки в Microsoft
Кодова сторінка Windows 1252.
ucs-to-jis0208-extra, jis0208-to-ucs-extra
Перетворювачі між деякими символами JIS X 0208 та Unicode, що мають схожі гліфи (за
з люб’язності Амброуза Лі[захищено електронною поштою]>).
Прапор специфікатори
use-0x28-for-94x94inG0, 28
використовуйте "1/11 2/4 2/8 F" замість "1/11 2/4 F", щоб позначити кодировку з останнім октетом
4/0, 4/1 або 4/2 до G0,
ac, ascii-at-control
escape-послідовність "1/11 2/8 4/2" виводиться перед кожним керуючим символом,
nossl, ignore-7bit-single-shift
escape-послідовність для 7-бітового одиничного зсуву ігнорується,
dnc, discard-notprefered-char
відкидати символи, які CES, прив'язаний до вихідного потоку, не може декодувати.
Прийнятний мови
Замість назви кодування MIME для вхідного потоку можуть бути вказані наступні слова. У цьому
У випадку, схема кодування автоматично визначається (сподіваємося) серед наступних.
c, cn, Китай, китайський
x-gb-18030-2000, cn-big5, utf-8 або x-euc-tw.
j, ja, jp, Японія, японський
euc-jp, shift_jis або utf-8.
k, ko, kr, Корея, корейський
euc-kr, x-johab, utf-8 або x-unified-hangul.
cjk iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul або utf-8.
Використовуйте mbconv онлайн за допомогою служб onworks.net