АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

kcc - Интернет в облаке

Запустите kcc в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда kcc, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


kcc - Обложка иероглифов с автоматическим определением кодировки

СИНТАКСИС


КСС [ -IOchnvxz ] [ -b размер буфера ] [ файл ] ...

ОПИСАНИЕ


КСС это фильтр, который читает файл последовательно преобразует кодировки кандзи и выводит их в
стандартный вывод. Если файл не указан или указан - как имя файла, он читается из stdin. Вы можете
укажите кодировки кандзи для ввода / вывода. Тем не мение, КСС автоматически определять входную кодировку,
если вы не укажете кодировку ввода.

Доступные кодировки кандзи: JIS (7 бит и / или 8 бит), Shift JISEUCDEC. Для ввода
кодирования, вы можете смешивать, когда это пара из одного из EUC DEC или Shift JIS и 7-битного JIS.
SI/SOESC (я распознаю полуширину JIS.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-O
-IO I для ввода кодировки кандзи ¡O для вывода кодировки кандзи. Когда нет входной кодировки
указано, он будет обнаружен автоматически, и если оба входа / выхода не
указано, кодировка вывода - 7-битная JIS.

Для параметра входной кодировки можно указать одно из следующих значений: I.

e EUC (доступен с 7-битным JIS)
d DEC (доступно с 7-битным JIS)
s Shift JIS (доступно с 7-битным JIS)
j7 or k
7-битный JIS
8 8-битный JIS

Для параметра кодировки вывода можно указать одно из следующих значений: O.

e EUC
d Декабрь
s Сдвиг JIS
jXY or 7XY
7-битный JIS (с использованиемSI/SO для обозначения JIS kana)
kXY 7-битный JIS (с использованиемESC (I для обозначения JIS kana)
8XY 8-битный JIS

By XY in O вариант, вы можете указать, какая escape-последовательность используется в кодировке JIS. BJ
по умолчанию. Дополнительное обозначение кандзи закреплено на ESC $ (D

X Кандзи обозначается:
B ESC $ B(ДЖИС С0208-1983)
@ ESC $ @(ДЖИС С0208-1978)
+ ESC и @ ESC $ B(ДЖИС С0212-1990)
Y Буквенно-цифровое обозначение:
B ESC (B(ASCII)
J ESC (J(JIS Роман; JIS X0201)
H ESC (H(Шведский; категорически не рекомендуется)

-v выводит результат обнаружения входной кодировки в stderr.

-x Расширенный режим. Благодаря автоматическому определению входных кодировок распознает пользовательские
символы и расширенная область символов (вне диапазона EUC, неопределенная полуширина
kana, управляющий символ, область C1 и / или расширенная область символов Shift C1 JIS).
В этом режиме проводится различие между DEC и EUC.

-z Режим сжатия. Не распознает кана с половинной шириной (кроме 7-битного JIS) с входной кодировкой
обнаружение. С этой опцией точность автоматического определения входных кодировок становится
Намного лучше для напильника без кана половинной ширины.

-h Обычно при преобразовании каны половинной ширины в DEC она становится катаканой полной ширины.
С этой опцией он становится хирагана.

-n определяемые пользователем символы, расширенные символы и дополнительные символы кандзи
преобразуются в белое поле с полной шириной, а неопределенная область каны с половинной шириной
преобразуется в центрированную точку половинной ширины.

-b размер буфера
укажите размер буфера. По умолчанию - 8 Кбайт.

-c не преобразовывать, а проверять кодировку ввода и выводить результат в стандартный вывод. Другой с
нормальное автоопределение, проверяется все содержимое файла. Однако когда
обнаружена несогласованность кодировок, прервать чтение и распечатать «данные». Параметры
кроме -x¡¤-z игнорируются.

ПРИМЕРЫ


% КСС -e файл
Кодировка ввода определяется автоматически, а вывод - в кодировке EUC.

% КСС -сж file1 file2
Два файла в Shift JIS объединены с преобразованием в JIS.

% команду | КСС -k + J
выход команду Он переделанный в JIS (JIS JIS X0208 JIS JIS Роман ¡ESC (I Половина ширины
Кана JIS)

% КСС -c файл
Кодирование содержимого файл обнаружено (без преобразования)

BUG


Автоматическое определение входной кодировки хорошо выполнено для нормального случая, однако оно имеет
следующие проблемы.

В некоторых случаях 7-битный JIS распознается с помощью escape-последовательности. EUC и DEC одинаковы (см.
как серия EUC). Кана половинной ширины 8-битного JIS такая же, как и Кана половинной ширины Shift JIS
(упоминается как серия Shift JIS). Однако серии EUC и JIS, которые являются 8-битными
кодирование, широко используют одни и те же регионы. Итак, проблема в автоматическом обнаружении
обнаружение этих 2-х кодировок.

Обнаружение серии EUC / серии Shift JIS выполняется построчно, когда обнаруживается, что
это не серия Shift JIS, или это не серия EUC, кодировка определяется. Когда
обнаружена несогласованность, они будут рассматриваться как "данные", а содержимое вывода не будет
гарантировано.

При определении между серией EUC / серией Shift JIS после обнаружения 8-битного кода преобразования
ожидают обработки и помещают входные данные в буфер, однако буфер заполнен, предполагается, что это EUC
серии и заставляет приступить к конвертации. Обоснование. Обычно можно предположить, что документы
с кандзи включают JIS без кандзи или первый стандарт JIS, это может быть обнаружено в некоторых случаях, если
это Shift JIS, который не разделяет регион с EUC. Итак, если это не может быть определено,
скорее всего, это будет EUC.

8-битный JIS, и он всегда имеет четное количество последовательностей кана половинной ширины, тогда он будет
ошибочно определяется как кандзи EUC. Будьте внимательны.

Если входная кодировка не имеет каны половинной ширины, используйте -z и точность обнаружения становятся
намного лучше. Это связано с тем, что общая область ограничена областью секунды JIS.
стандарты.

Расширенная область Shift JIS, определяемая пользователем область EUC, управляющие символы C1 EUC,
неопределенная область каны половинной ширины EUC вне диапазона автоматического определения, поэтому он будет
не может определить кодировки, если на входе есть эти символы. Использовать -x возможность указать
расширенный режим или укажите код ввода.

Используйте kcc онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

  • 1
    NSIS: система установки со сценариями Nullsoft
    NSIS: система установки со сценариями Nullsoft
    NSIS (установка с поддержкой сценариев Nullsoft)
    System) является профессиональным открытым исходным кодом
    система для создания установщиков Windows. Это
    спроектирован таким образом, чтобы быть таким же маленьким и гибким
    как возможно ...
    Скачать NSIS: система установки Nullsoft со сценариями
  • 2
    авторизация
    авторизация
    AuthPass - это пароль с открытым исходным кодом
    менеджер с поддержкой популярных и
    проверенный Keepass (kdbx 3.x И kdbx 4.x ...
    Скачать авторизацию
  • 3
    Zabbix
    Zabbix
    Zabbix — это открытый корпоративный класс.
    исходное распределенное решение для мониторинга
    предназначен для наблюдения и отслеживания
    производительность и доступность сети
    серверы, устройства...
    Скачать Zabbix
  • 4
    KDiff3
    KDiff3
    Этот репозиторий больше не поддерживается
    и хранится в архивных целях. Видеть
    https://invent.kde.org/sdk/kdiff3 for
    новейший код и
    https://download.kde.o...
    Скачать KDiff3
  • 5
    USBLoaderGX
    USBLoaderGX
    USBLoaderGX — это графический интерфейс для
    USB-загрузчик Ванинкоко, основанный на
    libwiigui. Он позволяет перечислять и
    запуск игр Wii, игр Gamecube и
    доморощенный на Wii и WiiU...
    Скачать USBLoaderGX
  • 6
    Жар-птица
    Жар-птица
    СУБД Firebird предлагает функции ANSI SQL
    & работает на Linux, Windows и
    несколько Unix-платформ. Функции
    отличный параллелизм и производительность
    & сила...
    Скачать Firebird
  • Больше »

Команды Linux

Ad