Este é o comando mbconv que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
mbconv - conversor de esquema de codificação de caracteres
SINOPSE
mbconv [opções] ...
DESCRIÇÃO
Este é um aplicativo de uma biblioteca para lidar com vários octetos de codificação de caracteres:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
escrito principalmente para depuração da biblioteca.
Ele lê octeto por octeto de arquivos fornecidos na linha de comando (ou entrada padrão se nenhum arquivo for
especificado), converte o esquema de codificação de caracteres (CES) conforme especificado pelas opções de linha de comando
(descrito abaixo), e a saída para a saída padrão (ou um arquivo especificado por -t opção ou -a
opção).
Opções
-?, -h, --Socorro
exibe um resumo das opções e saídas.
-a lima, --acrescentar a=lima
saída é anexada a lima.
-c conversores, --converter para=conversores
especifica a conversão de codificação de caracteres. conversores deve ser uma lista separada por vírgulas de
palavras descritas em "Especificadores de conversão".
-f bandeiras, --bandeira=bandeiras
especifica sinalizadores para alterar o comportamento de conversão. bandeiras deve ser lista separada por vírgulas
de palavras descritas em "Especificadores de sinalizadores".
-i, --entrada
as opções seguintes se aplicam ao fluxo de entrada.
-m corda, --mime-charset=corda
a codificação mime em conformidade com RFC2047 é executada. é usado como nome de conjunto de caracteres.
-n, --número da linha
o número da linha (> = 1) é inserido no início de cada linha.
-o, --resultado
as opções seguintes aplicam-se ao fluxo de saída.
-t lima, --para=lima
saída para arquivo (truncado).
-w, --largura
largura de saída de cada linha.
-cs , --charset=corda
especifica o nome do conjunto de caracteres. Algumas especificações de idioma também são aceitas, bem como
Nomes de conjuntos de caracteres MIME, que são usados para restringir candidatos de esquema de codificação de entrada
Stream. Os idiomas aceitáveis são listados em "Idiomas aceitáveis".
--formato=corda
especifica o formato de saída
--que
nome do conjunto de caracteres de saída de cada fluxo de entrada para stderr, na forma
lima nome"" conjunto de caracteres nome
se dois ou mais arquivos forem especificados na linha de comando, ou
conjunto de caracteres nome
de outra forma.
--regex=regular expressão
especifica a expressão regular para filtrar a saída. Codificação de caracteres de regular
expressão pode ser especificado colocando string do formulário
"*"conjunto de caracteres nome"*"
no início da expressão regular, caso contrário UTF-8. Codificação de caracteres de
a expressão é convertida para o fluxo de saída antes da correspondência.
Conversão especificadores
A conversão é aplicada um pouco antes de cada caractere ser enviado ao stream. A configuração de conversão é
executado automaticamente com base no CES. Então, na maioria dos casos, você não precisa especificar conversores
explicitamente.
ascii
ASCII doméstico convertido para US-ASCII,
ces convertido apropriadamente de acordo com o CES vinculado ao fluxo de entrada / saída,
para-ucs
convertido para Unicode,
f2h, meio a meio
Os caracteres de compatibilidade de largura total são convertidos em caracteres de meia largura correspondentes,
H2F, meio a cheio
Os caracteres de compatibilidade de meia largura são convertidos em caracteres de largura total correspondentes,
jisx0213
Os pontos de código em JIS C 6226 ou em JIS X 0208 que não estão vinculados a nenhum caractere são
convertido em JIS X 0213 plano 1,
jisx0213-agressivo
Todos os pontos de código em JIS C 6226 ou em JIS X 0208 são convertidos em JIS X 0213 plano 1,
ms-latin1
Os caracteres Unicode do ponto de código entre 0x80 e 0x9F (ambos inclusivos) são convertidos
a outros caracteres Unicode como se fossem caracteres desses pontos de código no Microsoft
Página de códigos 1252 do Windows.
ucs-to-jis0208-extra, jis0208-to-ucs-extra
Conversores entre alguns caracteres JIS X 0208 e Unicode com glifos semelhantes (por
a cortesia de Ambrose Li[email protegido]>).
Bandeira especificadores
use-0x28-for-94x94inG0, 28
use "1/11 2/4 2/8 F" em vez de "1/11 2/4 F" para designar conjuntos de caracteres com o octeto final
4/0, 4/1 ou 4/2 a G0,
ac, controle ascii
a sequência de escape "1/11 2/8 4/2" é emitida antes de cada caractere de controle,
nossl, ignorar-7bit-single-shift
a sequência de escape para deslocamento único de 7 bits é ignorada,
dnc, descartar-não-preferido-char
descartar caracteres que o CES vinculado ao fluxo de saída não pode decodificar.
Aceitável línguas
As seguintes palavras podem ser fornecidas em vez do nome do conjunto de caracteres MIME para o fluxo de entrada. Naquilo
caso, o esquema de codificação é detectado automaticamente (esperançosamente) entre os sucessivos.
c, cn, China, chinês
x-gb-18030-2000, cn-big5, utf-8 ou x-euc-tw.
j, ja, jp, Japão, japonês
euc-jp, shift_jis ou utf-8.
k, ko, kr, Coréia, coreano
euc-kr, x-johab, utf-8 ou x-unified-hangul.
cjk iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul ou utf-8.
Use mbconv online usando serviços onworks.net