Dit is de opdracht mbconv die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator
PROGRAMMA:
NAAM
mbconv - Omzetter voor tekencoderingsschema's
KORTE INHOUD
mbconv [opties] ...
PRODUCTBESCHRIJVING
Dit is een toepassing van een bibliotheek om tekencodering met meerdere octetten te verwerken:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
voornamelijk geschreven voor het debuggen van de bibliotheek.
Het leest octet voor octet uit bestanden die op de opdrachtregel worden gegeven (of standaardinvoer als er geen bestand is
opgegeven), converteert tekencoderingsschema (CES) zoals gespecificeerd door opdrachtregelopties
(hieronder beschreven) en uitgevoerd naar standaarduitvoer (of een bestand gespecificeerd door -t optie of -a
keuze).
Opties
-?, -h, --help
overzicht van opties en uitgangen weergeven.
-a filet, --toevoegen aan=filet
uitvoer wordt toegevoegd filet.
-c converters, --omzetten naar=converters
specificeert de conversie van tekencodering. converters moet een door komma's gescheiden lijst zijn van
woorden beschreven in "Conversiespecificaties".
-f vlaggen, --vlag=vlaggen
specificeert vlaggen om het conversiegedrag te veranderen. vlaggen moet een door komma's gescheiden lijst zijn
woorden beschrijven in "Vlagspecificaties".
-i, --invoer
volgende opties zijn van toepassing op de invoerstroom.
-m snaar, --mime-tekenset=snaar
mime-codering conform RFC2047 wordt uitgevoerd. wordt gebruikt als tekensetnaam.
-n, --regel-nummer
regelnummer (>= 1) wordt ingevoegd aan het begin van elke regel.
-o, --uitvoer
volgende opties zijn van toepassing op de uitvoerstroom.
-t filet, --tot=filet
uitvoer naar bestand (afgekapt).
-w, --breedte
uitvoerbreedte van elke regel.
-cs , --tekenset=snaar
specificeert de naam van de tekenset. Sommige taalspecificaties worden ook geaccepteerd
MIME-tekensetnamen, die worden gebruikt om kandidaten van het coderingsschema van invoer te beperken
stroom. Aanvaardbare talen staan vermeld in "Aanvaardbare talen".
--formaat=snaar
specificeert het uitvoerformaat
--die
uitvoertekensetnaam van elke invoerstroom naar stderr, in de vorm
filet naam"" karakterset naam
als er twee of meer bestanden zijn opgegeven op de opdrachtregel, of
karakterset naam
anders.
--regex=regelmatig uitdrukking
specificeert reguliere expressie om uitvoer te filteren. Tekencodering van regelmatig
uitdrukking kan worden gespecificeerd door de tekenreeks van het formulier in te voeren
karakterset naam
aan het begin van de reguliere expressie, anders UTF-8. Tekencodering van
de uitdrukking wordt geconverteerd naar die van de uitvoerstroom voordat deze overeenkomt.
Camper ombouw bestekschrijvers
Conversie wordt toegepast net voordat elk personage wordt uitgevoerd om te streamen. Conversie-instelling is
automatisch uitgevoerd op basis van CES. In de meeste gevallen hoeft u dus geen converters op te geven
uitdrukkelijk.
ascii
binnenlandse ASCII geconverteerd naar US-ASCII,
ces correct geconverteerd volgens de CES gebonden aan invoer- / uitvoerstroom,
naar-ucs
geconverteerd naar Unicode,
f2h, vol tot half
Compatibiliteitstekens op volledige breedte worden geconverteerd naar overeenkomstige tekens op halve breedte,
h2f, half tot vol
Compatibiliteitstekens met halve breedte worden geconverteerd naar overeenkomstige tekens met volledige breedte,
jisx0213
Codepunten in JIS C 6226 of in JIS X 0208 die aan geen enkel teken gebonden zijn, zijn
omgezet in JIS X 0213 vliegtuig 1,
jisx0213-agressief
Alle codepunten in JIS C 6226 of in JIS X 0208 worden omgezet in JIS X 0213 vlak 1,
ms-latijn1
Unicode-tekens van codepunt tussen 0x80 en 0x9F (beide inclusief) worden geconverteerd
naar andere Unicode-tekens alsof het tekens zijn van dat codepunt in Microsoft
Windows-codetabel 1252.
ucs-naar-jis0208-extra, jis0208-naar-ucs-extra
Converters tussen sommige JIS X 0208- en Unicode-tekens met vergelijkbare glyphs (door
met dank aan Ambrose Li[e-mail beveiligd]>).
Vlag bestekschrijvers
use-0x28-for-94x94inG0, 28
gebruik "1/11 2/4 2/8 F" in plaats van "1/11 2/4 F" om tekensets aan te duiden met het laatste octet
4/0, 4/1 of 4/2 tot G0,
ac, ascii-bij-controle
escape-reeks "1/11 2/8 4/2" wordt uitgevoerd voor elk besturingsteken,
nosl, negeer-7bit-single-shift
ontsnappingsreeks voor 7-bits enkele shift wordt genegeerd,
dnc, weggooien-nietvoorkeur-char
gooi tekens weg die CES gebonden aan uitvoerstroom niet kan decoderen.
Aanvaardbaar talen
De volgende woorden kunnen worden gegeven in plaats van de naam van de MIME-tekenset voor de invoerstroom. In dat
In dat geval wordt het coderingsschema (hopelijk) automatisch gedetecteerd bij de volgende.
c, cn, China, Chinese
x-gb-18030-2000, cn-big5, utf-8 of x-euc-tw.
j, ja, jp, Japan, Japans
euc-jp, shift_jis of utf-8.
k, ko, kr, Korea, Koreaans
euc-kr, x-johab, utf-8 of x-unified-hangul.
CJK iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul of utf-8.
Gebruik mbconv online met behulp van onworks.net-services