GoGPT Best VPN GoSearch

OnWorks-favicon

unidesc - Online in de cloud

Voer unidesc uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht undesc die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online-emulator of MAC OS online-emulator

PROGRAMMA:

NAAM


unidesc - Beschrijf de inhoud van een Unicode-tekstbestand

KORTE INHOUD


unidesc ([keuze vlaggen]) ( naam>)

Als er geen invoerbestandsnaam is opgegeven, unidesc leest van de standaard invoer.

PRODUCTBESCHRIJVING


unidesc beschrijft de inhoud van een Unicode-tekstbestand door de tekenreeksen te rapporteren aan
tot welke verschillende delen van de tekst behoren. De gerapporteerde reeksen omvatten zowel officieel
Unicode-bereiken en de geconstrueerde taalbereiken binnen de geregistreerde Private Use Areas
met het dienstplichtige Unicode-register (http://www.evertype.com/standards/csur/). voor elk
scala aan karakters, unidesc drukt de karakter- of byte-offset af van het begin van de
bereik, de teken- of byte-offset van het einde van het bereik en de naam van het bereik.
Offsets beginnen vanaf 0.

Aangezien de ASCII-cijfers, interpunctie en witruimtetekens vaak worden gebruikt door
andere schrijfsystemen, worden deze karakters standaard als neutraal behandeld, dat wil zeggen als niet
uitsluitend behorend tot een bepaald tekenbereik. Deze tekens worden behandeld als
die behoren tot het bereik van de tekens die eraan voorafgaan.

Als de invoer begint met neutrale tekens, worden deze beschouwd als behorend tot het bereik van
welke karakters ze ook volgen. Als het bestand volledig uit neutrale tekens bestaat, wordt de
bereik wordt geïdentificeerd als Neutraal gevolgd door Basic Latijns tussen vierkante haken.

Een magisch getal dat de Unicode-codering identificeert, maakt dus geen deel uit van de Unicode-standaard
pure Unicode-bestanden bevatten geen magisch getal. Er zijn echter informele conventies
hiervoor ontstaan. Als de opdrachtregel flag -m is gegeven, unidesc zal proberen om
identificeer het Unicode-subtype door de eerste paar bytes van de invoer te onderzoeken. Als de invoer
wordt geïdentificeerd als een van de twee acceptabele typen, UTF-8 of native order UTF-32, zal dit het geval zijn
ga dan verder met het beschrijven van de inhoud van de invoer. Anders zal het rapporteren wat het heeft
geleerd en vertrek. Merk op dat als het bestand een magisch getal bevat, u de -m
vlag. Zonder deze vlag unidesc gaat ervan uit dat de invoer bestaat uit pure Unicode met de
tekengegevens beginnen onmiddellijk. Het zal daarom worden afgeworpen door de magie
nummer.

Standaard wordt verwacht dat invoer UTF-8 is. Native order UTF-32 is ook acceptabel. UTF-32
kan worden gespecificeerd via de opdrachtregelvlag -u of, als de opdrachtregelvlag -m is gegeven,
via het magische getal.

COMMAND LINE VLAGGEN


-b Geef bestandsoffsets in bytes in plaats van tekens.

-d Behandel de ASCII-cijfers als exclusief behorend tot het Basic Latin-bereik.

-h Gebruiksinformatie afdrukken.

-L Maak een alfabetische lijst van de Unicode-reeksen.

-L Maak een lijst van de Unicode-bereiken per codepunt.

-m Controleer het magische getal van het bestand om het Unicode-subtype te bepalen.

-p Behandel ASCII-interpunctie als exclusief behorend tot het Basic Latin-bereik.

-r In plaats van bereiken weer te geven zoals ze worden aangetroffen, geeft u gewoon de gedetecteerde bereiken weer
nadat alle invoer is gelezen.

-u Invoer is native order UTF-32.

-v Printversie-informatie.

-w Behandel ASCII-witruimte als exclusief behorend tot het Basic Latin-bereik.

Gebruik unidesc online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

Linux-commando's

Ad




×
advertentie
❤️Koop, boek of koop hier — het is gratis, en zo blijven onze diensten gratis.