Il s'agit de la commande konwert qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
konwert - interface pour diverses conversions de codage de caractères
SYNOPSIS
savoir FILTRE [DOSSIER]... [-o DEST | -O]
DESCRIPTION
Konwert permet de filtrer plusieurs fichiers à travers plusieurs filtres. Il filtre les
spécifié DOSSIERs, ou stdin si aucun n'est donné.
Simple FILTRE est le nom d'un fichier exécutable du répertoire ~/.konwert/filtres or
celui à l'échelle du système, normalement /usr/share/konwert/filters. Un tel programme lui-même filtre
stdin à stdout.
La règle de filtrage peut être plus complexe :
savoir FILTRE1+FILTRE2 veux dire savoir FILTRE1 | savoir FILTRE2.
savoir FORMAT1-FORMAT2, à moins qu'un tel filtre n'existe, essaie de trouver un FORMAT3, tel
que les deux filtres FORMAT1-FORMAT3 et FORMAT3-FORMAT1 existe.
savoir FILTRE/ARG/... passe des arguments au filtre. Les arguments peuvent également être spécifiés
ici: FORMAT1/ARGS-FORMAT2. La signification des arguments dépend du filtre particulier.
savoir '(COMMAND ARGS...)' exécute cette commande shell arbitraire. Ceci est utile avec -o
or -O option. La commande ne peut pas contenir la chaîne )+, ce qui mettra fin à cette
spécification du filtre.
OPTIONS
-o DEST la sortie va dans ce fichier/répertoire au lieu de stdout
-O chaque fichier d'entrée est remplacé par sa traduction
--Aidez-moi afficher l'aide et quitter
--version informations de version et quitte
Rediriger la sortie vers l'un des fichiers source avec soit -o or > au lieu de -O vont
corrompre ! Option -O crée un fichier temporaire dans / Tmp et le copie plus tard sur le
la source.
PERSONNAGE CODAGE TRANSFORMATION
Vous pouvez convertir du texte entre deux jeux de caractères, par exemple savoir cp437-iso2.
Les caractères non disponibles dans le jeu de caractères cible seront remplacés par des approximations avec
les disponibles. Les approximations n'ont pas besoin d'être des caractères uniques.
Les jeux de caractères suivants sont actuellement pris en charge :
ascii ASCII 7 bits
utf8 = unicode Unicode UTF-8
iso1 = isoler1
ISO-8859-1 alias ISO Latin 1 (Europe occidentale)
iso2 = isoler2
ISO-8859-2 alias ISO Latin 2 (Europe centrale)
iso3 = isoler3
ISO-8859-3 alias ISO Latin 3 (espéranto)
iso4 = isoler4
ISO-8859-4 alias ISO Latin 4 (Baltique)
iso5 = isoler
ISO-8859-5 (cyrillique)
iso6 = isolatinarabe
ISO-8859-6 (arabe)
iso7 = isolergreek
ISO-8859-7 (grec)
iso8 = isoler l'hébreu
ISO-8859-8 (hébreu)
iso9 = isoler5 = isoler
ISO-8859-9 alias ISO Latin 5 (turc)
iso10 = isoler6 = isolatinnordique
ISO-8859-10 alias ISO Latin 6 (nordique)
iso12 = isoler7 = isoler celtique
ISO-8859-12 alias ISO Latin 6 (celtique) - Ébauche
iso13 = isoler8 = isoler la baltique
ISO-8859-13 alias ISO Latin 6 (Baltique) - Projet
iso14 = isoler9 = Isolatinsami
ISO-8859-14 alias ISO Latin 6 (Sami) - Ébauche
iso15 ISO-8859-15 - Ébauche
koi8r KOI8-R (russe)
koi8u KOI8-U (ukrainien, biélorusse)
koi8uni KOI8-Uni (cyrillique)
cp1250 = grimacer = gagnerlatin2 Windows CP-1250 alias Win Latin 2 (Europe centrale)
cp1251 = wincyr Windows CP-1251 (cyrillique)
cp1252 = gagner à l'ouest = gagnerlatin1 Windows CP-1252 alias Win Latin 1 (Europe de l'Ouest)
cp1253 = ailier Windows CP-1253 (grec)
cp1254 = hiver Windows CP-1254 (turc)
cp1255 = winhébreu Windows CP-1255 (hébreu)
cp1256 = winarabe Windows CP-1256 (arabe)
cp1257 = winbaltique Windows CP-1257 (Baltique)
cp1258 = winviet Windows CP-1258 (vietnamien)
cp437 = icmen DOS CP-437 (anglais)
cp737 = dosgrec DOS CP-737 (grec)
cp775 = dosbaltique DOS CP-775 (Baltique)
cp850 = dos ouest = doslatine1 DOS CP-850 alias DOS Latin 1 (Europe de l'Ouest)
cp852 = doser = doslatine2 DOS CP-852 alias DOS Latin 2 (Europe centrale)
cp855 = doscyr DOS CP-855 (cyrillique)
cp857 = dostur DOS CP-857 (turc)
cp860 = sportif DOS CP-860 (Portugal)
cp861 = pays de dos DOS CP-861 (islandais)
cp862 = doshebrew DOS CP-862 (hébreu)
cp863 = doscanadfr DOS CP-863 (français canadien)
cp864 = dosarabe DOS CP-864 (arabe)
cp865 = dosnordique DOS CP-865 (nordique)
cp866 = dosrusse DOS CP-866 (russe)
cp869 = dosgrec2 DOS CP-869 (grec2)
cp874 = dosthaï DOS CP-874 (thaï)
mac Macintosh Roman (Europe de l'Ouest)
macce Macintosh Europe centrale
maccyr Macintosh cyrillique
macgreek Macintosh grec
pays de macice Macintosh Islandais
mactur Macintosh Turc
csk,
cyfromate,
dhn,
fidomozovie,
c'est à dire,
logique,
Mazovie,
microvex Jeux de caractères DOS pour le polonais
amigapl,
le gras,
jx Jeu de caractères Amiga pour le polonais
Kamenicky Jeu de caractères DOS pour le tchèque et le slovaque
ailier WinGreek (codage basé sur les polices Windows pour le grec ancien)
babelpl TeX [polonais]{babel} : "a"c"e"l"n"o"s"z"r
cichy TeX \préfixe : /a/c/e/l/n/o/s/x/z
xmetodo Espéranto: cx gx hx jx sx ux (vx w)
hmetodo Espéranto: ch gh hh jh sh u
anauxcxap Espéranto: ^c ^g ^h ^j ^s ^u (~u)
post-cxap Espéranto: c^ g^ h^ j^ s^ u^ (u~)
apostrophie Espéranto: c' g' h' j' s' u'
malapostrophie Espéranto: c` g` h` j` s` u`
viscères VISCII (vietnamien)
viqri Vietnamien Cité Lisible Implicite
htmldéc Références de caractères SGML/HTML (décimal) : Æ ?? →
htmlhex Références de caractères SGML/HTML (hexadécimal) : ?? ?? →
htmlent Entités de caractères SGML/HTML (noms) : Æ &ecaron →
html Les trois ci-dessus (uniquement comme format d'entrée)
Texas TeX avec quelques extensions LaTeX ou AMS-TeX. Il n'y a pas de distinction entre la normale
et le mode mathématique - vous devrez probablement insérer $est manuellement.
mnémonique RFC 1345 mnémoniques précédés de &
mnémonique1 RFC 1345 mnémoniques précédés de `
tout/LANGUAGE (par exemple tout/pl-iso2)
Ce format d'entrée spécial détectera automatiquement l'encodage, en se basant sur le
fréquences des caractères trouvés dans le texte. Chaque langue est associée à un ensemble de
codages possibles utilisés pour lui et fréquences moyennes de ses lettres (à l'exclusion
lettres ASCII). L'encodage le mieux adapté est utilisé pour la conversion. Actuellement
les langues prises en charge sont cs (Tchèque), de (Allemand), el (Grec), eo (Espéranto), es
(Espagnol), fr (Français), he (Hébreu), it (Italien), pl (Polonais), pt (Portugais), ru
(russe) et sv (Suédois).
varpl Polonais mixte ISO-8859-2, CP-1250 et UTF-8. Si vous lisez des groupes de discussion polonais, je
suggérez de le mettre comme filtre dans votre lecteur de nouvelles (pour améliorer la vitesse, c'est
mieux vaut l'appeler directement plutôt que par konwert).
varéo Mélange de divers encodages d'espéranto.
OPTIONS CONTRLE THE CI-DESSUS TRANSFORMATION
/1 (par exemple savoir iso2-ascii/1)
Chaque caractère indisponible sera remplacé uniquement par un seul caractère approximatif,
pas de chaîne. C'est utile avec le programme filterm ou avec du texte préformaté. Cette
L'option est automatiquement activée lorsqu'un filtre est utilisé comme sortie pour filterm.
/ Html Le texte est supposé être HTML. Les personnages " & < > résultant d'autres personnages'
approximations seront correctement échappées comme " et < >L’ <META http-
equiv="type de contenu" content="texte/html ; jeu de caractères="..."> l'en-tête sera corrigé si
présent.
/htmldéc
Convertissez META comme ci-dessus. Les caractères non disponibles seront encodés en &#Unicode;.
/htmlhex
Convertissez META comme ci-dessus. Les caractères non disponibles seront encodés en hexadécimal
&#xUnicode;.
/Texas Les caractères non disponibles seront décrits dans TeX. Personnages # $ % & \ ^ _ { | } ~
résultant des approximations de certains caractères seront correctement échappés dans \# \$
\% \& $\barre oblique inverse$ \^{} \_ \{ $|$ \} \~{}.
/asciichar
Reconnaît certaines représentations ASCII de caractères, par exemple (c) ... 1/2 >=.
/rosyjski
Le texte russe sera remplacé par sa transcription phonétique polonaise.
Certains filtres de sortie peuvent utiliser les informations de langue pour choisir de meilleures approximations de
lettres indisponibles, par exemple / de (Allemand): ä → ae au lieu de a.
AUTRES FILTRES
tout/LANGUAGE-tester
Détecte l'encodage, mais au lieu de la conversion de texte n'affiche que l'encodage
Nom. L'option supplémentaire /tout montre tous les encodages possibles, triés du meilleur
aux pires.
cr
lf
crlf Forcer une convention de marqueur de fin de ligne spécifique. cr =Macintosh, lf = Unix et Amiga,
crlf = Windows et DOS. La convention d'entrée est détectée automatiquement.
expand Développe les tabulations en espaces (utilise le programme textutils expand).
étendre
Compresse les espaces en tabulations (utilise le programme textutils unexpand).
rmspacesateol
Supprime les espaces et les tabulations en fin de ligne.
qp-8 bits
8 bits-qp
Encodage imprimable cité MIME : =A3=F3d=BC.
RTF-8 bits
8bit-rtf
Format de texte enrichi : \'a3\'f3d\'9f.
txt-htmlchar
Escapes " & < > en entités SGML/HTML " et < >. Utile pour
inclure un fichier texte dans HTML Mots clés.
htmlchar-txt
Inverser.
pourriture13 Guvf vf n qrzbafgengvba bs ebg13.
toupie
baisser
Auto-explicatif. Actuellement ASCII uniquement.
prn7pl Convertit les caractères polonais en séquences de contrôle pour une imprimante compatible EPSON. Utiliser uniquement
Caractères 7 bits, tête d'imprimante à espacement arrière et caractères de positionnement vertical ,.'` it
crée des griffons pseudo-polis. Vous pouvez spécifier des options : /nlq (par défaut) qui
optimise la sortie pour des imprimantes de meilleure qualité et /Brouillon - utile par ex. pour
Imprimante 9 clous.
Utilisez konwert en ligne en utilisant les services onworks.net