Il s'agit de la commande tagsoup qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks à l'aide de l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.
PROGRAMME:
Nom
tagsoup - convertit le HTML méchant et laid en XHTML propre
SYNOPSIS
Java -pot /usr/share/java/tagsoup.jar [ Options ] [ fichiers ]
DESCRIPTION
Rectifiez le code HTML arbitraire en XHTML propre, à l'aide d'une description personnalisée du code HTML. Le résultat
sera du XML bien formé, mais pas nécessairement Info de contact. XHTML.
--des dossiers
entrée multiple fichiers doivent être traités dans les fichiers de sortie correspondants
--encodage=codage
spécifie l'encodage des fichiers d'entrée
--output-encodage=codage
spécifie l'encodage de la sortie (si le nom d'encodage commence par ``utf'', le
la sortie ne contiendra pas d'entités de caractères ; sinon, tous les caractères non ASCII sont
représentés comme des entités)
--html sortie HTML rectifiée plutôt que XML, en omettant la déclaration XML et tout
déclarations d'espace de noms
--méthode=html
sortie HTML rectifiée plutôt que XML (les balises de fin sont omises pour les éléments vides, et
aucun caractère d'échappement n'est effectué dans les éléments de script et de style)
--omit-xml-déclaration
omettre la déclaration XML
--lexical
caractéristiques lexicales de sortie (en particulier les commentaires et toute déclaration DOCTYPE)
--non supprimer les espaces de noms dans la sortie
--nobogons
supprimer les éléments non HTML inconnus dans la sortie
--nodefaults
supprimer les valeurs d'attribut par défaut
--nocolons
changer les deux points explicites dans les noms d'éléments et d'attributs en traits de soulignement
--norestart
ne redémarrez aucun élément redémarrable
--ignorable
passer par les espaces blancs ignorables (espaces blancs dans le contenu d'éléments uniquement) via SAX
gestionnaire de méthode ignorableWhitespace
--tout traiter les éléments non HTML inconnus comme autorisant tout contenu (par défaut)
--videsbogons
traiter les éléments non HTML inconnus comme des éléments vides
--norootbogons
ne pas autoriser les éléments non HTML inconnus à être des éléments racine
--doctype-system=identifiant-système
forcer la déclaration DOCTYPE à sortir avec l'identifiant système spécifié
--doctype-public=identifiant-public
forcer la déclaration DOCTYPE à sortir avec l'identifiant public spécifié
--standalone=[oui|non]
spécifier un pseudo-attribut autonome dans la déclaration XML de sortie
--version=version
spécifier le pseudo-attribut de version dans la déclaration XML de sortie (n'affecte pas
version de sortie XML)
--nocdata
traiter les éléments de contenu CDATA scénario et Catégorie comme des éléments ordinaires (principalement pour
essai)
--ciboire format de sortie PYX plutôt que XML (principalement pour les tests)
--pyxine
l'entrée est HTML au format PYX (principalement pour les tests)
--réutilisation
réutiliser le même objet Parser en interne (pour les tests uniquement)
--Aidez-moi sortie aide de base
--version
numéro de version de sortie
TagSoupe est un analyseur et un reformateur pour HTML méchant et laid. Son mode de traitement normal est
pour accepter les fichiers HTML sur la ligne de commande, ou depuis l'entrée standard si aucun n'est donné,
et les sortir en XML propre sur la sortie standard. L'encodage est supposé être le
encodage local de la plate-forme en entrée, et est toujours UTF-8 en sortie.
When the --des dossiers est donnée, chaque fichier d'entrée est traité dans un fichier de sortie du
nom correspondant, avec l'extension changée en xhtml. Si l'extension est déjà
xhtml, il est remplacé par xhtml_.
TagSoup réparera, par tous les moyens nécessaires, les violations de la conformité XML. Dans
en particulier, il corrigera les noms d'attributs malformés et fournira une valeur d'attribut manquante
guillemets. Plus important encore, il fournit des balises de fin là où HTML leur permet d'être
omis, et parfois là où ce n'est pas le cas. Il fournira même des balises de démarrage si nécessaire ;
par exemple, si un document commence par un tag, TagSoup le préfixera automatiquement
avec .
Utilisez tagsoup en ligne à l'aide des services onworks.net
