Este es el grupo de etiquetas de comando que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
tagsoup - convierte HTML desagradable y feo en XHTML limpio
SINOPSIS
Java -jar /usr/share/java/tagsoup.jar [ opciones ] [ archivos ]
DESCRIPCIÓN
Rectifique HTML arbitrario en XHTML limpio, utilizando una descripción personalizada de HTML. La salida
será XML bien formado, pero no necesariamente IMPORTANTE XHTML.
--archivos
entrada múltiple archivos debe procesarse en los archivos de salida correspondientes
--encoding =codificación
especifica la codificación de los archivos de entrada
--output-encoding =codificación
especifica la codificación de la salida (si el nombre de la codificación comienza con `` utf '', el
la salida no contendrá entidades de caracteres; de lo contrario, todos los caracteres no ASCII son
representados como entidades)
--html salida HTML rectificado en lugar de XML, omitiendo la declaración XML y cualquier
declaraciones de espacio de nombres
--method = html
salida HTML rectificado en lugar de XML (las etiquetas finales se omiten para elementos vacíos, y
no se realiza ningún escape de caracteres en los elementos de script y estilo)
--omit-declaración-xml
omitir la declaración XML
--léxico
características léxicas de salida (específicamente comentarios y cualquier declaración DOCTYPE)
--no suprimir espacios de nombres en la salida
--nobogones
suprimir elementos desconocidos que no sean HTML en la salida
--nodefaults
suprimir los valores de atributo predeterminados
--nocolon
cambiar los dos puntos explícitos en los nombres de los elementos y atributos a guiones bajos
--no reiniciar
no reinicie ningún elemento reiniciable
--ignorable
pasar a través de espacios en blanco ignorables (espacios en blanco en contenido de solo elemento) a través de SAX
manejador de métodos ignorable
--alguna tratar los elementos desconocidos que no son HTML como si permitieran cualquier contenido (predeterminado)
--bogones vacíos
tratar los elementos desconocidos que no sean HTML como elementos vacíos
--norootbogons
no permita que elementos desconocidos que no sean HTML sean elementos raíz
--doctype-system =identificación del sistema
forzar la salida de la declaración DOCTYPE con un identificador de sistema especificado
--doctype-public =identificación-pública
forzar la salida de la declaración DOCTYPE con un identificador público especificado
--standalone = [sí | no]
especificar un pseudo-atributo independiente en la declaración XML de salida
--version =versión
especificar el pseudoatributo de la versión en la declaración XML de salida (no afecta
versión de salida XML)
--nocdata
tratar los elementos de contenido CDATA guión y estilo como elementos ordinarios (principalmente para
pruebas)
--píxide formato de salida PYX en lugar de XML (principalmente para pruebas)
--pixin
la entrada es HTML en formato PYX (principalmente para pruebas)
--reutilizar
reutilizar el mismo objeto analizador internamente (solo para pruebas)
--ayuda ayuda básica de salida
--versión
número de versión de salida
EtiquetaSoup es un analizador y reformateador de HTML desagradable y desagradable. Su modo de procesamiento normal es
para aceptar archivos HTML en la línea de comando, o desde la entrada estándar si no se proporciona ninguno,
y enviarlos como XML limpio a la salida estándar. Se supone que la codificación es la
codificación local de plataforma en la entrada y siempre es UTF-8 en la salida.
Cuando el --archivos se da la opción, cada archivo de entrada se procesa en un archivo de salida del
nombre correspondiente, con la extensión cambiada a xhtml. Si la extensión ya está
xhtml, se cambia a xhtml_.
TagSoup reparará, por cualquier medio necesario, las violaciones del formato XML correcto. En
En particular, solucionará los nombres de atributo mal formados y proporcionará el valor de atributo faltante
comillas. Más significativamente, proporciona etiquetas finales donde HTML les permite ser
omitido y, a veces, donde no lo hace. Incluso proporcionará etiquetas de inicio cuando sea necesario;
por ejemplo, si un documento comienza con un etiqueta, TagSoup lo prefijará automáticamente
con .
Use tagsoup en línea usando los servicios de onworks.net
