Il s'agit de la commande xml_splitp qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
xml_split - coupe un gros fichier XML en plus petits morceaux
DESCRIPTION
"xml_split" prend un fichier XML (vraisemblablement gros) et le divise en plusieurs fichiers plus petits. Les
la mémoire utilisée est la mémoire nécessaire pour le plus gros morceau (c'est-à-dire que la mémoire est réutilisée pour chaque nouveau
tronçon).
Il peut se diviser à un niveau donné dans l'arborescence (par défaut, divise les enfants de la racine), ou
sur une condition (en utilisant le sous-ensemble de XPath compris par XML::Twig, donc "section" ou
"/doc/section").
Chaque fichier généré est remplacé par une instruction de traitement qui permettra à "xml_merge" de
reconstruire le document original. Le format de l'instruction de traitement est "
: ?>"
Les noms de fichiers sont - .xml, avec -00.xml contenant le document principal.
OPTIONS
-l
niveau à couper : 1 génère un fichier pour chaque enfant de la racine, 2 pour chaque petit-enfant
par défaut à 1
-c
générer un fichier pour chaque élément qui passe la condition
xml_split -c mettra chaque élément "section" dans son propre fichier (imbriqué
les sections sont également traitées)
Notez que pour le moment cette option est beaucoup plus lente que d'utiliser "-l"
-s
génère des fichiers de (environ) . Le contenu de chaque fichier est enfermé dans un
nouvel élément ("xml_split::root"), il s'agit donc d'un XML bien formé. La taille peut être indiquée en
octets, Ko, Mo ou Go.
-g
groupes éléments dans un seul fichier. Le contenu de chaque fichier est enfermé dans un nouveau
élément ("xml_split::root"), il s'agit donc d'un XML bien formé.
-b
nom de base pour la sortie, les fichiers seront nommés - <.ext>
est un numéro de séquence, voir ci-dessous "--nb_digits" est une extension, voir ci-dessous
"--extension"
par défaut le nom du fichier d'origine (si disponible) ou "out" (si l'entrée provient du
entrée standard)
-n
nombre de chiffres dans le numéro de séquence pour chaque fichier
si plus de chiffres que sont nécessaires, alors ils sont utilisés : si "--nb_digits 2" est utilisé
et 112 fichiers sont générés ils seront nommés " -01.xml" à " -112.xml"
par défaut à 2
-e
extension à utiliser pour les fichiers générés
par défaut l'extension de fichier d'origine ou ".xml"
-j'utilise les éléments XInclude au lieu des instructions de traitement pour marquer où les sous-fichiers ont besoin
pour être inclus
-v sortie verbeuse
Notez que cette option peut ralentir considérablement le traitement (d'un ordre de grandeur)
lors de la génération de nombreux petits documents
-V sorties version et sortie
-h aide courte
-m man (nécessite que pod2text soit dans le chemin)
EXEMPLES
xml_split foo.xml # divisé au niveau 1
xml_split -l 2 foo.xml # divisé au niveau 2
xml_split -c section foo.xml # un fichier est généré pour chaque élément de section
# sections imbriquées sont correctement divisées
Utilisez xml_splitp en ligne à l'aide des services onworks.net