Dit is de opdracht xml_splitp die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator
PROGRAMMA:
NAAM
xml_split - knip een groot XML-bestand in kleinere stukken
PRODUCTBESCHRIJVING
"xml_split" neemt een (vermoedelijk groot) XML-bestand en splitst het op in verschillende kleinere bestanden. De
gebruikt geheugen is het geheugen dat nodig is voor het grootste stuk (dwz geheugen wordt hergebruikt voor elk nieuw
brok).
Het kan splitsen op een bepaald niveau in de boom (de standaard splitst kinderen van de root), of
op een voorwaarde (met behulp van de subset van XPath begrepen door XML::Twig, dus "sectie" of
"/doc/sectie").
Elk gegenereerd bestand wordt vervangen door een verwerkingsinstructie die "xml_merge" mogelijk maakt
herbouw het originele document. Het formaat van de verwerkingsinstructie is "
: ?>"
Bestandsnamen zijn - .xml, met -00.xml met het hoofddocument.
OPTIES
-l
niveau om op te knippen: 1 genereert een bestand voor elk kind van de root, 2 voor elk kleinkind
standaard ingesteld op 1
-C
genereer een bestand voor elk element dat aan de voorwaarde voldoet
xml_split -c zal elk "sectie"-element in zijn eigen bestand plaatsen (geneste
secties worden ook behandeld)
Merk op dat deze optie op dit moment een stuk langzamer is dan het gebruik van "-l"
-S
genereert bestanden van (ongeveer) . De inhoud van elk bestand is ingesloten in een
nieuw element ("xml_split::root"), dus het is goed gevormde XML. De maat kan worden opgegeven
bytes, Kb, Mb of Gb.
-G
groepen elementen in één bestand. De inhoud van elk bestand is ingesloten in een nieuw
element ("xml_split::root"), dus het is goed gevormde XML.
-B
basisnaam voor de uitvoer, bestanden krijgen een naam - <.ext>
is een volgnummer, zie hieronder "--nb_digits" is een extensie, zie hieronder
"--verlenging"
standaard de originele bestandsnaam (indien beschikbaar) of "out" (als de invoer afkomstig is van het
standaard invoer)
-N
aantal cijfers in het volgnummer voor elk bestand
indien meer cijfers dan nodig zijn, dan worden ze gebruikt: als "--nb_digits 2" wordt gebruikt
en er worden 112 bestanden gegenereerd, ze krijgen de naam " -01.xml" naar " -112.xml"
standaard ingesteld op 2
-e
extensie te gebruiken voor gegenereerde bestanden
standaard naar de oorspronkelijke bestandsextensie of ".xml"
-Ik gebruik XInclude-elementen in plaats van Processing Instructions om aan te geven waar subbestanden nodig hebben
opgenomen worden
-v uitgebreide uitvoer
Merk op dat deze optie de verwerking aanzienlijk kan vertragen (met een orde van grootte)
bij het genereren van veel kleine documenten
-V voert versie uit en sluit af
-h korte hulp
-m man (vereist dat pod2text in het pad staat)
Voorbeelden
xml_split foo.xml # split op niveau 1
xml_split -l 2 foo.xml # split op niveau 2
xml_split -c sectie foo.xml # er wordt een bestand gegenereerd voor elk sectie-element
# geneste secties zijn correct gesplitst
Gebruik xml_splitp online met onworks.net-services