Dit is de opdracht gbget die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online-emulator of MAC OS online-emulator
PROGRAMMA:
NAAM
gbget - Basistool voor gegevensextractie en -manipulatie
KORTE INHOUD
GBget [opties] 'bestandsnaam[index](C,R)trans'
PRODUCTBESCHRIJVING
Print segmenten van tabelgegevens uit bestanden en pas transformaties toe. Gegevens worden uit tekst gelezen
bestanden met velden gescheiden door spatie (gebruik option -F om een ander scheidingsteken op te geven).
Binnen het gegevensbestand worden gegevensblokken gescheiden door twee lege regels. Bestand kan worden gecomprimeerd
met zlib (.gz).
bestandsnaam
is het invoerbestand. Indien niet opgegeven, is het standaard stdin of het laatst opgegeven
eventuele bestandsnaam.
index staat voor een datablokindex.
index staat voor een datablokindex.
C,R staat voor kolommen en rijen gespecificeerd als "min:max:skip" om te selecteren van "min" tot
"max" elke "overslaan" stappen. Als negatieve min en max vanaf het einde worden geteld. Door
standaard worden alle gegevens afgedrukt ("1:-1:1"). Als min>max dan wordt de telling omgekeerd en overgeslagen
moet negatief zijn (-1 standaard). Verschillende specificaties worden gescheiden door een puntkomma ';'
en achtereenvolgens bekeken.
trans is een lijst met transformaties toegepast op geselecteerde gegevens: 'd' neem de diff van
volgende kolommen; 'D' verwijder alle rijen met minstens één Not-A-Number (NAN) ingang;
'f' maak de uitvoer plat door alle kolommen op te stapelen; 'Ik' maak een logboek van alle invoer, 'P' print
alle invoer verzameld als een datablok; 't' zet de gegevensmatrix om; 'z'
trek van de vermeldingen in elke kolom hun gemiddelde af; 'Z' vervangt de invoer in elk
kolom met hun zscore; 'w' verdeel het item in elke kolom door hun gemiddelde.
'<..;..>'-functies gescheiden door puntkomma's tussen punthaken kunnen worden gebruikt
generieke datatransformatie; de functie wordt berekend voor elke rij gegevens.
Namen van variabelen zijn 'x' gevolgd door het nummer van de kolom en optioneel door 'l'
en het aantal vertragingen. 'x2+x3l1' betekent bijvoorbeeld de som van de vermeldingen in het
2e kolom plus de vermeldingen in de 3e kolom in de vorige rij. 'x0' staat voor
het rijnummer en 'x' is gelijk aan 'x1'
'<@..;..>' als de functiespecificatie begint met een '@' zijn de functies
recursief berekend langs de kolommen. In dit geval is het getal achter de 'x'
de relatieve kolom geteld vanaf de kolom die bij elke stap wordt beschouwd.
'{...}' een functie tussen accolades kan worden gebruikt om gegevens te selecteren: alleen rijen dat
retourneer een niet-negatieve waarde behouden blijven
OPTIES
-F stel de scheidingstekens voor invoervelden in (standaard '\t')
-o stel het uitvoerformaat in (standaard '%12.6e')
-e stel het uitvoerformaat in voor lege velden (standaard '%13s')
-s stel de tekenreeks voor uitvoerscheiding in (standaard ' ')
-t globale transformaties definiëren die vóór elke uitvoer worden toegepast (standaard '')
-v uitgebreide modus
Voorbeelden
gbget 'bestand(1:3)ld'
selecteer de eerste drie kolommen in 'bestand', neem de log en het verschil van
opeenvolgende kolommen;
gbget 'bestand(2,-10:-1)
selecteer de laatste tien elementen van de tweede' van 'bestand' en druk hun vierkanten af
gbget '[2]()' '[1]()' < ...
selecteer het tweede en eerste datablok uit de standaardinvoer.
gbget 'file(1:3)<x1*x2-x3>'
selecteer de eerste drie kolommen in 'bestand' en vermenigvuldig in elke rij de eerste twee
inzendingen en. trek de derde af.
gbget 'bestand()<@x1+x2>'
print de som van twee opeenvolgende kolommen
gbget 'bestand(1:3){x2-2}'
selecteer de eerste drie kolommen in 'bestand' voor de rijen waarvan het tweede veld dat niet is
lager dan 2
Gebruik gbget online met behulp van onworks.net-services