Angielskifrancuskihiszpański

Ad


Ulubiona usługa OnWorks

datamash - Online w chmurze

Uruchamiaj datamash w bezpłatnym dostawcy hostingu OnWorks w systemie Ubuntu Online, Fedora Online, emulatorze online systemu Windows lub emulatorze online systemu MAC OS

To jest polecenie datamash, które można uruchomić w bezpłatnym dostawcy hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS

PROGRAM:

IMIĘ


datamash - obliczenia z wiersza poleceń

STRESZCZENIE


mash danych [OPCJA] op [col] [op col ...]

OPIS


Wykonuje operacje numeryczne/ciągowe na wejściu ze standardowego wejścia.

„op” to operacja do wykonania; W przypadku grupowania danymi wejściowymi są operacje na wierszach „col”.
pole do wykorzystania; „col” może być liczbą (1=pierwsze pole) lub nazwą kolumny, jeśli jest używana -H or
--wejście nagłówka opcje.

filet operacje:
transponować, odwracać

Filtrowanie linii operacje:
rmdup

Za linię operacje:
base64, debase64, md5, sha1, sha256, sha512

Numeryczne Grupowanie operacje:
suma, min, max, absmin, absmax

Tekstowe/numeryczne Grupowanie operacje:
liczyć, pierwszy, ostatni, rand, unikalny, zwiń, Countunique

Statystyczny Grupowanie operacje:
średnia, mediana, q1, q3, iqr, tryb, antimode, pstdev, sstdev, pvar svar, mad, madraw,
pskew, sskew, pkurt, skurt, dpo, jarque

OPCJE


Grupowanie Opcje:
-f, --pełny
drukuj całą linię wejściową przed wynikami operacji (domyślnie: drukuj tylko zgrupowane klucze)

-g, --Grupa=X[,Y,Z]
grupuj poprzez pola X,[Y,Z]

--wejście nagłówka
pierwsza linia wejściowa to nagłówki kolumn

--wyjście nagłówka
wydrukuj nagłówki kolumn jako pierwszą linię

-H, --nagłówki
tak samo jak '--header-in --wyjście nagłówka'

-i, --ignoruj-przypadek
ignorować wielkie/małe litery podczas porównywania tekstu; wpływa to na grupowanie i ciąg
operacje

-s, --sortować
posortuj dane wejściowe przed grupowaniem; eliminuje to potrzebę ręcznego przesyłania danych wejściowych
poprzez „sortowanie”

filet Działanie Opcje:
--nie-ścisłe
zezwalaj na linie o różnej liczbie pól

--podsadzkarz=X
uzupełnij brakujące wartości X (domyślnie %s)

Ogólne Opcje:
-t, --separator pól=X
użyj X zamiast TAB jako ogranicznika pola

--narm pomiń wartości NA/NaN

-W, --Biała przestrzeń
użyj białych znaków (jednej lub więcej spacji i/lub tabulatorów) jako ograniczników pól

-z, --zakończony zerem
zakończ linie 0 bajtem, a nie nową linią

--help wyświetlenie tego opisu i zakończenie

--wersja
Informacje o wersji i zakończ

DOSTĘPNY OPERACJE


filet operacje:
transponować transponuj wiersze i kolumny pliku wejściowego

rewers odwróć kolejność pól w każdym wierszu

Filtrowanie linii operacje:
rmdup usuń linie ze zduplikowaną wartością klucza

Za linię operacje:
base64 Zakoduj pole jako base64

poniżyć64 Zdekoduj pole jako base64, zakończ z błędem, jeśli nieprawidłowy ciąg base64

md5/sha1/sha256/sha512
Oblicz skrót md5/sha1/sha256/sha512 wartości pola

rewers odwróć kolejność pól w każdym wierszu

Numeryczne Grupowanie operacje
suma sumować wartości

min Minimalna wartość

max maksymalna wartość

absmin minimum wartości bezwzględnych

absmax maksimum wartości bezwzględnych

Tekstowe/numeryczne Grupowanie operacje
liczyć policz liczbę elementów w grupie

drugim pierwsza wartość grupy

trwać ostatnia wartość grupy

rand jedną losową wartość z grupy

wyjątkowy posortowana lista wartości rozdzielonych przecinkami

upadek lista oddzielonych przecinkami wszystkich wartości wejściowych

hrabia liczba unikalnych/odrębnych wartości

Statystyczny Grupowanie operacje
oznaczać średnia wartości

mediana mediana wartości

q1 Wartość pierwszego kwartyla

q3 Wartość trzeciego kwartyla

iqr zakres międzykwartylowy

tryb wartość trybu (najczęstsza wartość)

antymod wartość przeciwtrybowa (najmniejsza wspólna wartość)

pstdev odchylenie standardowe populacji

sstdev Odchylenie standardowe próbki

pwar Wariancja populacji

odpowiedź wariancja próbki

szalony mediana odchylenia bezwzględnego, skalowana stałą 1.4826 dla rozkładów normalnych

Madraw mediana odchylenia bezwzględnego, nieskalowana

przekrzywić skośność grupy (próbnej).

psew skośność grupy (populacyjnej).
wartości x zgłaszane przez operacje „skew” i „pskew”:
x > 0 - dodatnio pochylony/przesunięty w prawo
0 > x - przesunięty ujemnie/przesunięty w lewo
x > 1 - mocno przesunięty w prawo
1 > x > 0.5 - umiarkowanie przesunięty w prawo
0.5 > x > -0.5 - w przybliżeniu symetryczny
-0.5 > x > -1 - umiarkowanie przesunięty w lewo
-1 > x - mocno przesunięty w lewo

skrzecz nadmiar Kurtozy grupy (próbki).

pkurt nadmierna Kurtoza grupy (populacyjnej).

Jarque Wartość p testu Jarque’a-Beta dla normalności

DPO wartość p testu D'Agostino-Pearsona Omnibus dla normalności;
dla operacji „jarque” i „dpo”:
hipoteza zerowa to normalność;
niskie wartości p wskazują na nieprawidłowe dane;
wysokie wartości p wskazują, że hipotezy zerowej nie można odrzucić.

PRZYKŁADY


Wydrukuj sumę i średnią wartości z kolumny 1:

$ kolejne 10 | mash danych suma 1 oznacza 1
55 5.5

Grupowanie danych wejściowych na podstawie pola 1 i wartości sumy (na grupę) w polu 2:

$ kot przykład.txt
10
5
B 9
B 11
$ mash danych -g 1 suma 2 < przykład.txt
15
B 20

Nieposortowane dane wejściowe muszą zostać posortowane (z „-s”):

$ kot przykład.txt
10
C 4
B 9
C 1
5
B 11
$ mash danych -s -g1 suma 2 < przykład.txt
15
B 20
C 5

Co jest równoważne z:

$ przykład kota.txt | sortuj -k1,1 | mash danych -g 1 suma 2

Zastosowanie -h (--nagłówki) jeśli plik wejściowy ma linię nagłówka:

# Otrzymano plik z imieniem i nazwiskiem ucznia, polem, wynikiem testu...
$ głowa -n5 scores_h.txt
Nazwij wynik główny
Inżynieria Shawna 47
Caleb Biznes 87
Biznes chrześcijański 88
Darek Art 60

# Oblicz średnią i odchylenie standardowe dla każdego kierunku
$ mash danych --sort --headers --group 2 oznacza 3 pstdev 3 < score_h.txt
(lub użyj krótkiej formy)
$ mash danych -sH -g2 średnia 3 pstdev 3 < score_h.txt
(lub użyj nazwanych kolumn)
$ mash danych -sH -g Średnia główna Wynik pstdev Wynik < score_h.txt
GroupBy(główny) średnia (wynik) pstdev (wynik)
Sztuka 68.9 10.1
Biznes 87.3 4.9
Inżynieria 66.5 19.1
Zdrowie-Medycyna 90.6 8.8
Nauki o życiu 55.3 19.7
Nauki społeczne 60.2 16.6

Odwróć kolejność pól w każdym wierszu:

$ sekwencja 6 | wklej - - | mash danych rewers
2 1
4 3
6 5

Transponuj wiersze, kolumny:

$ sekwencja 6 | wklej - - | mash danych transponować
1 3 5
2 4 6

Usuń linie ze zduplikowaną wartością klucza z kolumny 1 (w przeciwieństwie do drugim,trwać operacje, rmdup
jest znacznie szybszy i nie wymaga sortowania pliku za pomocą -s):

# Biorąc pod uwagę listę plików i przykładowe identyfikatory:
$ kot WEJŚCIE
Plik ID próbki
2 cc.txt
3 dd.txt
1 ab.txt
2 ee.txt
3 dalej.txt

# Usuń linie ze zduplikowanym identyfikatorem próbki (kolumna 1):
$ mash danych rmdup 1 < WEJŚCIE
(lub używana nazwana kolumna)
$ mash danych -H rmdup ID próbki < WEJŚCIE
Plik ID próbki
2 cc.txt
3 dd.txt
1 ab.txt

Oblicz wartość skrótu sha1 każdego pliku TXT po obliczeniu wartości sha1 każdego pliku
zawartość pliku:

$ sha1sum *.txt | datamash -Wf sha1 2

DODATKOWY INFORMACJE


Zobacz witrynę GNU Datamash (http://www.gnu.org/software/datamash)

Korzystaj z datamash online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

  • 1
    Phaser
    Phaser
    Phaser to szybka, darmowa i zabawna gra otwarta
    źródłowa struktura gry HTML5, która oferuje
    Renderowanie WebGL i Canvas w poprzek
    przeglądarek internetowych na komputery i urządzenia mobilne. Gry
    może być współ...
    Pobierz Phaser
  • 2
    Silnik WASAL
    Silnik WASAL
    VASSAL to silnik gry do tworzenia
    elektroniczne wersje tradycyjnej tablicy
    i gry karciane. Zapewnia wsparcie dla
    renderowanie elementów gry i interakcja,
    i ...
    Pobierz silnik VASSAL
  • 3
    OpenPDF — rozwidlenie iText
    OpenPDF — rozwidlenie iText
    OpenPDF to biblioteka Java do tworzenia
    i edycji plików PDF z LGPL i
    Licencja open source MPL. OpenPDF to
    LGPL/MPL open source następca iText,
    w ...
    Pobierz OpenPDF — rozwidlenie iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - System do Automatyzacji
    Analizy geologiczne - to geografia
    Oprogramowanie systemu informacyjnego (GIS) z
    ogromne możliwości geodanych
    przetwarzanie i an...
    Pobierz SAGA GIS
  • 5
    Przybornik dla Java/JTOOpen
    Przybornik dla Java/JTOOpen
    IBM Toolbox for Java / JTOpen to
    biblioteka klas Java obsługująca
    klient/serwer i programowanie internetowe
    modeli do systemu z systemem OS/400,
    i5/OS, lub...
    Pobierz Zestaw narzędzi dla języka Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (lub D3 dla dokumentów opartych na danych)
    to biblioteka JavaScript, która pozwala
    do tworzenia dynamicznych, interaktywnych danych
    wizualizacje w przeglądarkach internetowych. Z D3
    ty...
    Pobierz plik D3.js
  • więcej »

Komendy systemu Linux

Ad