datamash - Online di Cloud

Ini adalah perintah datamash yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


datamash - perhitungan baris perintah

RINGKASAN


kumpulan data [PILIHAN] op [col] [op col ...]

DESKRIPSI


Melakukan operasi numerik/string pada input dari stdin.

'op' adalah operasi yang harus dilakukan; Untuk pengelompokan, operasi per baris 'col' adalah input
bidang yang akan digunakan; 'col' dapat berupa angka (1=bidang pertama), atau nama kolom saat menggunakan -H or
--tajuk-masuk Pilihan.

File operasi:
transpos, terbalik

Penyaringan Garis operasi:
rmdup

Per-baris operasi:
base64, debase64, md5, sha1, sha256, sha512

Numeric Pengelompokan operasi:
jumlah, min, maks, absmin, absmaks

Tekstual/Numerik Pengelompokan operasi:
hitung, pertama, terakhir, rand, unik, runtuh, countunique

Statistik Pengelompokan operasi:
rata-rata, median, q1, q3, iqr, mode, antimode, pstdev, sstdev, pvar svar, mad, madraw,
pskew, skew, pkurt, skurt, dpo, jarque

PILIHAN


Pengelompokan Pilihan:
-f, --penuh
cetak seluruh baris input sebelum hasil operasi (default: cetak hanya kunci yang dikelompokkan)

-g, --kelompok=X[,Y,Z]
grup melalui bidang X,[Y,Z]

--tajuk-masuk
baris input pertama adalah header kolom

--header-keluar
cetak tajuk kolom sebagai baris pertama

-H, --header
sama dengan '--header-in --header-keluar'

-i, --abaikan-kasus
abaikan huruf besar/kecil saat membandingkan teks; ini memengaruhi pengelompokan, dan string
operasi

-s, --menyortir
mengurutkan input sebelum mengelompokkan; ini menghilangkan kebutuhan untuk menyalurkan input secara manual
melalui 'mengurutkan'

File Operasi Pilihan:
--tidak ketat
izinkan garis dengan jumlah bidang yang bervariasi

--pengisi=X
isi nilai yang hilang dengan X (default %s)

Umum Pilihan:
-t, --pemisah-bidang=X
gunakan X alih-alih TAB sebagai pembatas bidang

--nama lewati nilai NA/NaN

-W, --spasi putih
gunakan spasi putih (satu atau lebih spasi dan/atau tab) untuk pembatas bidang

-z, --dihentikan nol
akhiri baris dengan 0 byte, bukan baris baru

--membantu tampilkan bantuan ini dan keluar

--Versi: kapan
menampilkan informasi versi dan keluar

TERSEDIA OPERASI


File operasi:
mengubah urutan transpos baris, kolom dari file input

membalikkan urutan bidang terbalik di setiap baris

Penyaringan Garis operasi:
rmdup hapus baris dengan nilai kunci yang digandakan

Per-baris operasi:
base64 Enkode bidang sebagai base64

merendahkan64 Dekode bidang sebagai base64, keluar dengan kesalahan jika string base64 tidak valid

md5/sha1/sha256/sha512
Hitung hash md5/sha1/sha256/sha512 dari nilai bidang

membalikkan urutan bidang terbalik di setiap baris

Numeric Pengelompokan operasi
jumlah jumlahkan nilai

menit nilai minimum

max nilai maksimum

perut minimum dari nilai absolut

absmaks maksimum dari nilai absolut

Tekstual/Numerik Pengelompokan operasi
menghitung hitung jumlah elemen dalam grup

pertama nilai pertama grup

terakhir nilai terakhir dari grup

baris satu nilai acak dari grup

unik daftar nilai unik yang dipisahkan koma

keruntuhan daftar yang dipisahkan koma dari semua nilai input

unik jumlah nilai unik/berbeda

Statistik Pengelompokan operasi
berarti rata-rata dari nilai

rata-rata nilai tengah

q1 nilai kuartil 1

q3 nilai kuartil ke-3

iqr jarak interkuartil

mode nilai mode (nilai paling umum)

anti mode nilai anti-mode (nilai paling tidak umum)

pstdev simpangan baku populasi

sstdev standar deviasi sampel

pvar varians populasi

menjawab varians sampel

gila deviasi absolut median, diskalakan dengan konstanta 1.4826 untuk distribusi normal

madraw deviasi absolut median, tanpa skala

miring kemiringan kelompok (sampel)

pskew kecondongan kelompok (populasi)
nilai x dilaporkan oleh operasi 'skew' dan 'pskew':
x > 0 - condong positif / condong ke kanan
0 > x - condong negatif / condong ke kiri
x > 1 - sangat miring ke kanan
1 > x > 0.5 - agak miring ke kanan
0.5 > x > -0.5 - kira-kira simetris
-0.5 > x > -1 - agak miring ke kiri
-1 > x - sangat miring ke kiri

rok kelebihan Kurtosis dari kelompok (sampel)

pkurt kelebihan Kurtosis dari kelompok (populasi)

jarque nilai p dari uji Jarque-Beta untuk normalitas

dpo p-nilai uji D'Agostino-Pearson Omnibus untuk normalitas;
untuk operasi 'jarque' dan 'dpo':
hipotesis nol adalah normalitas;
p-Values ​​rendah menunjukkan data yang tidak normal;
Nilai p tinggi menunjukkan hipotesis nol tidak dapat ditolak.

CONTOH


Cetak jumlah dan rata-rata nilai dari kolom 1:

$ urutan 10 | kumpulan data jumlah 1 berarti 1
55 5.5

Kelompokkan input berdasarkan kolom 1, dan jumlahkan nilai (per grup) pada kolom 2:

$ contoh kucing.txt
Sebuah 10
Sebuah 5
B 9
B 11
$ kumpulan data -g 1 jumlah 2 < contoh.txt
Sebuah 15
B 20

Input yang tidak disortir harus diurutkan (dengan '-s'):

$ contoh kucing.txt
Sebuah 10
C 4
B 9
C 1
Sebuah 5
B 11
$ kumpulan data -s -g1 jumlah 2 < contoh.txt
Sebuah 15
B 20
C 5

Yang setara dengan:

$ cat example.txt | urutkan -k1,1 | kumpulan data -g 1 jumlah 2

penggunaan -h (--header) jika file input memiliki baris header:

# Diberi file dengan nama siswa, bidang, nilai ujian ...
$ kepala -n5 skor_h.txt
Nama Skor Utama
Teknik Shawn 47
Bisnis Caleb 87
Bisnis Kristen 88
Seni Derek 60

# Hitung mean dan standar devian untuk setiap jurusan
$ kumpulan data --sort --headers --group 2 berarti 3 pstdev 3 < skor_h.txt
(atau gunakan bentuk pendek)
$ kumpulan data -sH -g2 berarti 3 pstdev 3 < skor_h.txt
(atau gunakan kolom bernama)
$ kumpulan data -sH -g Skor rata-rata utama Skor pstdev < skor_h.txt
GroupBy(Mayor) mean(Skor) pstdev(Skor)
Seni 68.9 10.1
Bisnis 87.3 4.9
Teknik 66.5 19.1
Kesehatan-Kedokteran 90.6 8.8
Ilmu Kehidupan 55.3 19.7
Ilmu Sosial 60.2 16.6

Urutan bidang terbalik di setiap baris:

$ seq 6 | tempel - - | kumpulan data membalikkan
2 1
4 3
6 5

Transpos baris, kolom:

$ seq 6 | tempel - - | kumpulan data mengubah urutan
1 3 5
2 4 6

Hapus baris dengan nilai kunci duplikat dari kolom 1 (Tidak seperti pertama,terakhir operasi, rmdup
jauh lebih cepat dan tidak perlu menyortir file dengan -s):

# Diberikan daftar file dan ID sampel:
$ kucing INPUT
Contoh ID File
2 cc.txt
3 dd.txt
1 ab.txt
2 ee.txt
3 ff.txt

# Hapus baris dengan ID Sampel yang digandakan (kolom 1):
$ kumpulan data rmdup 1 < INPUT
(atau menggunakan kolom bernama)
$ kumpulan data -H rmdup SampleID < INPUT
Contoh ID File
2 cc.txt
3 dd.txt
1 ab.txt

Hitung nilai hash sha1 dari setiap file TXT, setelah menghitung nilai sha1 masing-masing
isi file:

$sha1sum *.txt | datamash -Wf sha1 2

TAMBAHAN INFORMASI


Lihat Situs Web GNU Datamash (http://www.gnu.org/software/datamash)

Gunakan datamash online menggunakan layanan onworks.net



Program online Linux & Windows terbaru