Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen komut veri yığınıdır.
Program:
ADI
datamash - komut satırı hesaplamaları
SİNOPSİS
veri yığını [SEÇENEK] op [col] [op col ...]
TANIM
Stdin'den girişte sayısal/dize işlemleri gerçekleştirir.
'op' gerçekleştirilecek işlemdir; Gruplama için, satır başına işlemler 'col' girdidir
kullanım alanı; 'col' bir sayı (1=ilk alan) veya kullanırken bir sütun adı olabilir -H or
--başlık girişi seçenekleri.
fileto operasyonlar:
devrik, ters
Hat Filtreleme operasyonlar:
rmdup
Satır Başına operasyonlar:
base64, debase64, md5, sha1, sha256, sha512
Sayısal Gruplama operasyonlar:
toplam, min, max, absmin, absmax
Metinsel/Sayısal Gruplama operasyonlar:
saymak, ilk, son, Rand, benzersiz, daraltmak, benzersiz
Istatistiksel Gruplama operasyonlar:
ortalama, medyan, q1, q3, iqr, mod, antimode, pstdev, sstdev, pvar svar, mad, madraw,
pskew, çarpık, pkurt, skurt, dpo, jarque
SEÇENEKLER
Gruplama Seçenekler:
-f, --tam dolu
op sonuçlarından önce tüm giriş satırını yazdır (varsayılan: yalnızca gruplandırılmış tuşları yazdır)
-g, --grup=X[,Y,Z]
X,[Y,Z] alanları aracılığıyla gruplama
--başlık girişi
ilk giriş satırı sütun başlıklarıdır
--başlık çıkışı
sütun başlıklarını ilk satır olarak yazdır
-H, --başlıklar
'--header-in ile aynı --başlık çıkışı'
-i, --ignore-case
metni karşılaştırırken büyük/küçük harfleri yoksay; bu, gruplandırmayı ve dizeyi etkiler
operasyonlar
-s, --çeşit
gruplamadan önce girişi sıralayın; bu, girişi manuel olarak yönlendirme ihtiyacını ortadan kaldırır
'sıralama' yoluyla
fileto Çalışma Seçenekler:
--kesin olmayan
değişen sayıda alana sahip satırlara izin ver
--dolgu=X
eksik değerleri X ile doldurun (varsayılan %s)
genel Seçenekler:
-t, --alan-ayırıcı=X
alan sınırlayıcı olarak SEKME yerine X kullanın
--narm NA/NaN değerlerini atla
-W, --Beyaz boşluk
alan sınırlayıcılar için boşluk (bir veya daha fazla boşluk ve/veya sekme) kullanın
-z, --sıfır sonlandırıldı
0 baytlı bitiş satırları, yeni satır değil
--yardım et Bu yardımı gösterir ve çıkar
--versiyon
çıkış sürüm bilgisini gösterir ve çıkar
MEVCUT OPERASYONLAR
fileto operasyonlar:
aktarmak girdi dosyasının satırlarını, sütunlarını devrik
ters her satırda ters alan sırası
Hat Filtreleme operasyonlar:
rmdup yinelenen anahtar değeri olan satırları kaldır
Satır Başına operasyonlar:
base64 Alanı base64 olarak kodlayın
debase64 Alanı base64 olarak deşifre edin, geçersiz base64 dizesi varsa hatayla çıkın
md5/sha1/sha256/sha512
Alan değerinin md5/sha1/sha256/sha512 karmasını hesaplayın
ters her satırda ters alan sırası
Sayısal Gruplama operasyonlar
toplam değerlerin toplamı
dk minimum değer
maksimum maksimum değer
karın ağrısı mutlak değerlerin minimumu
absmax mutlak değerlerin maksimumu
Metinsel/Sayısal Gruplama operasyonlar
saymak gruptaki öğelerin sayısını saymak
ilk grubun ilk değeri
son grubun son değeri
tüm gruptan rastgele bir değer
benzersiz benzersiz değerlerin virgülle ayrılmış sıralanmış listesi
çöküş tüm giriş değerlerinin virgülle ayrılmış listesi
kontluk benzersiz/farklı değerlerin sayısı
Istatistiksel Gruplama operasyonlar
ortalama değerlerin ortalaması
medyan medyan değer
q1 1. çeyrek değeri
q3 3. çeyrek değeri
iqr çeyrekler arası aralık
kip mod değeri (en yaygın değer)
antimod anti-mod değeri (en küçük ortak değer)
pstdev Nüfus standart sapması
stdev Numune standart sapması
pvar nüfus değişimi
Cevap örnek varyansı
deli normal dağılımlar için sabit 1.4826 ile ölçeklenen medyan mutlak sapma
madraw medyan mutlak sapma, ölçeklenmemiş
eğmek (örnek) grubun eğriliği
çarpık (nüfus) grubunun çarpıklığı
'skew' ve 'pskew' işlemleri tarafından bildirilen x değerleri:
x > 0 - pozitif çarpık / sağa çarpık
0 > x - negatif eğik / sola eğik
x > 1 - sağa çok eğik
1 > x > 0.5 - orta derecede sağa eğik
0.5 > x > -0.5 - yaklaşık simetrik
-0.5 > x > -1 - orta derecede sola eğik
-1 > x - sola oldukça eğik
koşarak kaçmak (örnek) grubun aşırı Kurtozu
pkurt (nüfus) grubunun aşırı Kurtozu
jark normallik için Jarque-Beta testinin p değeri
dpo normallik için D'Agostino-Pearson Omnibus testinin p değeri;
'jarque' ve 'dpo' işlemleri için:
boş hipotez normalliktir;
düşük p-Değerleri normal olmayan verileri gösterir;
yüksek p-Değerleri, boş hipotezin reddedilemeyeceğini gösterir.
ÖRNEKLER
Sütun 1'deki değerlerin toplamını ve ortalamasını yazdırın:
$ sıra 10 | veri yığını toplam 1 demek 1
55 5.5
Alan 1'e göre grup girişi ve alan 2'deki toplam değerler (grup başına)
$ kedi örneği.txt
Bir 10
Bir 5
B 9
B 11
$ veri yığını -g 1 toplam 2 < örnek.txt
Bir 15
B 20
Sıralanmamış girdiler sıralanmalıdır ('-s' ile):
$ kedi örneği.txt
Bir 10
C 4
B 9
C 1
Bir 5
B 11
$ veri yığını -s -g1 toplamı 2 < örnek.txt
Bir 15
B 20
C 5
Hangisine eşdeğerdir:
$ kedi örnek.txt | sıralama -k1,1 | veri yığını -g 1 toplam 2
kullanım -h (--başlıklar) giriş dosyasında bir başlık satırı varsa:
# Öğrenci adı, alanı, test puanı ile bir dosya verildi...
$ kafa -n5 puanları_h.txt
Ad Binbaşı Skoru
Shawn Mühendislik 47
Caleb İş 87
Hıristiyan İş 88
Derek Sanat 60
# Her ana dal için ortalama ve standart sapmayı hesaplayın
$ veri yığını --sort --headers --grup 2 ortalama 3 pstdev 3 <score_h.txt
(veya kısa form kullanın)
$ veri yığını -sH -g2 ortalama 3 pstdev 3 < score_h.txt
(veya adlandırılmış sütunları kullanın)
$ veri yığını -sH -g Majör ortalama Skor pstdev Skoru < Skorlar_h.txt
GroupBy(Major) ortalama(Puan) pstdev(Puan)
Sanat 68.9 10.1
İş 87.3 4.9
Mühendislik 66.5 19.1
Sağlık-Tıp 90.6 8.8
Yaşam Bilimleri 55.3 19.7
Sosyal Bilimler 60.2 16.6
Her satırda ters alan sırası:
$ sıra 6 | yapıştır - - | veri yığını ters
2 1
4 3
6 5
Satırları, sütunları değiştir:
$ sıra 6 | yapıştır - - | veri yığını aktarmak
+1 3 5
+2 4 6
Sütun 1'den yinelenen anahtar değerine sahip satırları kaldırın (Farklı ilk,son işlemleri, rmdup
çok daha hızlıdır ve dosyayı -s ile sıralamayı gerektirmez):
# Dosyaların ve örnek kimliklerin bir listesi verildi:
$ kedi GİRDİ
Örnek Kimlik Dosyası
2 cc.txt
3 gün.txt
1 ab.txt
2 ee.txt
3 ff.txt
# Yinelenen Örnek Kimliği olan satırları kaldırın (sütun 1):
$ veri yığını rmdup 1 < GİRİŞ
(veya kullanılan adlandırılmış sütun)
$ veri yığını -H rmdup SampleID < GİRİŞ
Örnek Kimlik Dosyası
2 cc.txt
3 gün.txt
1 ab.txt
Her birinin sha1 değerini hesapladıktan sonra, her TXT dosyasının sha1 karma değerini hesaplayın.
dosyanın içeriği:
$ sha1sum *.txt | datamash -Wf sha1 2
EK Hizmetler
GNU Datamash Web Sitesine Bakın (http://www.gnu.org/software/datamash)
onworks.net hizmetlerini kullanarak datamash'ı çevrimiçi kullanın