ഡാറ്റമാഷ് - ക്ലൗഡിൽ ഓൺലൈനിൽ

Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്‌സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാൻ കഴിയുന്ന കമാൻഡ് ഡാറ്റാമാഷാണിത്.

പട്ടിക:

NAME


ഡാറ്റമാഷ് - കമാൻഡ്-ലൈൻ കണക്കുകൂട്ടലുകൾ

സിനോപ്സിസ്


ഡാറ്റമാഷ് [ഓപ്ഷൻ] op [കുപ്പായക്കഴുത്ത്] [op കുപ്പായക്കഴുത്ത് ...]

വിവരണം


stdin-ൽ നിന്നുള്ള ഇൻപുട്ടിൽ സംഖ്യാ/സ്ട്രിംഗ് പ്രവർത്തനങ്ങൾ നടത്തുന്നു.

'op' എന്നത് നിർവഹിക്കാനുള്ള പ്രവർത്തനമാണ്; ഗ്രൂപ്പിംഗിനായി, ഓരോ വരി പ്രവർത്തനങ്ങളും 'col' ആണ് ഇൻപുട്ട്
ഉപയോഗിക്കാനുള്ള ഫീൽഡ്; 'col' എന്നത് ഒരു സംഖ്യയാകാം (1=ആദ്യ ഫീൽഡ്), അല്ലെങ്കിൽ ഉപയോഗിക്കുമ്പോൾ ഒരു നിരയുടെ പേര് -H or
--ഹെഡർ-ഇൻ ഓപ്ഷനുകൾ.

ഫയല് പ്രവർത്തനങ്ങൾ:
ട്രാൻസ്പോസ്, റിവേഴ്സ്

ലൈൻ-ഫിൽട്ടറിംഗ് പ്രവർത്തനങ്ങൾ:
rmdup

പെർ-ലൈൻ പ്രവർത്തനങ്ങൾ:
base64, debase64, md5, sha1, sha256, sha512

സംഖ്യാ ഗ്രൂപ്പിംഗ് പ്രവർത്തനങ്ങൾ:
തുക, മിനിറ്റ്, പരമാവധി, absmin, absmax

ടെക്‌സ്‌ച്വൽ/ന്യൂമെറിക് ഗ്രൂപ്പിംഗ് പ്രവർത്തനങ്ങൾ:
കൗണ്ട്, ഫസ്റ്റ്, ലാസ്റ്റ്, റാൻഡ്, തനത്, തകർച്ച, കണക്ക്

സ്റ്റാറ്റിസ്റ്റിക്കൽ ഗ്രൂപ്പിംഗ് പ്രവർത്തനങ്ങൾ:
ശരാശരി, മീഡിയൻ, q1, q3, iqr, മോഡ്, ആന്റിമോഡ്, pstdev, sstdev, pvar svar, mad, madraw,
pskew, sskew, pkurt, skurt, dpo, jarque

ഓപ്ഷനുകൾ


ഗ്രൂപ്പിംഗ് ഓപ്ഷനുകൾ:
-f, --നിറഞ്ഞ
ഒപ് ഫലങ്ങൾക്ക് മുമ്പ് മുഴുവൻ ഇൻപുട്ട് ലൈനും പ്രിന്റ് ചെയ്യുക (സ്ഥിരസ്ഥിതി: ഗ്രൂപ്പുചെയ്ത കീകൾ മാത്രം പ്രിന്റ് ചെയ്യുക)

-g, --സംഘം=X[,Y,Z]
X,[Y,Z] ഫീൽഡുകൾ വഴി ഗ്രൂപ്പ്

--ഹെഡർ-ഇൻ
ആദ്യ ഇൻപുട്ട് ലൈൻ കോളം തലക്കെട്ടുകളാണ്

--ഹെഡർ-ഔട്ട്
കോളം തലക്കെട്ടുകൾ ആദ്യ വരിയായി പ്രിന്റ് ചെയ്യുക

-H, --തലക്കെട്ടുകൾ
'--ഹെഡർ-ഇൻ പോലെ തന്നെ --ഹെഡർ-ഔട്ട്'

-i, --അവഗണിക്കുക-കേസ്
വാചകം താരതമ്യം ചെയ്യുമ്പോൾ അപ്പർ/ലോവർ കേസ് അവഗണിക്കുക; ഇത് ഗ്രൂപ്പിംഗിനെയും സ്ട്രിംഗിനെയും ബാധിക്കുന്നു
പ്രവർത്തനങ്ങൾ

-s, -- അടുക്കുക
ഗ്രൂപ്പുചെയ്യുന്നതിന് മുമ്പ് ഇൻപുട്ട് അടുക്കുക; ഇത് ഇൻപുട്ട് സ്വമേധയാ പൈപ്പ് ചെയ്യേണ്ടതിന്റെ ആവശ്യകത ഇല്ലാതാക്കുന്നു
'അക്രമം' വഴി

ഫയല് ഓപ്പറേഷൻ ഓപ്ഷനുകൾ:
--കണിശതയില്ല
വ്യത്യസ്ത എണ്ണം ഫീൽഡുകളുള്ള ലൈനുകൾ അനുവദിക്കുക

--ഫില്ലർ=X
നഷ്ടപ്പെട്ട മൂല്യങ്ങൾ X ഉപയോഗിച്ച് പൂരിപ്പിക്കുക (സ്ഥിരസ്ഥിതി %s)

പൊതുവായ ഓപ്ഷനുകൾ:
-t, --ഫീൽഡ്-സെപ്പറേറ്റർ=X
ഫീൽഡ് ഡിലിമിറ്ററായി TAB-ന് പകരം X ഉപയോഗിക്കുക

--നാം NA/NaN മൂല്യങ്ങൾ ഒഴിവാക്കുക

-W, --വെളുത്ത ഇടം
ഫീൽഡ് ഡിലിമിറ്ററുകൾക്കായി വൈറ്റ്‌സ്‌പെയ്‌സ് (ഒന്നോ അതിലധികമോ സ്‌പെയ്‌സുകൾ കൂടാതെ/അല്ലെങ്കിൽ ടാബുകൾ) ഉപയോഗിക്കുക

-z, --പൂജ്യം-അവസാനിപ്പിച്ചു
0 ബൈറ്റ് ഉള്ള അവസാന വരികൾ, ന്യൂലൈനല്ല

--സഹായിക്കൂ ഈ സഹായം പ്രദർശിപ്പിച്ച് പുറത്തുകടക്കുക

--പതിപ്പ്
ഔട്ട്പുട്ട് പതിപ്പ് വിവരങ്ങളും പുറത്തുകടക്കുക

ലഭ്യമാണ് പ്രവർത്തനങ്ങൾ


ഫയല് പ്രവർത്തനങ്ങൾ:
മാറ്റുക ഇൻപുട്ട് ഫയലിന്റെ വരികളും നിരകളും മാറ്റുക

റിവേഴ്സ് ചെയ്യുക ഓരോ വരിയിലും വിപരീത ഫീൽഡ് ക്രമം

ലൈൻ-ഫിൽട്ടറിംഗ് പ്രവർത്തനങ്ങൾ:
rmdup തനിപ്പകർപ്പ് കീ മൂല്യമുള്ള വരികൾ നീക്കം ചെയ്യുക

പെർ-ലൈൻ പ്രവർത്തനങ്ങൾ:
ബേസ് 64 ഫീൽഡ് ബേസ്64 ആയി എൻകോഡ് ചെയ്യുക

debase64 ഫീൽഡ് base64 ആയി ഡീകോഡ് ചെയ്യുക, base64 സ്ട്രിംഗ് അസാധുവാണെങ്കിൽ പിശകോടെ പുറത്തുകടക്കുക

md5/sha1/sha256/sha512
ഫീൽഡ് മൂല്യത്തിന്റെ md5/sha1/sha256/sha512 ഹാഷ് കണക്കാക്കുക

റിവേഴ്സ് ചെയ്യുക ഓരോ വരിയിലും വിപരീത ഫീൽഡ് ക്രമം

സംഖ്യാ ഗ്രൂപ്പിംഗ് പ്രവർത്തനങ്ങൾ
തുക മൂല്യങ്ങളുടെ ആകെത്തുക

എന്നോട് കുറഞ്ഞ മൂല്യം

പരമാവധി പരമാവധി മൂല്യം

അബ്സ്മിൻ കേവല മൂല്യങ്ങളുടെ ഏറ്റവും കുറഞ്ഞത്

absmax കേവല മൂല്യങ്ങളുടെ പരമാവധി

ടെക്‌സ്‌ച്വൽ/ന്യൂമെറിക് ഗ്രൂപ്പിംഗ് പ്രവർത്തനങ്ങൾ
എണ്ണുക ഗ്രൂപ്പിലെ ഘടകങ്ങളുടെ എണ്ണം എണ്ണുക

ആദ്യം ഗ്രൂപ്പിന്റെ ആദ്യ മൂല്യം

അവസാനത്തെ ഗ്രൂപ്പിന്റെ അവസാന മൂല്യം

റാൻഡ് ഗ്രൂപ്പിൽ നിന്ന് ഒരു റാൻഡം മൂല്യം

അതുല്യമായ അദ്വിതീയ മൂല്യങ്ങളുടെ കോമയാൽ വേർതിരിച്ച അടുക്കിയ ലിസ്റ്റ്

ചുരുക്കുക എല്ലാ ഇൻപുട്ട് മൂല്യങ്ങളുടെയും കോമയാൽ വേർതിരിച്ച ലിസ്റ്റ്

എണ്ണമറ്റ അദ്വിതീയ/വ്യത്യസ്‌ത മൂല്യങ്ങളുടെ എണ്ണം

സ്റ്റാറ്റിസ്റ്റിക്കൽ ഗ്രൂപ്പിംഗ് പ്രവർത്തനങ്ങൾ
അർത്ഥമാക്കുന്നത് മൂല്യങ്ങളുടെ അർത്ഥം

മധ്യസ്ഥൻ ശരാശരി മൂല്യം

q1 ഒന്നാം ക്വാർട്ടൈൽ മൂല്യം

q3 മൂന്നാം ക്വാർട്ടൈൽ മൂല്യം

iqr ഇന്റർ-ക്വാർട്ടൈൽ ശ്രേണി

മോഡ് മോഡ് മൂല്യം (ഏറ്റവും സാധാരണമായ മൂല്യം)

ആന്റിമോഡ് ആന്റി-മോഡ് മൂല്യം (ഏറ്റവും കുറഞ്ഞ സാധാരണ മൂല്യം)

pstdev ജനസംഖ്യാ വ്യതിയാനം

sstdev സാമ്പിൾ സ്റ്റാൻഡേർഡ് ഡീവിയേഷൻ

pvar ജനസംഖ്യാ വ്യത്യാസം

ഉത്തരം സാമ്പിൾ വേരിയൻസ്

ഭ്രാന്തൻ സാധാരണ വിതരണങ്ങൾക്കായി സ്ഥിരമായ 1.4826 കൊണ്ട് സ്കെയിൽ ചെയ്ത മീഡിയൻ കേവല വ്യതിയാനം

മദ്രാ ശരാശരി കേവല വ്യതിയാനം, അളക്കാത്തത്

sskew (സാമ്പിൾ) ഗ്രൂപ്പിന്റെ വക്രത

pskew (ജനസംഖ്യ) ഗ്രൂപ്പിന്റെ വക്രത
മൂല്യങ്ങൾ x റിപ്പോർട്ട് ചെയ്തത് 'sskew', 'pskew' പ്രവർത്തനങ്ങൾ:
x > 0 - പോസിറ്റീവായി ചരിഞ്ഞ / വളഞ്ഞ വലത്
0 > x - നെഗറ്റീവായി ചരിഞ്ഞ / ഇടത് വശത്തേക്ക്
x > 1 - വളരെ വളഞ്ഞ വലത്
1 > x > 0.5 - വലത്തേക്ക് മിതമായ ചരിഞ്ഞത്
0.5 > x > -0.5 - ഏകദേശം സമമിതി
-0.5 > x > -1 - ഇടത്തേക്ക് മിതമായ ചരിഞ്ഞത്
-1 > x - വളരെ വളഞ്ഞ ഇടത്

പാവാട (സാമ്പിൾ) ഗ്രൂപ്പിന്റെ അധിക കുർട്ടോസിസ്

pkurt (ജനസംഖ്യ) ഗ്രൂപ്പിന്റെ അധിക കുർട്ടോസിസ്

ജാർക് സാധാരണ നിലയ്ക്കുള്ള ജാർക്-ബീറ്റ ടെസ്റ്റിന്റെ p-മൂല്യം

dpo ഡി'അഗോസ്റ്റിനോ-പിയേഴ്സൺ ഓമ്‌നിബസ് ടെസ്റ്റിന്റെ p-മൂല്യം നോർമാലിറ്റിക്കായി;
'jarque', 'dpo' പ്രവർത്തനങ്ങൾക്ക്:
ശൂന്യമായ സിദ്ധാന്തം സാധാരണമാണ്;
കുറഞ്ഞ പി-മൂല്യങ്ങൾ നോൺ-നോർമൽ ഡാറ്റയെ സൂചിപ്പിക്കുന്നു;
ഉയർന്ന പി-മൂല്യങ്ങൾ സൂചിപ്പിക്കുന്നത് ശൂന്യമായ സിദ്ധാന്തം നിരസിക്കാൻ കഴിയില്ല എന്നാണ്.

ഉദാഹരണങ്ങൾ


കോളം 1-ൽ നിന്ന് മൂല്യങ്ങളുടെ ആകെത്തുകയും ശരാശരിയും പ്രിന്റ് ചെയ്യുക:

$ seq 10 | ഡാറ്റമാഷ് തുക 1 അർത്ഥമാക്കുന്നത് 1
55 5.5

ഫീൽഡ് 1 അടിസ്ഥാനമാക്കിയുള്ള ഗ്രൂപ്പ് ഇൻപുട്ടും ഫീൽഡ് 2-ലെ ആകെ മൂല്യങ്ങളും (ഒരു ഗ്രൂപ്പിന്):

$ cat example.txt
A10
A5
B 9
B 11
$ ഡാറ്റമാഷ് -g 1 തുക 2 < example.txt
A15
B 20

അടുക്കാത്ത ഇൻപുട്ട് അടുക്കിയിരിക്കണം ('-s' ഉപയോഗിച്ച്):

$ cat example.txt
A10
C 4
B 9
C 1
A5
B 11
$ ഡാറ്റമാഷ് -s -g1 തുക 2 < example.txt
A15
B 20
C 5

ഇതിന് തുല്യമാണ്:

$ cat example.txt | അടുക്കുക -k1,1 | ഡാറ്റമാഷ് -ജി 1 തുക 2

ഉപയോഗം -h (--തലക്കെട്ടുകൾ) ഇൻപുട്ട് ഫയലിന് ഒരു ഹെഡർ ലൈൻ ഉണ്ടെങ്കിൽ:

# വിദ്യാർത്ഥിയുടെ പേര്, ഫീൽഡ്, ടെസ്റ്റ് സ്കോർ എന്നിവ അടങ്ങിയ ഒരു ഫയൽ നൽകിയിരിക്കുന്നു...
$ തല -n5 scores_h.txt
പേര് പ്രധാന സ്കോർ
ഷോൺ എഞ്ചിനീയറിംഗ് 47
കാലേബ് ബിസിനസ്സ് 87
ക്രിസ്ത്യൻ ബിസിനസ്സ് 88
ഡെറക് ആർട്ട്സ് 60

# ഓരോ മേജറിനും ശരാശരിയും സ്റ്റാൻഡേർഡ് ഡിവിയനും കണക്കാക്കുക
$ ഡാറ്റമാഷ് --sort --headers --group 2 അർത്ഥമാക്കുന്നത് 3 pstdev 3 < scores_h.txt
(അല്ലെങ്കിൽ ഹ്രസ്വ രൂപം ഉപയോഗിക്കുക)
$ ഡാറ്റമാഷ് -sH -g2 അർത്ഥമാക്കുന്നത് 3 pstdev 3 < scores_h.txt
(അല്ലെങ്കിൽ പേരുള്ള കോളങ്ങൾ ഉപയോഗിക്കുക)
$ ഡാറ്റമാഷ് -sH -g മേജർ ശരാശരി സ്കോർ pstdev സ്കോർ < scores_h.txt
ഗ്രൂപ്പ്ബൈ(മേജർ) ശരാശരി(സ്കോർ) pstdev(സ്കോർ)
കല 68.9 10.1
ബിസിനസ്സ് 87.3 4.9
എഞ്ചിനീയറിംഗ് 66.5 19.1
ആരോഗ്യ-മരുന്ന് 90.6 8.8
ലൈഫ്-സയൻസസ് 55.3 19.7
സോഷ്യൽ സയൻസ് 60.2 16.6

ഓരോ വരിയിലും റിവേഴ്സ് ഫീൽഡ് ഓർഡർ:

$ seq 6 | പേസ്റ്റ് - - | ഡാറ്റമാഷ് റിവേഴ്സ് ചെയ്യുക
2 1
4 3
6 5

വരികളും നിരകളും മാറ്റുക:

$ seq 6 | പേസ്റ്റ് - - | ഡാറ്റമാഷ് മാറ്റുക
1 3 5
2 4 6

കോളം 1-ൽ നിന്ന് ഡ്യൂപ്ലിക്കേറ്റ് കീ മൂല്യമുള്ള വരികൾ നീക്കം ചെയ്യുക (ഇഷ്ടപ്പെടാതെ ആദ്യം,അവസാനത്തെ പ്രവർത്തനങ്ങൾ, rmdup
വളരെ വേഗതയുള്ളതാണ് കൂടാതെ -s ഉപയോഗിച്ച് ഫയൽ അടുക്കേണ്ട ആവശ്യമില്ല):

# ഫയലുകളുടെയും സാമ്പിൾ ഐഡികളുടെയും ഒരു ലിസ്റ്റ് നൽകിയിരിക്കുന്നു:
$ പൂച്ച ഇൻപുട്ട്
സാമ്പിൾ ഐഡി ഫയൽ
2 cc.txt
3 dd.txt
1 ab.txt
2 ee.txt
3 ff.txt

# ഡ്യൂപ്ലിക്കേറ്റഡ് സാമ്പിൾ-ഐഡി ഉപയോഗിച്ച് വരികൾ നീക്കം ചെയ്യുക (നിര 1):
$ ഡാറ്റമാഷ് rmdup 1 < INPUT
(അല്ലെങ്കിൽ കോളം എന്ന പേര് ഉപയോഗിച്ചു)
$ ഡാറ്റമാഷ് -H rmdup സാമ്പിൾ ഐഡി < ഇൻപുട്ട്
സാമ്പിൾ ഐഡി ഫയൽ
2 cc.txt
3 dd.txt
1 ab.txt

ഓരോ TXT ഫയലിന്റെയും sha1 മൂല്യം കണക്കാക്കിയ ശേഷം sha1 ഹാഷ് മൂല്യം കണക്കാക്കുക
ഫയലിന്റെ ഉള്ളടക്കം:

$ sha1sum *.txt | ഡാറ്റമാഷ് -Wf sha1 2

അധിക വിവരം


GNU Datamash വെബ്സൈറ്റ് കാണുക (http://www.gnu.org/software/datamash)

onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് ഡാറ്റമാഷ് ഓൺലൈനായി ഉപയോഗിക്കുക



ഏറ്റവും പുതിയ ലിനക്സ്, വിൻഡോസ് ഓൺലൈൻ പ്രോഗ്രാമുകൾ