ডেটাম্যাশ - ক্লাউডে অনলাইন

এই কমান্ড ডেটাম্যাশ যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।

কার্যক্রম:

NAME এর


ডেটাম্যাশ - কমান্ড-লাইন গণনা

সাইনোপিসিস


ডেটাম্যাশ [অনুযায়ী OPTION] op [পর্বতমালার টোল] [op পর্বতমালার টোল ...]

বর্ণনাঃ


stdin থেকে ইনপুটে সাংখ্যিক/স্ট্রিং অপারেশন করে।

'অপ' হল অপারেশন করা; গ্রুপিংয়ের জন্য, প্রতি-লাইন অপারেশন 'col' হল ইনপুট
ব্যবহার করার জন্য ক্ষেত্র; ব্যবহার করার সময় 'col' একটি সংখ্যা (1=প্রথম ক্ষেত্র), অথবা একটি কলামের নাম হতে পারে -H or
--হেডার-ইন অপশন।

ফাইল কার্যক্রম:
স্থানান্তর, বিপরীত

লাইন-ফিল্টারিং কার্যক্রম:
rmdup

প্রতি লাইন কার্যক্রম:
base64, debase64, md5, sha1, sha256, sha512

সাংখ্যিক গোষ্ঠী কার্যক্রম:
যোগফল, মিন, সর্বোচ্চ, absmin, absmax

পাঠ্য/সংখ্যাসূচক গোষ্ঠী কার্যক্রম:
গণনা, প্রথম, শেষ, র্যান্ড, অনন্য, পতন, গণনা

পরিসংখ্যানসংক্রান্ত গোষ্ঠী কার্যক্রম:
গড়, মধ্যমা, q1, q3, iqr, মোড, অ্যান্টিমোড, pstdev, sstdev, pvar svar, mad, madraw,
pskew, sskew, pkurt, skurt, dpo, jarque

বিকল্প


গোষ্ঠী বিকল্প:
-f, --সম্পূর্ণ
অপের ফলাফলের আগে সম্পূর্ণ ইনপুট লাইন মুদ্রণ করুন (ডিফল্ট: শুধুমাত্র গোষ্ঠীভুক্ত কীগুলি মুদ্রণ করুন)

-g, --গ্রুপ=X[,Y,Z]
X,[Y,Z] ফিল্ডের মাধ্যমে গ্রুপ

--হেডার-ইন
প্রথম ইনপুট লাইন হল কলাম হেডার

--হেডার-আউট
প্রথম লাইন হিসাবে কলাম হেডার মুদ্রণ করুন

-H, -- শিরোনাম
same as '--হেডার-ইন --হেডার-আউট'

-i, --অবহেলার ঘটনা
টেক্সট তুলনা করার সময় আপার/লোয়ার কেস উপেক্ষা করুন; এটি গ্রুপিং এবং স্ট্রিংকে প্রভাবিত করে
অপারেশন

-s, --সাজান
গ্রুপ করার আগে ইনপুট সাজান; এটি ম্যানুয়ালি ইনপুট পাইপ করার প্রয়োজনকে সরিয়ে দেয়
'বাছাই' মাধ্যমে

ফাইল অপারেশন বিকল্প:
--না-কঠোর
বিভিন্ন সংখ্যক ক্ষেত্র সহ লাইনের অনুমতি দিন

--ফিলার=X
X দিয়ে অনুপস্থিত মান পূরণ করুন (ডিফল্ট %s)

সাধারণ বিকল্প:
-t, --ক্ষেত্র-বিভাজক=X
ক্ষেত্র বিভেদক হিসাবে TAB-এর পরিবর্তে X ব্যবহার করুন

--নর্ম NA/NaN মানগুলি এড়িয়ে যান

-W, --শ্বেত স্থান
ক্ষেত্রের ডিলিমিটারের জন্য হোয়াইটস্পেস (এক বা একাধিক স্পেস এবং/অথবা ট্যাব) ব্যবহার করুন

-z, --শূন্য-সমাপ্ত
0 বাইট সহ শেষ লাইন, নতুন লাইন নয়

--help এই সাহায্য প্রদর্শন এবং প্রস্থান করুন

--সংস্করণ
আউটপুট সংস্করণ তথ্য এবং প্রস্থান

উপলভ্য অপারেশনস


ফাইল কার্যক্রম:
স্থানান্তর ইনপুট ফাইলের সারি, কলাম স্থানান্তর করুন

বিপরীত প্রতিটি লাইনে বিপরীত ক্ষেত্রের ক্রম

লাইন-ফিল্টারিং কার্যক্রম:
rmdup সদৃশ কী মান সহ লাইনগুলি সরান

প্রতি লাইন কার্যক্রম:
base64 ক্ষেত্রটিকে base64 হিসাবে এনকোড করুন

debase64 বেস64 হিসাবে ক্ষেত্রটিকে ডিকোড করুন, বেস64 স্ট্রিং অবৈধ হলে ত্রুটি সহ প্রস্থান করুন

md5/sha1/sha256/sha512
ক্ষেত্রের মানের md5/sha1/sha256/sha512 হ্যাশ গণনা করুন

বিপরীত প্রতিটি লাইনে বিপরীত ক্ষেত্রের ক্রম

সাংখ্যিক গোষ্ঠী অপারেশন
সমষ্টি মানের যোগফল

মিনিট সর্বনিম্ন মান

সর্বোচ্চ সর্বোচ্চ মূল্য

absmin সর্বনিম্ন পরম মান

absmax পরম মান সর্বোচ্চ

পাঠ্য/সংখ্যাসূচক গোষ্ঠী অপারেশন
গণনা গ্রুপে উপাদান সংখ্যা গণনা

প্রথম গ্রুপের প্রথম মান

গত গ্রুপের শেষ মান

র্যান্ড্ গ্রুপ থেকে একটি এলোমেলো মান

অনন্য অনন্য মানগুলির কমা দ্বারা বিভক্ত বাছাই করা তালিকা

পতন সমস্ত ইনপুট মানগুলির কমা দ্বারা পৃথক করা তালিকা৷

স্বতন্ত্র অনন্য/স্বতন্ত্র মানের সংখ্যা

পরিসংখ্যানসংক্রান্ত গোষ্ঠী অপারেশন
গড় মানগুলির গড়

মধ্যমা মাঝারি মান

q1 1ম চতুর্থাংশ মান

q3 3য় চতুর্থাংশ মান

iqr আন্তঃ-চতুর্থাংশ পরিসীমা

মোড মোড মান (সবচেয়ে সাধারণ মান)

অ্যান্টিমোড অ্যান্টি-মোড মান (সর্বনিম্ন সাধারণ মান)

pstdev জনসংখ্যার মান বিচ্যুতি

sstdev নমুনা স্ট্যান্ডার্ড বিচ্যুতি

pvar জনসংখ্যার পার্থক্য

উত্তর নমুনা বৈচিত্র্য

পাগল মাঝারি পরম বিচ্যুতি, স্বাভাবিক বিতরণের জন্য ধ্রুবক 1.4826 দ্বারা স্কেল করা হয়েছে

madraw মধ্যম পরম বিচ্যুতি, আনস্কেলড

sskew (নমুনা) দলের skewness

pskew (জনসংখ্যা) গোষ্ঠীর তির্যকতা
'sskew' এবং 'pskew' অপারেশন দ্বারা রিপোর্ট করা মান x:
x > 0 - ইতিবাচকভাবে তির্যক / ডানদিকে তির্যক
0 > x - নেতিবাচকভাবে তির্যক / বাম দিকে তির্যক
x > 1 - অত্যন্ত তির্যক ডানদিকে
1 > x > 0.5 - মাঝারিভাবে ডানদিকে তির্যক
0.5 > x > -0.5 - প্রায় প্রতিসম
-0.5 > x > -1 - মাঝারিভাবে বাম দিকে তির্যক
-1 > x - অত্যন্ত বাঁদিকে তির্যক

স্কার্ট (নমুনা) গ্রুপের অতিরিক্ত কার্টোসিস

pkurt (জনসংখ্যা) গ্রুপের অতিরিক্ত কার্টোসিস

জার্ক স্বাভাবিকতার জন্য জার্ক-বিটা পরীক্ষার p-মান

ডিপিও স্বাভাবিকতার জন্য ডি'আগোস্টিনো-পিয়ারসন অমনিবাস পরীক্ষার p-মান;
'jarque' এবং 'dpo' অপারেশনের জন্য:
নাল অনুমান স্বাভাবিকতা;
কম পি-মানগুলি অ-স্বাভাবিক ডেটা নির্দেশ করে;
উচ্চ পি-মান ইঙ্গিত করে যে নাল-অনুমান প্রত্যাখ্যান করা যাবে না।

উদাহরণ


কলাম 1 থেকে মানের যোগফল এবং গড় মুদ্রণ করুন:

$ seq 10 | ডেটাম্যাশ যোগফল 1 মানে 1
55 5.5

ক্ষেত্র 1 এর উপর ভিত্তি করে গ্রুপ ইনপুট, এবং ক্ষেত্র 2-এ যোগফলের মান (প্রতি গ্রুপ):

$ cat example.txt
একটি 10
একটি 5
বি 9
বি 11
$ ডেটাম্যাশ -g 1 যোগফল 2 < example.txt
একটি 15
বি 20

সাজানো না হওয়া ইনপুট অবশ্যই সাজাতে হবে ('-s' সহ):

$ cat example.txt
একটি 10
সি 4
বি 9
সি 1
একটি 5
বি 11
$ ডেটাম্যাশ -s -g1 যোগফল 2 < example.txt
একটি 15
বি 20
সি 5

যা সমতুল্য:

$ cat example.txt | সাজান -k1,1 | ডেটাম্যাশ -g 1 যোগফল 2

ব্যবহার -h (--হেডার) যদি ইনপুট ফাইলের একটি হেডার লাইন থাকে:

# শিক্ষার্থীর নাম, ক্ষেত্র, পরীক্ষার স্কোর সহ একটি ফাইল দেওয়া হয়েছে...
$ head -n5 scores_h.txt
নাম প্রধান স্কোর
শন ইঞ্জিনিয়ারিং 47
কালেব ব্যবসা 87
খ্রিস্টান ব্যবসা 88
ডেরেক আর্টস 60

# প্রতিটি প্রধানের জন্য গড় এবং মানক ডেভিয়ান গণনা করুন
$ ডেটাম্যাশ --sort --headers --group 2 মানে 3 pstdev 3 < scores_h.txt
(বা সংক্ষিপ্ত ফর্ম ব্যবহার করুন)
$ ডেটাম্যাশ -sH -g2 মানে 3 pstdev 3 < scores_h.txt
(বা নামযুক্ত কলাম ব্যবহার করুন)
$ ডেটাম্যাশ -sH -g মেজর গড় স্কোর pstdev স্কোর < scores_h.txt
GroupBy(মেজর) গড়(স্কোর) pstdev(স্কোর)
আর্টস 68.9 10.1
ব্যবসা 87.3 4.9
ইঞ্জিনিয়ারিং 66.5 19.1
স্বাস্থ্য-মেডিসিন 90.6 8.8
জীবন-বিজ্ঞান 55.3 19.7
সামাজিক-বিজ্ঞান 60.2 16.6

প্রতিটি লাইনে বিপরীত ক্ষেত্রের ক্রম:

$ seq 6 | পেস্ট - - | ডেটাম্যাশ বিপরীত
2 1
4 3
6 5

সারি, কলাম স্থানান্তর করুন:

$ seq 6 | পেস্ট - - | ডেটাম্যাশ স্থানান্তর
1 3 5
2 4 6

কলাম 1 থেকে ডুপ্লিকেট কী মান সহ লাইনগুলি সরান (অপছন্দ প্রথম,গত অপারেশন, rmdup
অনেক দ্রুত এবং ফাইলটি -s দিয়ে সাজানোর প্রয়োজন নেই):

# ফাইল এবং নমুনা আইডিগুলির একটি তালিকা দেওয়া হয়েছে:
$ বিড়াল ইনপুট
স্যাম্পলআইডি ফাইল
2 cc.txt
3 dd.txt
1 ab.txt
2 ee.txt
3 ff.txt

# সদৃশ নমুনা-আইডি (কলাম 1) সহ লাইনগুলি সরান:
$ ডেটাম্যাশ rmdup 1 < ইনপুট
(অথবা ব্যবহৃত নাম কলাম)
$ ডেটাম্যাশ -H rmdup SampleID < INPUT
স্যাম্পলআইডি ফাইল
2 cc.txt
3 dd.txt
1 ab.txt

প্রতিটি TXT ফাইলের sha1 হ্যাশ মান গণনা করুন, প্রতিটির sha1 মান গণনা করার পরে
ফাইলের বিষয়বস্তু:

$ sha1sum *.txt | datamash -Wf sha1 2

অতিরিক্ত তথ্য


GNU Datamash ওয়েবসাইট দেখুন (http://www.gnu.org/software/datamash)

onworks.net পরিষেবা ব্যবহার করে অনলাইনে ডেটাম্যাশ ব্যবহার করুন



সর্বশেষ লিনাক্স এবং উইন্ডোজ অনলাইন প্রোগ্রাম