datamash - 클라우드에서의 온라인

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 명령 datamash입니다.

프로그램:

이름


datamash - 명령줄 계산

개요


데이터매쉬 [OPTION] op [대장균의 뜻] [op 대장균의 뜻 ...]

기술


stdin의 입력에 대해 숫자/문자열 작업을 수행합니다.

'op'는 수행할 작업입니다. 그룹화의 경우 행별 작업 'col'이 입력입니다.
사용할 필드; 'col'은 숫자(1=첫 번째 필드)이거나 다음을 사용할 때 열 이름일 수 있습니다. -H or
--헤더인 옵션을 제공합니다.

입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 작업 :
조옮김, 반전

라인 필터링 작업 :
rmdup

라인당 작업 :
base64, debase64, md5, sha1, sha256, sha512

숫자 그룹화 작업 :
합계, 최소, 최대, 절대, 절대 최대

텍스트/숫자 그룹화 작업 :
개수, 처음, 마지막, 랜드, 고유, 축소, 고유 개수

통계적인 그룹화 작업 :
평균, 중앙값, q1, q3, iqr, 모드, 반대 모드, pstdev, sstdev, pvar svar, mad, madraw,
pskew, sskew, pkurt, skurt, dpo, jarque

옵션


그룹화 옵션 :
-f, --가득한
작업 결과 앞에 전체 입력 줄을 인쇄합니다(기본값: 그룹화된 키만 인쇄)

-g, --그룹=X[,와이,지]
필드 X,[Y,Z]를 통한 그룹화

--헤더인
첫 번째 입력 줄은 열 머리글입니다.

--헤더 아웃
열 헤더를 첫 번째 줄로 인쇄

-H, --헤더
'--header-in과 동일 --헤더 아웃'

-i, --대소문자 무시
텍스트를 비교할 때 대문자/소문자를 무시합니다. 이는 그룹화 및 문자열에 영향을 미칩니다.
운영

-s, --종류
그룹화하기 전에 입력을 정렬하십시오. 이렇게 하면 입력을 수동으로 파이프할 필요가 없습니다.
'정렬'을 통해

입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 조작 옵션 :
--엄격하지 않음
다양한 수의 필드가 있는 라인 허용

--필러=X
X로 누락된 값 채우기(기본값 %s)

일반 옵션 :
-t, --필드 구분자=X
필드 구분 기호로 TAB 대신 X 사용

--narm NA/NaN 값 건너뛰기

-W, --공백
필드 구분 기호에 공백(하나 이상의 공백 및/또는 탭)을 사용합니다.

-z, --제로 종료
줄바꿈이 아닌 0바이트로 줄 끝

--도움 이 도움말 종료를 표시

--번역
출력 버전 정보를 출력하고 종료

유효한 작전


입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 작업 :
바꾸어 놓다 입력 파일의 행, 열 바꾸기

각 줄의 역순 필드

라인 필터링 작업 :
rmdup 키 값이 중복된 줄 제거

라인당 작업 :
base64 필드를 base64로 인코딩

디베이스64 필드를 base64로 디코딩하고, base64 문자열이 유효하지 않으면 오류와 함께 종료됩니다.

md5/sha1/sha256/sha512
필드 값의 md5/sha1/sha256/sha512 해시를 계산합니다.

각 줄의 역순 필드

숫자 그룹화 운영
가치의 합

최소값

최대 최대 값

압스민 절대값의 최소값

앱스맥스 절대값의 최대값

텍스트/숫자 그룹화 운영
계산 그룹의 요소 수 계산

먼저 그룹의 첫 번째 값

지난 그룹의 마지막 값

랜드 그룹에서 임의의 값 하나

유일한 쉼표로 구분된 정렬된 고유 값 목록

붕괴 모든 입력 값의 쉼표로 구분된 목록

카운트 유니크 고유/고유 값의 수

통계적인 그룹화 운영
평균 값의 평균

중앙 분리대 중앙값

q1 1사분위 값

q3 3사분위 값

iqr 사분위간 범위

모드 모드 값(가장 일반적인 값)

안티모드 안티 모드 값(최소 공통 값)

pstdev 모집단 표준편차

sstdev 표본 표준 편차

피바르 인구 분산

스바르 표본 분산

미친 정규 분포에 대해 상수 1.4826으로 조정된 중앙값 절대 편차

마드로 중앙값 절대 편차, 비척도

삐뚤어지다 (샘플) 그룹의 왜도

pskew (인구) 그룹의 왜도
'sskew' 및 'pskew' 작업으로 보고된 값 x:
x > 0 - 양으로 기울어짐/오른쪽으로 기울어짐
0 > x - 부정적으로 기울어짐/왼쪽으로 기울어짐
x > 1 - 오른쪽으로 크게 치우침
1 > x > 0.5 - 약간 오른쪽으로 치우침
0.5 > x > -0.5 - 대략 대칭
-0.5 > x > -1 - 약간 왼쪽으로 치우침
-1 > x - 심하게 왼쪽으로 치우침

스커트 (샘플) 그룹의 초과 첨도

푸쿠르트 (인구) 그룹의 초과 첨도

자크 정규성에 대한 Jarque-Beta 검정의 p-값

DPO 정규성에 대한 D'Agostino-Pearson Omnibus 검정의 p-값;
'jarque' 및 'dpo' 작업의 경우:
귀무 가설은 정규성입니다.
낮은 p-값은 비정규 데이터를 나타냅니다.
높은 p-값은 귀무가설을 기각할 수 없음을 나타냅니다.

사용 예


열 1의 값의 합계와 평균을 인쇄합니다.

$ 시퀀스 10 | 데이터매쉬 합계 1 평균 1
55 5.5

필드 1을 기반으로 한 그룹 입력 및 필드 2의 합계 값(그룹당):

$ 고양이 example.txt
10
5
B 9
B 11
$ 데이터매쉬 -g 1 합계 2 < example.txt
15
B 20

정렬되지 않은 입력은 정렬되어야 합니다('-s' 사용):

$ 고양이 example.txt
10
C 4
B 9
C 1
5
B 11
$ 데이터매쉬 -s -g1 합계 2 < example.txt
15
B 20
C 5

다음과 같습니다.

$ 고양이 example.txt | 정렬 -k1,1 | 데이터매쉬 -g 1 합계 2

-h (--헤더) 입력 파일에 헤더 줄이 있는 경우:

# 학생 이름, 분야, 시험 점수가 포함된 파일이 제공됩니다...
$ 헤드 -n5 Score_h.txt
이름 전공점수
숀 엔지니어링 47
케일럽 비즈니스 87
기독교 비즈니스 88
데릭 예술 60

# 각 전공의 평균과 표준편차를 계산합니다.
$ 데이터매쉬 --sort --headers --group 2는 3 pstdev 3 < Score_h.txt를 의미합니다.
(또는 짧은 형식을 사용하세요)
$ 데이터매쉬 -sH -g2 평균 3 pstdev 3 < 점수_h.txt
(또는 명명된 열 사용)
$ 데이터매쉬 -sH -g 주요 평균 점수 pstdev 점수 < Score_h.txt
GroupBy(주요) 평균(점수) pstdev(점수)
예술 68.9 10.1
사업 87.3 4.9
공학 66.5 19.1
건강의학 90.6 8.8
생명과학 55.3 19.7
사회계열 60.2 16.6

각 줄의 필드 순서를 반대로 합니다.

$ 시퀀스 6 | 붙여넣기 - - | 데이터매쉬
2 1
4 3
6 5

행, 열 바꾸기:

$ 시퀀스 6 | 붙여넣기 - - | 데이터매쉬 바꾸어 놓다
+ 1 3 5
+ 2 4 6

열 1에서 중복된 키 값이 있는 줄을 제거합니다. 먼저,지난 작업, rmdup
훨씬 빠르며 -s를 사용하여 파일을 정렬할 필요가 없습니다.

# 주어진 파일 목록과 샘플 ID:
$ 고양이 입력
샘플 ID 파일
2cc.txt
3dd.txt
1 ab.txt
2ee.txt
3 ff.txt

# 중복된 Sample-ID(열 1)가 있는 행을 제거합니다.
$ 데이터매쉬 rmdup 1 < 입력
(또는 명명된 열을 사용함)
$ 데이터매쉬 -H rmdup SampleID < 입력
샘플 ID 파일
2cc.txt
3dd.txt
1 ab.txt

각 TXT 파일의 sha1 값을 계산한 후 각 TXT 파일의 sha1 해시 값을 계산합니다.
파일 내용:

$ sha1sum *.txt | 데이터매시 -Wf sha1 2

추가 정보


GNU Datamash 웹사이트(http://www.gnu.org/software/datamash)

onworks.net 서비스를 사용하여 온라인으로 데이터매시를 사용하세요



최신 Linux 및 Windows 온라인 프로그램