메릴 - 클라우드의 온라인

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 meryl 명령입니다.

프로그램:

이름


meryl - 코어 내부 및 외부 kmer 계산 및 유틸리티

개요


추정 기억 기타 요건
메릴 -P -m 크메르크기 [-c #] [-p] -s seq.fasta

메릴 -P -m 크메르크기 [-c #] [-p] -n 머카운트

건물 a 테이블
메릴 -B -m 크메르크기 [-c #] [-p] [-v] [-f|-r|-C] [-L 미미한 발생] [-U 최대 발생]
[- 스레드 n | {-세그먼트 세그먼트 | -기억 메가 바이트} [-configbatch [-sge 직업 이름]]]
-s seq.fasta -o tblprefix

메릴 -카운트배치 번호 [-sgebuild "qsuboptionstring"] -o tblprefix

메릴 -병합 배치 번호 [-sgemerge "qsuboptionstring"] -o tblprefix

공연 운영 on a 테이블
메릴 -M 조작 [-v] -s tblprefix [-s tblprefix2 ...] -o 출력

덤핑 a 테이블
메릴 -디 -s tblprefix

메릴 -DT -n 최소 개수 -s tblprefix

기술


메릴 게놈 서열의 kmer 함량을 계산합니다. Kmer 콘텐츠는 다음과 같이 표시됩니다.
kmers 목록과 입력 시퀀스에서 각각 발생하는 횟수입니다. kmer는 다음과 같습니다.
순방향 kmer, 역방향 kmer 또는 표준 kmer로만 제한됩니다.
(각 위치에서 순방향 및 역방향 kmer가 사전순으로 더 작습니다). 메릴
카운트 히스토그램, kmers 목록 및 해당 카운트를 보고하거나 수행할 수 있습니다.
처리된 데이터 파일에 대한 수학적 및 집합 연산.

의 출력 메릴 meryl 데이터베이스라고 불리는 두 개의 바이너리 파일입니다.
개수의 히스토그램 또는 실제 개수를 제공하기 위해 덤프됩니다. C++ 라이브러리가 제공됩니다.
파일에 직접 액세스할 수 있습니다.

옵션


-P 메모리 요구 사항을 추정합니다. 주어진 시퀀스 파일(-s) 또는 상한
파일의 mer 수(-n), 테이블 크기를 계산합니다(-t 빌드 중) 최소화
메모리 사용량. 이 모드는 다음 옵션을 인식합니다.

-m # 메르 크기 (필수)

-c # 호모폴리머 압축(선택 사항)

-p 위치 활성화

-s seq.fasta
메르 수를 결정하기 위해 스캔할 시퀀스 파일

-n # 이만큼의 메르가 포함된 파일을 가정하여 매개변수를 계산합니다.

중 하나만 -s, -n 지정해야 합니다. 둘 다 주어지면, -s 우선합니다.

-B 시퀀스 파일이 주어지면 mer-count 테이블을 계산합니다(-s) 및 많은 매개변수. 에 의해
기본적으로 두 가닥이 모두 처리됩니다.

-f 앞쪽 스트랜드용으로만 제작

-r 역방향 스트랜드용으로만 제작

-C 정식 메르 사용(두 가닥을 모두 가정)

-L # #회 미만으로 발생하는 메르를 저장하지 마세요.

-U # #회 이상 발생하는 메르를 저장하지 마세요.

-m # 메르 크기 (필수)

-c # 호모폴리머 압축(선택 사항)

-p 위치 활성화

-s seq.fasta
테이블을 만드는 순서

-o tblprefix
출력 테이블 접두사

-v 사용자를 즐겁게 하다

XNUMXD덴탈의 메릴 프로세스는 하나의 대규모 메모리 배치, 여러 개의 작은 메모리 배치에서 실행될 수 있습니다.
또는 SGE 제어 하에 다중 CPU 코어를 사용하거나 사용하지 않고 모두 가능합니다. 기본적으로,
계산은 하나의 대규모 순차적 프로세스로 수행됩니다. 다중 스레드 작업
세그먼트 작업과 마찬가지로 추가 메모리 비용으로 가능합니다.
I/O 비용.

스레드 된 조작
계산을 거의 동일한 크기의 조각으로 나눕니다. 이는 추가 비용을 사용합니다.
hMB(에서 -P) 스레드당.

- 스레드 n
사용 n 빌드할 스레드

분할, 잇달아 일어나는 조작
mMB 이하의 크기로 계산을 분할합니다.
메모리 또는 n개의 동일한 크기 조각으로 구성됩니다. 각 조각은 순차적으로 계산됩니다.
결과는 마지막에 병합됩니다. 다음 중 하나만 -기억-세그먼트 is
필요합니다.

-기억 m
기껏해야 사용 m 세그먼트당 메모리 MB

-세그먼트 n
사용 n 세그먼트

분할, 일괄 처리 조작
각 세그먼트를 수동으로 실행할 수 있다는 점을 제외하면 순차와 동일합니다.
병행하여. 다음 중 하나만 -기억-세그먼트 필요합니다. 또한
이 페이지의 섹션.

-기억 m
기껏해야 사용 m 세그먼트당 메모리 MB

-세그먼트 n
사용 n 세그먼트

-configbatch
배치를 생성

-카운트배치 n
배치 번호 실행 n

-병합 배치
배치를 병합하다

일괄 처리 모드는 그리드에서 실행될 수 있습니다.

-sge 직업 이름
이 실행에 대한 고유한 작업 이름입니다. 메릴 이름이 있는 작업을 제출합니다.
mp직업 이름, 체크 안함직업 이름, nm직업 이름, 단계의 준비, 계산 및 병합.

-sgebuild "옵션"

-sgemerge "옵션"
추가 옵션 qsub(1) (예: "-p -153 -체육 스레드 2 -A
meryaccount") 참고 - -N 무시됩니다. NB - 반드시 인용하세요.
옵션

-M 테이블 목록이 주어지면 수학, 논리 또는 임계값 작업을 수행합니다. 하지 않는 한
지정하면 모든 작업은 원하는 수의 데이터베이스를 사용합니다. 수학 연산은 다음과 같습니다.

count는 모든 데이터베이스의 최소 개수입니다. mer가 존재하지 않는 경우
모든 데이터베이스에서 mer의 개수는 XNUMX이며 출력에 포함되지 않습니다.

마이넥스트
count는 mer를 포함하는 모든 데이터베이스의 최소 개수입니다.

최대 count는 모든 데이터베이스의 최대 개수입니다.

더하다 count는 모든 데이터베이스에 대한 개수의 합계입니다.

이하 count는 첫 번째 빼기 두 번째입니다(이진수에만 해당).

ABS count는 첫 번째에서 두 번째를 뺀 값의 절대값입니다(이진수에만 해당).

논리 연산은 다음과 같습니다.

모든 데이터베이스에 존재하는 경우 mer를 출력합니다.

낸드 전부는 아니지만 적어도 하나의 데이터베이스에 존재하는 경우 mer를 출력합니다.

or 적어도 하나의 데이터베이스에 존재하는 경우 mer를 출력합니다.

xor 홀수 개의 데이터베이스에 존재하는 경우 mer를 출력합니다.

임계값 작업은 다음과 같습니다.

보다 적은 x
count < x인 경우 mer를 출력합니다.

보다 작음 x
개수 <= x인 경우 mer를 출력합니다.

보다 큰 x
count > x인 경우 mer를 출력합니다.

보다 큼 x
count >= x인 경우 mer를 출력합니다.

같은 x
개수 == x가 있는 경우 mer를 출력합니다.

임계값 작업은 정확히 하나의 데이터베이스에서 작동합니다.

-s tblprefix
사용 tblprefix 데이터베이스로

-o tblprefix
이 출력을 생성

-v 사용자를 즐겁게 하다

-D 덤프 테이블(모두 작동하는 것은 아님)

-DD 동일한 메르 사이의 거리에 대한 히스토그램을 덤프합니다.

-DT 덤프 메르 >= 임계값. 사용 -n 임계값을 지정합니다.

-DC 메르, 개별 메르, 고유 메르의 수를 셉니다.

-디 mer 개수의 히스토그램을 (stdout으로) 덤프합니다.

-s 여기에서 개수 테이블을 읽습니다(.mcdat 또는 .mcidx는 제외).


일괄 창조 of a 테이블
다음을 사용하여 컴퓨팅을 초기화합니다. -configbatch, 모든 빌드 옵션이 필요합니다. 모두 실행
-카운트배치 일자리, 그럼 -병합 배치 가능합니다.

메릴 -configbatch -B [옵션] -o 파일
메릴 -카운트배치 0 -o 파일
메릴 -카운트배치 1 -o 파일
...
메릴 -카운트배치 N -o 파일
메릴 -병합 배치 N -o 파일

onworks.net 서비스를 통해 온라인으로 Meryl을 사용하세요.



최신 Linux 및 Windows 온라인 프로그램