gmap - 클라우드에서의 온라인

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 gmap 명령입니다.

프로그램:

이름


gmap - 게놈 매핑 및 정렬 프로그램

개요


지맵 [옵션...] <파스타 파일...>, or 고양이 | gmap [옵션...]

옵션


입력 옵션 (해야하다 포함 -d or -g)
-D, --dir=예배 규칙서
게놈 디렉토리. 기본값(다음에 의해 지정됨) --with-gmapdb 구성 프로그램에)
is /var/캐시/gmap

-d, --db=STRING
게놈 데이터베이스. 인수가 '?'인 경우 (따옴표 포함) 이 명령은 다음을 나열합니다.
사용 가능한 데이터베이스.

-k, --kmer=INT
게놈 데이터베이스에서 사용할 kmer 크기(허용 값: 16 이하) 그렇지 않은 경우
지정하면 프로그램은 게놈에서 사용 가능한 가장 높은 kmer 크기를 찾습니다.
데이터베이스

--견본 추출=INT
게놈 데이터베이스에 사용할 샘플링입니다. 지정하지 않으면 프로그램이 다음을 찾습니다.
선택된 k-mer 크기 내에서 게놈 데이터베이스에서 사용 가능한 가장 작은 샘플링 값

-G, --게놈풀
전체 게놈(모든 ASCII 문자 허용, 설정 중에 명시적으로 구축됨)을 사용합니다.
압축 버전

-g, --gseg=파일 이름
사용자 제공 게놈 세그먼트

-1, --자체 정렬
stdin을 통해 FASTA 형식으로 하나의 시퀀스를 자체 정렬합니다(가져오는 데 유용함).
뉴클레오티드 서열의 단백질 번역)

-2, --pairalign
stdin을 통해 FASTA 형식으로 두 개의 서열을 정렬합니다. 첫 번째 서열은 게놈이고 두 번째 서열입니다.
하나는 cDNA이고

--cmdline=STRING,끈
명령줄에 제공된 이 두 시퀀스를 정렬합니다. 첫 번째 시퀀스는 게놈이고
두 번째는 cDNA입니다.

-q, --부분=INT/INT
모든 n 시퀀스 중 i번째 시퀀스(예: 0/100 또는 99/100)만 처리합니다(다음에 유용함).
컴퓨터 팜에 작업 배포).

--입력 버퍼 크기=INT
입력 버퍼 크기(프로그램은 효율성을 위해 한 번에 이만큼의 시퀀스를 읽습니다)
(기본값 1000)

계산 옵션

-B, --일괄=INT
배치 모드(기본값 = 2)

모드 오프셋 위치 게놈
0 참고 참고 mmap mmap
1 참고 mmap 및 미리 로드 mmap 참조
(기본값) 2 참고 mmap 및 미리 로드 mmap 및 미리 로드 참조
3 mmap 할당 및 사전 로드 참고 참고
4 참고 할당 할당 참조
5 확장 할당 할당

참고: 단일 시퀀스의 경우 모든 데이터 구조는 mmap을 사용합니다.
mmap을 사용할 수 없고 할당을 선택하지 않은 경우 fileio를 사용합니다(매우 느림).

에 대한 참고 --일괄 및 오프셋: 오프셋 확장을 제어할 수 있습니다.
독립적으로 --확장 오프셋 깃발. NS --일괄=5 옵션은 다음과 같습니다.
--일괄=4 ...을 더한 --확장 오프셋=1

--확장 오프셋=INT
게놈 오프셋 인덱스 확장 여부 값: 0(아니요, 기본값) 또는 1(예).
확장하면 정렬 속도가 빨라지지만 더 많은 메모리가 필요합니다.

--노스플라이싱
스플라이싱을 끕니다(게놈 서열을 게놈에 정렬하는 데 유용함).

--최소-인트론 길이=INT
하나의 내부 인트론에 대한 최소 길이(기본값 9). 이 크기 아래에는 게놈 격차가 있습니다.
인트론이 아닌 삭제로 간주됩니다.

-K, --intron길이=INT
내부 인트론 200000개의 최대 길이(기본값 XNUMX)

-w, --localsplicedist=INT
시퀀스 끝에서 알려진 스플라이스 사이트의 최대 길이(기본값 2000000)

-L, --총 길이=INT
최대 총 인트론 길이(기본값 2400000)

-x, --키메라 마진=INT
나머지 시퀀스에 대한 검색을 트리거하는 정렬되지 않은 시퀀스의 양
(기본값은 30). 키메라 읽기 정렬을 활성화하고 일부 작업에 도움이 될 수 있습니다.
비키메라 읽기. 끄려면 XNUMX으로 설정하세요.

--키메라 없음
키메라 찾기를 끕니다. 와 같은 효과 --키메라 마진=0

-t, --n스레드=INT
작업자 스레드 수

-c, --chrsubset=
특정 염색체로 검색 제한

-z, --방향=STRING
cDNA 방향(sense_force, antisense_force, sense_filter, antisense_filter, 또는
자동(기본값))

-H, --trimendexons=INT
주어진 일치 수보다 적은 수의 일치 항목으로 끝 엑손 자르기(nt, 기본값 9)

--정규 모드=INT
정규 및 준정규 인트론에 대한 보상 0=낮은 보상, 1=높은 보상
(기본값), 2=고동일성 시퀀스에 대한 낮은 보상, 그렇지 않은 경우 높은 보상

--종교차
특히 다음과 같은 경우에 도움이 되는 표준 접합에 대해 보다 민감한 검색을 사용하십시오.
종간 정렬 및 기타 어려운 경우

--allow-close-indels=INT
서로 가까운 삽입 및 삭제 허용(0=아니요, 1=예(기본값), 2=만)
고품질 정렬을 위해)

--microexon-spliceprob=흙손
스플라이스 사이트 확률 중 하나가 이보다 큰 경우에만 마이크로엑손을 허용합니다.
값(기본값 0.95)

--cmetdir=STRING
메틸시토신 색인 파일용 디렉토리(cmetindex를 사용하여 생성됨)(기본값은
다음을 사용하여 지정된 게놈 색인 파일의 위치 -D, -V-d)

--atoidir=STRING
A-to-I RNA 편집 색인 파일용 디렉토리(atoiindex를 사용하여 생성됨)(기본값은
다음을 사용하여 지정된 게놈 색인 파일의 위치 -D, -V-d)

--방법=STRING
정렬 모드: 표준(기본값), cmet-stranded, cmet-nonstranded, atoi-stranded,
atoi-비연선, ttoc-연선 또는 ttoc-비연선. 비표준 모드에는 다음이 필요합니다.
이전에 cmetindex 또는 atoiindex 프로그램을 실행한 적이 있어야 합니다.
ttoc 모드) 게놈의

-p, --prunelevel
가지치기 수준: 0=가지치기 없음(기본값), 1=나쁜 시퀀스, 2=반복적인 시퀀스, 3=나쁜 및
반복적 인

출력 유형

-S, --요약
선형 요약만 표시

-A, --맞추다
정렬 표시

-3, --마디 없는
연속된 세 줄로 정렬 표시

-4, --엑손별로 연속
엑손당 세 줄로 정렬 표시

-Z, --압박 붕대
압축된 형식으로 출력 인쇄

-E, --엑손=STRING
엑손 인쇄("cdna" 또는 "게놈")

-P, --단백질_dna
단백질 서열 인쇄(cDNA)

-Q, --단백질_gen
단백질 서열 인쇄(게놈)

-f, --체재=INT
출력을 위한 다른 형식(또한 -A-S 옵션 및 기타 옵션이 나열되어 있습니다.
출력 유형에서):
psl(또는 1) = PSL(BLAT) 형식,
gff3_gene (또는 2) = GFF3 유전자 형식,
gff3_match_cdna (또는 3) = GFF3 cDNA_match 형식,
gff3_match_est (또는 4) = GFF3 EST_match 형식,
splicesites (또는 6) = splicesites 출력(GSNAP 접합 파일용),
introns = 인트론 출력(GSNAP 접합 파일용),
map_exons (또는 7) = IIT FASTA 엑손 맵 형식,
map_ranges (또는 8) = IIT FASTA 범위 맵 형식,
좌표(또는 9) = 테이블 형식의 좌표,
sampe = SAM 형식(플래그에 paired_read 비트 설정),
samse = SAM 형식(paired_read 비트 설정 없음)

출력 옵션

-n, --npaths=INT
표시할 최대 경로 수(기본값 5) 1로 설정하면 GMAP이 보고하지 않습니다.
키메라 정렬은 두 가지 경로를 의미하기 때문입니다. 단일 정렬을 원하는 경우
키메라 정렬을 추가한 다음 이를 0으로 설정합니다.

--최적화되지 않은 점수=INT
점수가 이 최적 경로 값 내에 있는 경로만 보고합니다. 기본적으로,
이 옵션이 제공되지 않으면
프로그램은 발견된 모든 경로를 인쇄합니다.

-O, --주문
입력과 동일한 순서로 출력 인쇄(두 명 이상의 작업자가 있는 경우에만 관련됨)
실)

-5, --md5
각 쿼리 시퀀스에 대한 MD5 체크섬 인쇄

-o, --키메라-겹침
키메라 중단점에 중첩이 있는 경우 표시

--실패만
결과가 없는 실패한 정렬만 인쇄합니다.

--nofails
실패한 정렬 인쇄 제외

-V, --snpsdir=STRING
SNP 색인 파일용 디렉토리(snpindex를 사용하여 생성됨)(기본값은
다음을 사용하여 지정된 게놈 인덱스 파일 -D-d)

-v, --use-snps=STRING
알려진 SNP가 포함된 데이터베이스 사용( .iit, 이전에 다음을 사용하여 빌드됨
snpindex) SNP에 대한 내성

--분할 출력=STRING
다중 파일 출력을 위한 기본 이름, 노매핑을 위해 별도로,
uniq, mult, (및 chimera인 경우 --키메라 마진 선택됨)

--실패한 입력=STRING
완전히 실패한 정렬을 지정된 FASTA 또는 FASTQ 형식으로 인쇄합니다.
파일. 만약 --분할 출력 플래그도 주어지면 이 파일이 추가로 생성됩니다.
.nomapping 파일의 출력에.

--추가 출력
인셀덤 공식 판매점인 --분할 출력 or --failinput 이 플래그가 주어지면 이 플래그는 출력을
기존 파일. 그렇지 않으면 기본값은 새 파일을 만드는 것입니다.

--출력 버퍼 크기=INT
출력 스레드에 대한 쿼리의 버퍼 크기(기본값 1000)입니다. 수
인쇄할 결과가 이 크기를 초과하면 작업자 스레드는
백로그가 지워졌습니다

-F, --전체 길이
Met로 시작하여 전체 길이의 단백질을 가정합니다.

-a, --cdsstart=INT
주어진 뉴클레오티드의 코돈 번역(1 기반)

-T, --자르기
전체 길이 단백질 주위의 정렬을 자르면 Met to Stop이 암시됩니다. -F 깃발.

-Y, --관대 한
프레임 이동을 수정하여 cDNA를 번역합니다.

GFF3 출력 옵션

--gff3-추가-구분자=INT
각 쿼리 시퀀스 뒤에 ### 구분 기호를 추가할지 여부 값: 0(아니요), 1(예,
기본)

SAM 출력 옵션

--샘 헤더 없음
'@'으로 시작하는 헤더를 인쇄하지 마세요.

--샘-사용-0M
인접한 삽입과 삭제 사이에 CIGAR에 0M을 삽입합니다. Picard에서 필요합니다.
하지만 다른 도구에서는 오류가 발생할 수 있습니다.

--force-xs-dir
RNA-Seq 정렬의 경우 XS:A:?를 허용하지 않습니다. 감각의 방향이 불분명할 때,
이 값을 XS:A:+로 임의로 바꿉니다. 다음과 같은 일부 프로그램에 유용할 수 있습니다.
XS:A:?를 처리할 수 없는 커프스 단추로 사용됩니다. 그러나 이 플래그를 사용하면
이러한 경우 보고된 XS:A:+ 값은 의미가 없습니다.

--md-소문자-snp
MD 문자열에서 알려진 SNP가 -v 깃발,
서로 다른 뉴클레오티드를 소문자로 인쇄합니다.
참조와 다르지만 알려진 대체 대립유전자와 일치함

--시가 오류 시 조치
CIGAR 길이와 시퀀스 길이 사이에 불일치가 있는 경우 취해야 할 조치
허용되는 값: 무시, 경고(기본값), 중단

--읽기 그룹 ID=STRING
읽기 그룹 ID(RG-ID) 필드에 입력할 값

--읽기-그룹-이름=STRING
읽기 그룹 이름(RG-SM) 필드에 입력할 값

--읽기 그룹 라이브러리=STRING
읽기 그룹 라이브러리(RG-LB) 필드에 입력할 값

--읽기 그룹 플랫폼=STRING
읽기 그룹 라이브러리(RG-PL) 필드에 입력할 값

품질평가점수 옵션

--품질 프로토콜=STRING
입력 품질 점수에 대한 프로토콜입니다. 허용되는 값: illumina(ASCII 64-126)
에 (동등한 -J 64 -j -31) Sanger(ASCII 33-126)(동일) -J 33 -j 0)

기본값은 Sanger입니다(품질 인쇄 변화 없음).
SAM 출력 파일은 Sanger 프로토콜의 품질 점수를 가져야 합니다.

또는 다음 플래그를 사용하여 인쇄 이동을 지정할 수 있습니다.

-j, --품질-인쇄-시프트=INT
FASTQ 품질 점수를 출력에서 ​​이 양만큼 이동합니다(sanger의 경우 기본값은 0입니다).
규약; Illumina 입력을 Sanger 출력으로 변경하려면 다음을 선택하십시오. -31)

외부 지도 파일 옵션

-M, --mapdir=예배 규칙서
지도 디렉토리

-m, --지도=iitfile
지도 파일. 인수가 '?'인 경우 (따옴표 포함),
여기에는 사용 가능한 지도 파일이 나열됩니다.

-e, --mapexons
각 엑손을 개별적으로 매핑

-b, --mapboth
게놈의 두 가닥 모두에서 적중을 보고합니다.

-u, --측면=INT
측면 공격 표시(기본값 0)

--print-주석
각 히트에 대한 설명 줄 표시

정렬 출력 옵션

-N, --길이 없음
정렬된 인트론 길이 없음

-I, --invertmode=INT
게놈(-) 가닥에 대한 정렬 모드: 0=cDNA를 반전시키지 않음(기본값)
1=cDNA 반전 및 게놈(-) 가닥 인쇄 2=cDNA 반전 및 게놈(+) 인쇄
해변

-i, --인트론갭=INT
인트론의 각 말단에 표시할 뉴클레오티드(기본값 3)

-l, --wraplength=INT
정렬을 위한 랩 길이(기본값 50)

출력 옵션 필터링

--최소 손질된 범위=흙손
이 값보다 작은 범위의 잘린 적용 범위로 선형을 인쇄하지 마십시오(기본값=0.0, 이는
필터링이 없음을 의미함) 이에 관계없이 키메라 정렬이 출력됩니다.
필터링

--최소 신원=흙손
이 값보다 작은 ID로 정렬을 인쇄하지 마십시오(기본값=0.0, 즉 인쇄되지 않음을 의미함).
필터링) 이 필터에 관계없이 키메라 정렬이 출력됩니다.
도움말 옵션

--확인하다
컴파일러 가정 확인

--번역
버전 표시

--도움 이 도움말 메시지 표시

GMAP 제품군의 다른 도구는 /usr/lib/gmap에 있습니다.

onworks.net 서비스를 사용하여 온라인으로 gmap 사용



최신 Linux 및 Windows 온라인 프로그램