영어프랑스어스페인어

Ad


온웍스 파비콘

gmap - 클라우드에서의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 gmap을 실행하세요.

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 gmap 명령입니다.

프로그램:

이름


gmap - 게놈 매핑 및 정렬 프로그램

개요


지맵 [옵션...] <파스타 파일...>, or 고양이 | gmap [옵션...]

옵션


입력 옵션 (해야하다 포함 -d or -g)
-D, --dir=예배 규칙서
게놈 디렉토리. 기본값(다음에 의해 지정됨) --with-gmapdb 구성 프로그램에)
is /var/캐시/gmap

-d, --db=STRING
게놈 데이터베이스. 인수가 '?'인 경우 (따옴표 포함) 이 명령은 다음을 나열합니다.
사용 가능한 데이터베이스.

-k, --kmer=INT
게놈 데이터베이스에서 사용할 kmer 크기(허용 값: 16 이하) 그렇지 않은 경우
지정하면 프로그램은 게놈에서 사용 가능한 가장 높은 kmer 크기를 찾습니다.
데이터베이스

--견본 추출=INT
게놈 데이터베이스에 사용할 샘플링입니다. 지정하지 않으면 프로그램이 다음을 찾습니다.
선택된 k-mer 크기 내에서 게놈 데이터베이스에서 사용 가능한 가장 작은 샘플링 값

-G, --게놈풀
전체 게놈(모든 ASCII 문자 허용, 설정 중에 명시적으로 구축됨)을 사용합니다.
압축 버전

-g, --gseg=파일 이름
사용자 제공 게놈 세그먼트

-1, --자체 정렬
stdin을 통해 FASTA 형식으로 하나의 시퀀스를 자체 정렬합니다(가져오는 데 유용함).
뉴클레오티드 서열의 단백질 번역)

-2, --pairalign
stdin을 통해 FASTA 형식으로 두 개의 서열을 정렬합니다. 첫 번째 서열은 게놈이고 두 번째 서열입니다.
하나는 cDNA이고

--cmdline=STRING,끈
명령줄에 제공된 이 두 시퀀스를 정렬합니다. 첫 번째 시퀀스는 게놈이고
두 번째는 cDNA입니다.

-q, --부분=INT/INT
모든 n 시퀀스 중 i번째 시퀀스(예: 0/100 또는 99/100)만 처리합니다(다음에 유용함).
컴퓨터 팜에 작업 배포).

--입력 버퍼 크기=INT
입력 버퍼 크기(프로그램은 효율성을 위해 한 번에 이만큼의 시퀀스를 읽습니다)
(기본값 1000)

계산 옵션

-B, --일괄=INT
배치 모드(기본값 = 2)

모드 오프셋 위치 게놈
0 참고 참고 mmap mmap
1 참고 mmap 및 미리 로드 mmap 참조
(기본값) 2 참고 mmap 및 미리 로드 mmap 및 미리 로드 참조
3 mmap 할당 및 사전 로드 참고 참고
4 참고 할당 할당 참조
5 확장 할당 할당

참고: 단일 시퀀스의 경우 모든 데이터 구조는 mmap을 사용합니다.
mmap을 사용할 수 없고 할당을 선택하지 않은 경우 fileio를 사용합니다(매우 느림).

에 대한 참고 --일괄 및 오프셋: 오프셋 확장을 제어할 수 있습니다.
독립적으로 --확장 오프셋 깃발. NS --일괄=5 옵션은 다음과 같습니다.
--일괄=4 ...을 더한 --확장 오프셋=1

--확장 오프셋=INT
게놈 오프셋 인덱스 확장 여부 값: 0(아니요, 기본값) 또는 1(예).
확장하면 정렬 속도가 빨라지지만 더 많은 메모리가 필요합니다.

--노스플라이싱
스플라이싱을 끕니다(게놈 서열을 게놈에 정렬하는 데 유용함).

--최소-인트론 길이=INT
하나의 내부 인트론에 대한 최소 길이(기본값 9). 이 크기 아래에는 게놈 격차가 있습니다.
인트론이 아닌 삭제로 간주됩니다.

-K, --intron길이=INT
내부 인트론 200000개의 최대 길이(기본값 XNUMX)

-w, --localsplicedist=INT
시퀀스 끝에서 알려진 스플라이스 사이트의 최대 길이(기본값 2000000)

-L, --총 길이=INT
최대 총 인트론 길이(기본값 2400000)

-x, --키메라 마진=INT
나머지 시퀀스에 대한 검색을 트리거하는 정렬되지 않은 시퀀스의 양
(기본값은 30). 키메라 읽기 정렬을 활성화하고 일부 작업에 도움이 될 수 있습니다.
비키메라 읽기. 끄려면 XNUMX으로 설정하세요.

--키메라 없음
키메라 찾기를 끕니다. 와 같은 효과 --키메라 마진=0

-t, --n스레드=INT
작업자 스레드 수

-c, --chrsubset=
특정 염색체로 검색 제한

-z, --방향=STRING
cDNA 방향(sense_force, antisense_force, sense_filter, antisense_filter, 또는
자동(기본값))

-H, --trimendexons=INT
주어진 일치 수보다 적은 수의 일치 항목으로 끝 엑손 자르기(nt, 기본값 9)

--정규 모드=INT
정규 및 준정규 인트론에 대한 보상 0=낮은 보상, 1=높은 보상
(기본값), 2=고동일성 시퀀스에 대한 낮은 보상, 그렇지 않은 경우 높은 보상

--종교차
특히 다음과 같은 경우에 도움이 되는 표준 접합에 대해 보다 민감한 검색을 사용하십시오.
종간 정렬 및 기타 어려운 경우

--allow-close-indels=INT
서로 가까운 삽입 및 삭제 허용(0=아니요, 1=예(기본값), 2=만)
고품질 정렬을 위해)

--microexon-spliceprob=흙손
스플라이스 사이트 확률 중 하나가 이보다 큰 경우에만 마이크로엑손을 허용합니다.
값(기본값 0.95)

--cmetdir=STRING
메틸시토신 색인 파일용 디렉토리(cmetindex를 사용하여 생성됨)(기본값은
다음을 사용하여 지정된 게놈 색인 파일의 위치 -D, -V-d)

--atoidir=STRING
A-to-I RNA 편집 색인 파일용 디렉토리(atoiindex를 사용하여 생성됨)(기본값은
다음을 사용하여 지정된 게놈 색인 파일의 위치 -D, -V-d)

--방법=STRING
정렬 모드: 표준(기본값), cmet-stranded, cmet-nonstranded, atoi-stranded,
atoi-비연선, ttoc-연선 또는 ttoc-비연선. 비표준 모드에는 다음이 필요합니다.
이전에 cmetindex 또는 atoiindex 프로그램을 실행한 적이 있어야 합니다.
ttoc 모드) 게놈의

-p, --prunelevel
가지치기 수준: 0=가지치기 없음(기본값), 1=나쁜 시퀀스, 2=반복적인 시퀀스, 3=나쁜 및
반복적 인

출력 유형

-S, --요약
선형 요약만 표시

-A, --맞추다
정렬 표시

-3, --마디 없는
연속된 세 줄로 정렬 표시

-4, --엑손별로 연속
엑손당 세 줄로 정렬 표시

-Z, --압박 붕대
압축된 형식으로 출력 인쇄

-E, --엑손=STRING
엑손 인쇄("cdna" 또는 "게놈")

-P, --단백질_dna
단백질 서열 인쇄(cDNA)

-Q, --단백질_gen
단백질 서열 인쇄(게놈)

-f, --체재=INT
출력을 위한 다른 형식(또한 -A-S 옵션 및 기타 옵션이 나열되어 있습니다.
출력 유형에서):
psl(또는 1) = PSL(BLAT) 형식,
gff3_gene (또는 2) = GFF3 유전자 형식,
gff3_match_cdna (또는 3) = GFF3 cDNA_match 형식,
gff3_match_est (또는 4) = GFF3 EST_match 형식,
splicesites (또는 6) = splicesites 출력(GSNAP 접합 파일용),
introns = 인트론 출력(GSNAP 접합 파일용),
map_exons (또는 7) = IIT FASTA 엑손 맵 형식,
map_ranges (또는 8) = IIT FASTA 범위 맵 형식,
좌표(또는 9) = 테이블 형식의 좌표,
sampe = SAM 형식(플래그에 paired_read 비트 설정),
samse = SAM 형식(paired_read 비트 설정 없음)

출력 옵션

-n, --npaths=INT
표시할 최대 경로 수(기본값 5) 1로 설정하면 GMAP이 보고하지 않습니다.
키메라 정렬은 두 가지 경로를 의미하기 때문입니다. 단일 정렬을 원하는 경우
키메라 정렬을 추가한 다음 이를 0으로 설정합니다.

--최적화되지 않은 점수=INT
점수가 이 최적 경로 값 내에 있는 경로만 보고합니다. 기본적으로,
이 옵션이 제공되지 않으면
프로그램은 발견된 모든 경로를 인쇄합니다.

-O, --주문
입력과 동일한 순서로 출력 인쇄(두 명 이상의 작업자가 있는 경우에만 관련됨)
실)

-5, --md5
각 쿼리 시퀀스에 대한 MD5 체크섬 인쇄

-o, --키메라-겹침
키메라 중단점에 중첩이 있는 경우 표시

--실패만
결과가 없는 실패한 정렬만 인쇄합니다.

--nofails
실패한 정렬 인쇄 제외

-V, --snpsdir=STRING
SNP 색인 파일용 디렉토리(snpindex를 사용하여 생성됨)(기본값은
다음을 사용하여 지정된 게놈 인덱스 파일 -D-d)

-v, --use-snps=STRING
알려진 SNP가 포함된 데이터베이스 사용( .iit, 이전에 다음을 사용하여 빌드됨
snpindex) SNP에 대한 내성

--분할 출력=STRING
다중 파일 출력을 위한 기본 이름, 노매핑을 위해 별도로,
uniq, mult, (및 chimera인 경우 --키메라 마진 선택됨)

--실패한 입력=STRING
완전히 실패한 정렬을 지정된 FASTA 또는 FASTQ 형식으로 인쇄합니다.
파일. 만약 --분할 출력 플래그도 주어지면 이 파일이 추가로 생성됩니다.
.nomapping 파일의 출력에.

--추가 출력
인셀덤 공식 판매점인 --분할 출력 or --failinput 이 플래그가 주어지면 이 플래그는 출력을
기존 파일. 그렇지 않으면 기본값은 새 파일을 만드는 것입니다.

--출력 버퍼 크기=INT
출력 스레드에 대한 쿼리의 버퍼 크기(기본값 1000)입니다. 수
인쇄할 결과가 이 크기를 초과하면 작업자 스레드는
백로그가 지워졌습니다

-F, --전체 길이
Met로 시작하여 전체 길이의 단백질을 가정합니다.

-a, --cdsstart=INT
주어진 뉴클레오티드의 코돈 번역(1 기반)

-T, --자르기
전체 길이 단백질 주위의 정렬을 자르면 Met to Stop이 암시됩니다. -F 깃발.

-Y, --관대 한
프레임 이동을 수정하여 cDNA를 번역합니다.

GFF3 출력 옵션

--gff3-추가-구분자=INT
각 쿼리 시퀀스 뒤에 ### 구분 기호를 추가할지 여부 값: 0(아니요), 1(예,
기본)

SAM 출력 옵션

--샘 헤더 없음
'@'으로 시작하는 헤더를 인쇄하지 마세요.

--샘-사용-0M
인접한 삽입과 삭제 사이에 CIGAR에 0M을 삽입합니다. Picard에서 필요합니다.
하지만 다른 도구에서는 오류가 발생할 수 있습니다.

--force-xs-dir
RNA-Seq 정렬의 경우 XS:A:?를 허용하지 않습니다. 감각의 방향이 불분명할 때,
이 값을 XS:A:+로 임의로 바꿉니다. 다음과 같은 일부 프로그램에 유용할 수 있습니다.
XS:A:?를 처리할 수 없는 커프스 단추로 사용됩니다. 그러나 이 플래그를 사용하면
이러한 경우 보고된 XS:A:+ 값은 의미가 없습니다.

--md-소문자-snp
MD 문자열에서 알려진 SNP가 -v 깃발,
서로 다른 뉴클레오티드를 소문자로 인쇄합니다.
참조와 다르지만 알려진 대체 대립유전자와 일치함

--시가 오류 시 조치
CIGAR 길이와 시퀀스 길이 사이에 불일치가 있는 경우 취해야 할 조치
허용되는 값: 무시, 경고(기본값), 중단

--읽기 그룹 ID=STRING
읽기 그룹 ID(RG-ID) 필드에 입력할 값

--읽기-그룹-이름=STRING
읽기 그룹 이름(RG-SM) 필드에 입력할 값

--읽기 그룹 라이브러리=STRING
읽기 그룹 라이브러리(RG-LB) 필드에 입력할 값

--읽기 그룹 플랫폼=STRING
읽기 그룹 라이브러리(RG-PL) 필드에 입력할 값

품질평가점수 옵션

--품질 프로토콜=STRING
입력 품질 점수에 대한 프로토콜입니다. 허용되는 값: illumina(ASCII 64-126)
에 (동등한 -J 64 -j -31) Sanger(ASCII 33-126)(동일) -J 33 -j 0)

기본값은 Sanger입니다(품질 인쇄 변화 없음).
SAM 출력 파일은 Sanger 프로토콜의 품질 점수를 가져야 합니다.

또는 다음 플래그를 사용하여 인쇄 이동을 지정할 수 있습니다.

-j, --품질-인쇄-시프트=INT
FASTQ 품질 점수를 출력에서 ​​이 양만큼 이동합니다(sanger의 경우 기본값은 0입니다).
규약; Illumina 입력을 Sanger 출력으로 변경하려면 다음을 선택하십시오. -31)

외부 지도 파일 옵션

-M, --mapdir=예배 규칙서
지도 디렉토리

-m, --지도=iitfile
지도 파일. 인수가 '?'인 경우 (따옴표 포함),
여기에는 사용 가능한 지도 파일이 나열됩니다.

-e, --mapexons
각 엑손을 개별적으로 매핑

-b, --mapboth
게놈의 두 가닥 모두에서 적중을 보고합니다.

-u, --측면=INT
측면 공격 표시(기본값 0)

--print-주석
각 히트에 대한 설명 줄 표시

정렬 출력 옵션

-N, --길이 없음
정렬된 인트론 길이 없음

-I, --invertmode=INT
게놈(-) 가닥에 대한 정렬 모드: 0=cDNA를 반전시키지 않음(기본값)
1=cDNA 반전 및 게놈(-) 가닥 인쇄 2=cDNA 반전 및 게놈(+) 인쇄
해변

-i, --인트론갭=INT
인트론의 각 말단에 표시할 뉴클레오티드(기본값 3)

-l, --wraplength=INT
정렬을 위한 랩 길이(기본값 50)

출력 옵션 필터링

--최소 손질된 범위=흙손
이 값보다 작은 범위의 잘린 적용 범위로 선형을 인쇄하지 마십시오(기본값=0.0, 이는
필터링이 없음을 의미함) 이에 관계없이 키메라 정렬이 출력됩니다.
필터링

--최소 신원=흙손
이 값보다 작은 ID로 정렬을 인쇄하지 마십시오(기본값=0.0, 즉 인쇄되지 않음을 의미함).
필터링) 이 필터에 관계없이 키메라 정렬이 출력됩니다.
도움말 옵션

--확인하다
컴파일러 가정 확인

--번역
버전 표시

--도움 이 도움말 메시지 표시

GMAP 제품군의 다른 도구는 /usr/lib/gmap에 있습니다.

onworks.net 서비스를 사용하여 온라인으로 gmap 사용


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

Linux 명령

Ad


엔터 버튼