이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공자에서 실행할 수 있는 명령 snap-aligner-paired입니다.
프로그램:
이름
snap-aligner_paired - 확장 가능한 뉴클레오티드 정렬 프로그램
기술
SNAP 버전 1.0beta.18에 오신 것을 환영합니다.
매개변수가 너무 적습니다. 사용법: 스냅 얼라이너 페어링 [ ] 어디
처리할 파일 목록입니다.
옵션
-o 파일 이름에 따라 SAM 또는 BAM 형식의 파일 이름에 대한 파일 이름 출력 정렬
확장 또는 명시적 유형 지정자(아래 참조). 명시적인 유형에 대시 사용
stdout에 쓰기 위한 지정자입니다. 예를 들어 -o -sam - SAM 출력을 다음에 씁니다.
표준 출력
-d 읽기 또는 쌍당 허용되는 최대 편집 거리(기본값: 15)
-n 읽기당 사용할 시드 수
-Sc 시드 범위(즉, readSize/seedSize). 부동 소수점. 독점 -n.
(기본 용도 -n)
-h 시드당 고려할 최대 적중(기본값: 300)
-ms 위치당 최소 시드 일치(기본값: 1)
-t 스레드 수(기본값은 코어당 하나)
-b 각 스레드를 해당 프로세서에 바인딩(기본값)
--비 각 스레드를 해당 프로세서에 바인딩하지 마십시오(이중 대시 참고).
-P 게놈에서 캐시 프리페칭을 비활성화합니다. 작은 기계에 도움이 될 수 있습니다.
캐시 또는 많은 코어/캐시
-그래서 정렬 위치별로 출력 파일 정렬
-SM Gb 단위로 정렬에 사용할 메모리
-x 지나치게 인기 있는 시드의 일부 히트 탐색(필터링에 유용함)
-f 편집 거리 제한 내에서 첫 번째 일치 시 중지(필터링 모드)
-F 필터 출력(a=정렬됨만, s=단일 히트만(MAPQ >= 10), u=정렬되지 않음,
l=정렬하기에 충분한 길이(참조 -mrl))
-S 추가 처리 억제(정렬된 BAM 출력만) i=인덱스, d=중복
마킹
-I 페어드 엔드 얼라이너에서 일치하지 않는 ID 무시
-Cxx 낮은 품질을 클립할지 여부를 나타내는 두 개의 + 또는 - 기호가 뒤에 있어야 합니다.
각각 읽기의 앞과 뒤의 베이스; 기본값: 뒤로만(-기음-+)
-M 생성된 SAM 파일의 CIGAR 문자열이 M(정렬
일치) 대신 = 및 X(시퀀스 (오)일치). 기본값입니다.
-= M 대신 = 및 X와 함께 새로운 스타일의 CIGAR 문자열을 사용하십시오. -M
-G CIGAR 문자열을 생성할 때 사용할 간격 페널티 지정
-pf 실행 속도를 포함할 파일 이름 지정
--hp 방대한 페이지를 사용하지 않음을 나타냅니다(인덱스 로드 속도가 빨라지고 속도가 느려질 수 있음)
조정)
이것이 기본값입니다.
-HP 대용량 페이지를 사용하도록 표시합니다(이렇게 하면 정렬 속도가 빨라지고 인덱스 로드 속도가 느려질 수 있음).
-D 추가 검색 깊이(SNAP이 수행한 최고 적중 이후의 편집 거리)를 지정합니다.
MAPQ를 계산하는 데 사용됩니다). 기본값 2
-rg 입력 파일에 지정되지 않은 경우 기본 읽기 그룹 지정
-R SAM/BAM 출력에 대한 전체 읽기 그룹 줄을 지정합니다. 여기에는 ID가 포함되어야 합니다.
꼬리표. '@RG'로 시작하지 않으면 SNAP에서 추가합니다. \t로 탭을 지정합니다. 둘
백슬래시는 단일 백슬래시를 생성합니다. 백슬래시 뒤에 다른 항목
불법입니다. 따라서 '-R @RG\tID:foo\tDS:my data'는 기본 태그가 있는 읽기를 생성합니다.
foo 및 DS:my 데이터 필드도 포함하는 @RG 줄입니다.
-사 보조(0x100) 또는 보충이 있는 SAM 또는 BAM 파일의 읽기를 포함합니다.
(0x800) 플래그가 설정되었습니다. 기본값은 삭제하는 것입니다.
-옴 여러 정렬을 출력합니다. 최대 추가 편집 거리를 매개변수로 사용합니다.
XNUMX차 정렬을 허용하기 위해 최상의 정렬을 기준으로
-omax 에 의해 생성된 읽기당 정렬 수를 제한합니다. -옴.
이것은 -옴 더 많은 것을 생성할 것입니다
보다 -omax XNUMX차 정렬, SNAP은 가장 좋은 정렬만 작성합니다. -omax 그들의,
여기서 '최고'는 '가장 낮은 편집 거리'를 의미합니다. 관계가 임의로 끊어졌습니다.
-mpc 에 의해 생성된 정렬 수 제한 -옴 콘티그당 이만큼
(염색체/FASTA 항목);
'mpc'는 '컨티그당 최대값'을 의미합니다. 기본 무제한.
이 필터는 -omax. 기본 정렬
계산됩니다.
-pc SAM 또는 BAM 파일에서 오는 읽기에 대한 소프트 클리핑을 유지합니다.
-xf BAM 및 GZ 파일의 확장 요소 증가(기본값 1.0)
-hdp 오류 메시지에 Hadoop 스타일 접두사(reporter:status:...)를 사용하고 내보냅니다.
hadoop 스타일 진행 메시지
-mrl 정렬할 최소 읽기 길이 지정, 이보다 짧은 읽기(클리핑 후)
정렬되지 않은 상태를 유지하십시오.
이것은
종자 길이보다 약간 더 크거나 의심스러운 정렬을 얻을 수 있습니다.
기본값 50
-map 인덱스를 읽는 대신 파일 매핑을 사용하여 인덱스를 로드합니다.
경우에 따라 색인 로딩 속도가 빨라질 수 있습니다.
여기서 SNAP은 동일한 인덱스에서 반복적으로 실행되며 인덱스는
기계의 메모리 크기. 일부 운영 체제에서는 다음을 사용하여 인덱스를 로드합니다.
-map 인덱스가 메모리에 없으면 없는 것보다 훨씬 느립니다. 당신은 고려할 수 있습니다
첨가 -사전 로드할 때 인덱스를 시스템 캐시로 미리 가져옵니다. -map 시
인덱스가 캐시에 있을 것으로 기대하지 마십시오.
-사전 인덱스를 시스템 캐시로 프리페치합니다.
이것은 의미가 있습니다 -map, 색인이 아닌 경우에만 도움이 됩니다.
이미 메모리에 있고 운영 체제가 매핑된 파일을 읽는 속도가 느립니다(즉,
일부 Linux 버전(Windows 제외).
-lp 낮은 스케줄링 우선순위에서 SNAP 실행(Windows에서만 구현됨)
-누 No Ukkonen: 이전 후보를 기반으로 편집 거리 검색을 줄이지 않습니다. 이것
옵션은 순전히 Ukkonen 알고리즘 사용의 성능 효과를 평가하기 위한 것입니다.
Smith-Waterman이 아니라 지정하면 실행 속도가 느려집니다.
정렬을 개선합니다.
-아니 순서 없음: 더 가능성 있는 읽기를 선택하기 위해 읽기 평가를 주문하지 않습니다.
먼저 후보. 이 옵션은 순전히 성능 효과를 평가하기 위한 것입니다.
읽기 평가 순서를 지정하고 지정하지 않으면 실행 속도가 느려집니다.
정렬 개선.
-nt 놓친 시드 적중을 기반으로 검색을 자르지 마십시오. 이 옵션은 순전히
후보 잘림의 성능 효과를 평가하고 이를 지정합니다.
정렬을 개선하지 않고 실행 속도를 늦춥니다.
-wbs 쓰기 버퍼 크기(MB). 오류가 발생하지 않는 한 이것을 지정하지 마십시오.
더 크게 만들라는 메시지. 기본값 16.
SNAP을 다시 시작하지 않고 가능한 경우 없이 두 개 이상의 정렬을 처리할 수 있습니다.
인덱스를 다시 로드합니다. 이렇게 하려면 모든 매개변수를 명령줄에 나열하십시오.
첫 번째 정렬의 경우 쉼표가 뒤따릅니다(다른 정렬과 공백으로 구분됨).
매개변수) 다음에 다음 정렬을 위한 매개변수(단일 또는
페어링). 당신은 이것을 원하는만큼 가질 수 있습니다. 두 개의 연속 정렬을 사용하는 경우
동일한 인덱스이면 다시 로드되지 않습니다. 예를 들어 'snap-aligner'를 수행할 수 있습니다.
단일 hg19-20 foo.fq -o foo.sam , 페어링된 hg19-20 end1.fq end2.fq -o paired.sam' 그리고 그것
단일 정렬과 쌍 정렬 사이의 인덱스를 다시 로드하지 않습니다. 지정할 때
입력 또는 출력 파일의 경우 파일 이름만 나열하면 됩니다. 이 경우 SNAP은
파일 확장자에서 파일 유형(예: .sam 또는 .bam)을 지정하거나 명시적으로
파일 이름 앞에 다음 중 하나를 붙여 파일 형식을 지정합니다.
다음 유형 지정자(대소문자 구분):
-패스트큐
-압축Fastq
-sam
-밤
-pairedFastq
-pairedInterleavedFastq
-pairedCompressedInterleavedFastq
예를 들어 다음과 같이 지정할 수 있습니다. -밤 SNAP이 input.file을 BAM으로 처리하도록 input.file
일반적으로 입력을 위해 FASTQ 파일을 사용하거나 입력을 위해 SAM 파일을 가정하더라도 파일입니다.
파일 확장자를 인식하지 못하면 출력됩니다. 파일 이름을 사용하려면
'-'로 시작하고 SNAP가 이를 스위치로 처리하지 않도록 하려면 명시적으로 지정해야 합니다.
유형. 하지만 실제로는 혼란스러울 뿐이므로 그렇게 해서는 안 됩니다. 입력 및 출력 수
또한 stdin/stdout에서/로. 이렇게 하려면 입력 또는 출력 파일 이름에 -를 사용하고
명시적인 유형 지정자를 제공합니다. 예를 들어 snap-aligner aligner 단일 myIndex
-패스트큐 - -o -sam - stdin에서 FASTQ를 읽고 SAM을 stdout에 씁니다.
-s 쌍을 이루는 끝 사이에 허용되는 최소 및 최대 간격(기본값: 50 1000).
-fs 간격을 최소값과 최대값 사이에 두세요.
-H 교차 정렬기의 최대 히트 수(기본값: 2000).
-mcp 최대 후보 풀 크기를 지정합니다(내부 데이터 구조).
오류 메시지가 나타나면 이 값을 늘리세요. 실행 중인 경우
메모리가 부족하면 값을 줄이는 것이 좋습니다. 기본값: 1000000)
-F b 추가 옵션 -F 두 친구 모두 필터를 충족하도록 요구합니다(기본값은 1명만)
지정한 경우 -F b 다른 하나와 함께 -F 옵션 -F b는 두 번째여야 합니다
-구 SAM/BAM 입력에 쌍을 이루지 않는 읽기를 유지합니다. 일반적으로 읽기가
메이트 정보를 지정하면(RNEXT 필드가 *이고/또는 PNEXT가 0인 경우) 해당 코드가
일치하는 읽기는 즉시 삭제됩니다. 이 플래그를 지정하면 큰 문제가 발생할 수 있습니다.
일부 입력 파일에 대한 메모리 사용량은 있지만 이상하게도 일부 입력 파일에는 필요할 수 있습니다.
형식이 지정된 입력 파일. SAM/BAM 파일에도 이 플래그를 지정해야 합니다.
싱글 엔드 정렬기로 정렬되었습니다.
onworks.net 서비스를 사용하여 온라인으로 스냅 얼라이너 페어링을 사용하세요
