영어프랑스어스페인어

Ad


온웍스 파비콘

maq - 클라우드의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 maq 실행

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 명령 maq입니다.

프로그램:

이름


Maq - 품질 매핑 및 조립

개요


명령 [옵션] 인수

maq.pl 명령 [옵션] 인수

기술


Maq는 다음에 의해 생성된 짧은 읽기에서 매핑 어셈블리를 빌드하는 소프트웨어입니다.
세대 시퀀싱 머신. Illumina-Solexa 1G Genetic을 위해 특별히 설계되었습니다.
Analyzer이며 AB SOLiD 데이터를 처리하기 위한 예비 기능이 있습니다.

Maq를 사용하여 다음을 수행할 수 있습니다.

· Illumina/SOLiD 읽기를 참조 게놈에 빠르게 정렬합니다. 기본 옵션을 사용하면
백만 쌍의 읽기가 약 10 CPU 시간 만에 인간 게놈에 매핑될 수 있습니다.
1G 메모리보다

· 각 개별 읽기 정렬의 오류 확률을 정확하게 측정합니다.

· 동형접합 및 이형접합 다형성을 포함하는 합의 유전자형을 다음으로 호출합니다.
a 각 염기에 할당된 Phred 확률적 품질.

· 짝을 이루는 끝 읽기가 있는 짧은 삽입결실을 찾습니다.

· paired end read로 대규모 게놈 삭제 및 전위를 정확하게 찾습니다.

· 읽기 깊이를 확인하여 잠재적인 CNV를 발견합니다.

· 시퀀서에서 원시 기본 품질의 정확성을 평가하고 확인을 돕습니다.
체계적인 오류.

그러나 Maq는 않습니다.:

· 하다 de 새로운 집회. (Maq는 읽기를 알려진
참고.)

· Map shorts는 자신에 대해 읽습니다. (Maq는 읽기 간의 완전한 중첩만 찾을 수 있습니다.)

· 모세관 판독 또는 454 판독을 참조에 정렬합니다. (Maq는 다음보다 긴 읽기를 정렬할 수 없습니다.
63bp.)

MAQ 명령


명령

fasta2bfa fasta2bfa in.ref.fasta out.ref.bfa

FASTA 형식의 시퀀스를 Maq의 BFA(이진 FASTA) 형식으로 변환합니다.

fastq2bfq fastq2bfq [-n nreads] in.read.fastq out.read.bfq아웃.접두사

FASTQ 형식의 읽기를 Maq의 BFQ(바이너리 FASTQ) 형식으로 변환합니다.

옵션:

-n INT 파일당 읽기 수 [지정되지 않음]

지도 지도 [-n nmis] [-a 맥신] [-c] [-1 len1] [-2 len2] [-d 적응3] [-m 돌연변이]
[-u 매핑되지 않은] [-전자 맥세르] [-M ㄷ⎪] [-N] [-H 모든 히트] [-C 최대치] out.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

읽기를 참조 시퀀스에 매핑합니다.

옵션:

-n INT 항상 찾을 수 있는 최대 불일치 수 [2]

-a INT 올바른 읽기 쌍을 위한 최대 외부 거리 [250]

-A INT 두 RF 유료 읽기의 최대 외부 거리(비활성화의 경우 0) [0]

-c 색 공간에서 지도 읽기(SOLiD에만 해당)

-1 INT 첫 번째 읽기의 읽기 길이, 자동의 경우 0 [0]

-2 INT 두 번째 읽기의 읽기 길이, 자동의 경우 0 [0]

-m 흙손 참조 시퀀스와 리드 사이의 돌연변이 비율 [0.001]

-d FILE 3' 어댑터 시퀀스의 한 줄을 포함하는 파일 지정
[없는]

-u FILE 매핑되지 않은 읽기를 덤프하고 다음 이상을 포함하는 읽기 nmis 불일치
별도의 파일 [null]

-e INT 일치하지 않는 기본 품질의 합계에 대한 임계값 [70]

-H FILE 다중/모든 01 불일치 조회수 덤프 FILE [없는]

-C INT 출력할 최대 적중 수입니다. 512보다 크면 무제한. [250]

-M c⎪g 메틸화 정렬 모드. 정방향 가닥의 모든 C(또는 G)는
T(또는 A)로 변경되었습니다. 이 옵션은 테스트 전용입니다.

-N 출력 파일에 불일치 위치 저장 out.aln.map. 이 때
옵션이 사용 중인 경우 허용되는 최대 읽기 길이는 55bp입니다.

알림:

* 쌍을 이루는 끝 읽기는 각 끝에 하나씩, 두 개의 파일로 준비해야 합니다.
읽기는 같은 순서로 정렬됩니다. 이것은 첫 번째에서 k 번째 읽기를 의미합니다.
파일은 두 번째 파일에서 읽은 k 번째 파일과 짝을 이룹니다. 해당 읽기
이름은 마지막 `/1' 또는 `/2'까지 동일해야 합니다. 예를 들어, 그러한
읽기 이름 쌍이 허용됩니다. `EAS1_1_5_100_200/1' 및
'EAS1_1_5_100_200/2'. 테일링 `/[12]'은 일반적으로 다음으로 생성됩니다.
한 쌍의 두 끝을 구분하는 GAPipeline.

* 출력은 압축된 바이너리 파일입니다. 엔디안의 영향을 받습니다.

* 이 명령을 실행하는 가장 좋은 방법은 다음과 같이 약 1백만에서 3백만 읽기를 제공하는 것입니다.
입력. 더 많은 읽기는 더 많은 메모리를 사용합니다.

* 옵션 -n 정렬의 감도를 제어합니다. 기본적으로
항상 최대 2개의 불일치를 찾을 수 있습니다. 더 높은 -n 더 많은 조회수를 찾고 또한
매핑 품질의 정확도를 향상시킵니다. 그러나 이것은 비용으로 수행됩니다.
속도의.

* 고품질 불일치가 많은 정렬은 false로 폐기해야 합니다.
정렬 또는 가능한 오염. 이 동작은 옵션에 의해 제어됩니다.
-e. 그만큼 -e 임계값은 기본 품질 때문에 대략적으로만 계산됩니다.
정렬의 특정 단계에서 10으로 나뉩니다. 그만큼 -Q 에서 옵션
조립하다 명령은 임계값을 정확하게 설정합니다.

* 한 쌍의 읽기는 다음과 같은 경우에만 올바르게 쌍을 이룬다고 합니다.
오리엔테이션은 FR 쌍의 외부 거리는 다음보다 크지 않습니다.
맥신. 최소 삽입 크기에는 제한이 없습니다. 이 설정은
Maq에서 사용되는 paired end alignment 알고리즘에 의해 결정됩니다. 요구
최소 인서트 크기는 일부 잘못된 정렬로 이어질 것입니다.
매핑 품질을 과대 평가했습니다.

* 현재 Illumina/Solexa long-insert 라이브러리의 읽기 쌍에는 RF 읽기가 있습니다.
정위. 최대 인서트 크기는 옵션으로 설정됩니다. -A. 그러나, 오랫동안-
삽입 라이브러리는 짧은 삽입 읽기의 작은 부분과도 혼합됩니다.
한 쌍. -a 도 올바르게 설정해야 합니다.

* 때때로 5'-말단 또는 전체 3'-어댑터 시퀀스가 ​​시퀀싱될 수 있습니다.
제공 -d 어댑터 오염을 제거하기 위해 Maq를 렌더링합니다.

* 2만 읽기가 입력으로 주어졌을 때, 일반적으로 800MB 메모리가 필요합니다.

맵 병합 맵 병합 out.aln.map in.aln1.map in.aln2.map [...]

읽기 정렬 배치를 병합합니다.

알림:

* 이론적으로 이 명령은 정렬을 무제한으로 병합할 수 있습니다. 그러나
mapmerge는 동시에 모든 입력을 읽을 것입니다.
OS에서 설정한 최대 열기 파일 수 제한. 현재 이
최종 사용자가 수동으로 해결해야 합니다.

* 명령 맵 병합 다른 읽기로 정렬 파일을 병합하는 데 사용할 수 있습니다.
길이. 이후의 모든 분석은 더 이상 고정된 길이를 가정하지 않습니다.

rmdup rmdup out.rmdup.map 인.오리.맵

외부 좌표가 동일한 쌍을 제거합니다. 원칙적으로 다음과 짝을 이룹니다.
동일한 외부 좌표는 거의 발생하지 않습니다. 그러나 이로 인해
샘플 준비에서 증폭, 이것은 다음보다 훨씬 더 자주 발생합니다.
가능성. 실제 분석에 따르면 중복을 제거하면
SNP 호출의 전반적인 정확도.

조립하다 조립하다 [-sp] [-m 최대] [-Q 맥세르] [-r 헤트레이트] [-t Coef] [-q 민큐] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

읽기 매핑에서 합의 시퀀스를 호출합니다.

옵션:

-t 흙손 오차 의존 계수 [0.93]

-r 흙손 모든 부위 중 이형 접합체의 비율 [0.001]

-s 단일 종단 매핑 품질을 최종 매핑 품질로 사용합니다.
그렇지 않으면 페어링된 끝 매핑 품질이 사용됩니다.

-p 올바른 쌍으로 매핑되지 않은 쌍을 이루는 끝 읽기를 버립니다.

-m INT 읽기에 사용할 수 있는 최대 불일치 수
합의 호출 [7]

-Q INT 일치하지 않는 염기의 품질 값의 최대 허용 합계 [60]

-q INT 읽기가 합의에 사용되는 데 허용되는 최소 매핑 품질
전화 [0]

-N INT 풀의 일배체형 수(>=2) [2]

알림:

* 옵션 -Q 일치하지 않는 기본 품질의 최대 합계에 대한 제한을 설정합니다.
고품질 불일치가 많이 포함된 읽기는 삭제해야 합니다.

* 옵션 -N 풀의 일배체형 수를 설정합니다. 그것은 위해 설계되었습니다
여러 균주/개체를 함께 풀링하여 샘플을 재배열합니다. 을위한
이배체 게놈 재배열, 이 옵션은 2입니다.

글프겐 글프겐 [-sp] [-m 최대] [-Q 맥세르] [-r 헤트레이트] [-t Coef] [-q 민큐] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

모든 유전자형에 대한 로그 가능성을 계산하고 결과를 GLF 형식으로 저장
(유전형 가능성 형식). 자세한 내용은 MAQ 웹 사이트를 확인하십시오.
파일 형식 및 관련 유틸리티에 대한 설명.

인델페 인델페 in.ref.bfa in.aln.map > 아웃.인델페

쌍을 이루는 끝 읽기에서 일관된 indel을 호출합니다. 출력은 TAB로 구분됩니다.
염색체, 시작 위치, indel 유형, 번호로 구성된 각 라인
삽입결실, 삽입/삭제된 뉴클레오타이드의 크기
(콜론으로 구분), 역 가닥의 인델 수, 인델 수
정방향 가닥에서 삽입결실 앞의 5' 서열, 뒤따르는 3' 서열
indel, indel 및 XNUMX개의 추가 열 없이 정렬된 읽기 수
필터용.

3번째 열인 indel 유형에서 별표는 indel이 확인되었음을 나타냅니다.
두 가닥의 읽기에 의해 더하기는 indel이 적어도 두 개의 읽기에 의해 적중되었음을 의미합니다.
그러나 같은 가닥에서 빼기는 하나의 읽기에서만 indel이 발견됨을 보여줍니다.
점은 indel이 다른 indel에 너무 가깝고 필터링되었음을 의미합니다.

사용자는 `maq.pl indelpe'를 실행하여 개수를 수정하는 것이 좋습니다.
indel 없이 매핑된 읽기. 자세한 내용은 `maq.pl indelpe'를 참조하십시오.
안내

인델소아 인델소아 in.ref.bfa in.aln.map > 아웃.인델소아

비정상을 감지하여 잠재적인 동형 접합체 삽입결실 및 중단점 호출
indel 및 break point 주변의 정렬 패턴. 출력도 TAB입니다.
염색체, 대략적인 좌표,
비정상 영역의 길이, 위치에 매핑된 읽기 수,
위치의 왼쪽에 있는 읽기 수와 에 대한 읽기 수
오른쪽. 마지막 열은 무시할 수 있습니다.

출력에는 많은 오탐지가 포함되어 있습니다. 권장되는 필터는 다음과 같습니다.

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

이 명령은 정확한 삽입결실 검출기를 목표로 하지 않지만,
주로 대체 호출에서 잘못된 긍정을 방지하는 데 도움이 됩니다. 에
또한 깊이가 깊을 때만 잘 작동합니다(예: ~40X). 그렇지 않으면
위음성 비율은 매우 높을 것입니다.

형성 변환 중

솔투생저 솔투생저 in.sol.fastq out.sanger.fastq

Solexa FASTQ를 표준/Sanger FASTQ 형식으로 변환합니다.

bfq2fastq bfq2fastq in.read.bfq out.read.fastq

Maq의 BFQ 형식을 표준 FASTQ 형식으로 변환합니다.

맵패스2마크 맵패스2마크 in.mappass2.map out.maq.map

더 이상 사용되지 않는 mapass2의 지도 형식을 Maq의 지도 형식으로 변환합니다. 이전 형식은
읽기 이름을 포함하지 않습니다.

정보 적출

지도보기 지도보기 [-bN] in.aln.map > out.aln.txt

읽기 정렬을 일반 텍스트로 표시합니다. Smith 이전에 정렬된 읽기의 경우-
Waterman 정렬, 각 라인은 읽기 이름, 염색체, 위치,
가닥, 쌍의 외부 좌표에서 크기 삽입, 쌍을 이루는 플래그, 매핑
품질, 단일 종단 매핑 품질, 대체 매핑 품질, 수
베스트 히트의 불일치 베스트의 일치하지 않는 베이스의 품질 합계
hit, 처음 0bp의 24-mismatch hit 수, 1-mismatch hit의 수
참조의 처음 24bp, 읽기 길이, 읽기 시퀀스 및 해당
품질. 대체 매핑 품질은 다음과 같은 경우 항상 매핑 품질과 동일합니다.
읽기가 페어링되지 않았습니다. 읽기가 쌍을 이루는 경우 더 작은 매핑과 같습니다.
양 끝의 품질. 이 대체 매핑 품질은 실제로
비정상적인 쌍의 매핑 품질.

다섯 번째 열인 paired flag는 비트 플래그입니다. 하위 4비트는
방향: 1은 FF, 2는 FR, 4는 RF, 8은 RR을 나타냅니다. 여기서 FR은
더 작은 좌표를 가진 읽기는 정방향 가닥에 있고 그 짝은
반대 가닥에. 올바른 쌍에는 FR만 허용됩니다. 상위 비트
이 플래그의 추가 정보를 제공합니다. 페어가 페어 엔드를 만나면
요구 사항, 16이 설정됩니다. 두 개의 읽기가 서로 다른
염색체 32개가 설정됩니다. 두 읽기 중 하나를 전혀 매핑할 수 없는 경우
64가 설정됩니다. 올바른 쌍에 대한 플래그는 항상 18과 같습니다.

이후 Smith-Waterman 정렬에 의해 정렬된 읽기의 경우 플래그는 다음과 같습니다.
항상 130. 한 줄은 읽기 이름, 염색체, 위치, 가닥, 삽입으로 구성됩니다.
크기, 플래그(항상 130), 읽기에서 indel의 위치(indel이 없으면 0),
삽입결실의 길이(삽입의 경우 양수, 삭제의 경우 음수),
짝의 매핑 품질, 최고 히트의 불일치 수, 합계
베스트 히트의 일치하지 않는 베이스의 품질, 두 개의 XNUMX, 읽기 길이,
읽기 순서와 품질. 130 플래그가 지정된 읽기의 짝은 항상
깃발 18.

플래그 192는 읽기가 매핑되지 않았지만 해당 짝이 매핑되었음을 나타냅니다. 그러한
읽기 쌍, 하나의 읽기에는 플래그 64가 있고 다른 하나에는 192가 있습니다.

옵션:

-b 읽기 순서와 품질을 표시하지 마십시오.

-N 불일치가 발생하는 위치를 표시합니다. 이 플래그만 작동합니다.
`maq map -N'에 의해 생성된 .map 파일로.

측량 검사 측량 검사 [-s] [-m 최대] [-q 민큐] in.ref.bfa in.aln.map > 아웃.맵체크

품질 검사를 읽으십시오. 측량 성과 검사는 먼저 구성과 깊이를 보고합니다.
참조. 그 후에 양식이 있습니다. 첫 번째 열은 다음을 나타냅니다.
읽기에 대한 위치. 뉴클레오티드를 표시하는 XNUMX개의 열 다음에
구성, 참조 및 판독 간의 대체율이 제공됩니다.
이 비율과 다음 열의 숫자는 999로 조정되었으며
가장 가까운 정수로 반올림됩니다. 다음 열 그룹은 의 분포를 보여줍니다.
품질 간격 10에서 읽기에 따른 기본 품질. 품질 저하
일반적으로 관찰할 수 있으며, 이는 읽기 끝의 염기가 더 적다는 것을 의미합니다.
정확한. 열의 마지막 그룹은 대체 비율을 나타냅니다.
품질 간격으로 염기를 읽습니다. 이것은 기본 품질의 정확도를 측정합니다.
견적. 이상적으로는 1분의 3을 볼 것으로 예상합니까? 열, 10의 2? 열
그리고 100에 1? 열.

옵션:

-s 단일 종단 매핑 품질을 최종 매핑 품질로 사용

-m INT 읽기에 허용되는 최대 오류 수 [4]

-q INT 읽기에 허용되는 최소 매핑 품질 [30]

쌓다 쌓다 [-spvP] [-m 최대] [-Q 맥세르] [-q 민큐] [-l 사이트 파일] in.ref.bfa
in.aln.map > 쌓이다

정렬을 `pileup' 텍스트 형식으로 표시합니다. 각 라인은 다음으로 구성됩니다.
염색체, 위치, 참조 염기, 깊이 및 다음을 덮는 읽기 염기
이 위치. 만약에 -v 명령줄, 기본 품질 및 매핑에 추가됩니다.
품질은 여섯 번째와 일곱 번째 열에 순서대로 표시됩니다.

다섯 번째 열은 항상 `@'로 시작합니다. 이 열에서 동일한 읽기 기반
참조에 대한 참조는 쉼표 `,' 또는 점 `.'으로 표시되며 다른 기준을 읽습니다.
편지의 참조에서. 쉼표 또는 대문자는 기본
정방향 가닥에 정렬된 읽기에서 오는 반면 점 또는 소문자는
역 가닥.

이 명령은 자신의 SNP 호출자를 개발하려는 사용자를 위한 것입니다.

옵션:

-s 단일 종단 매핑 품질을 최종 매핑 품질로 사용

-p 올바른 쌍으로 매핑되지 않은 쌍을 이루는 끝 읽기를 버립니다.

-v 기본 품질 및 매핑을 포함한 자세한 정보 출력
자질

-m INT 읽기에 허용되는 최대 불일치 수 [7]

-Q INT 불일치 품질 값의 최대 허용 수 [60]

-q INT 읽기에 사용할 수 있는 최소 매핑 품질 [0]

-l FILE 더미가 인쇄될 사이트가 포함된 파일입니다. 이에
파일 첫 번째 열은 참조 이름을 제공하고 두 번째 열은
좌표. 추가 열은 무시됩니다. [없는]

-P 또한 읽기의 기본 위치를 출력합니다.

cns2fq cns2fq [-Q 최소맵Q] [-n minNeiQ] [-d 최소 깊이] [-D 최대 깊이] in.cns >
out.cns.fastq

FASTQ 형식의 합의 시퀀스를 추출합니다. 시퀀스 라인에서 염기
소문자는 본질적으로 반복되거나 충분한 적용 범위가 없습니다. 기지
대문자는 SNP를 안정적으로 호출할 수 있는 영역을 나타냅니다. 에서
품질 라인, ASCII에서 33을 뺀 문자는 PHRED 품질을 제공합니다.

옵션:

-Q INT 최소 매핑 품질 [40]

-d INT 최소 판독 깊이 [3]

-n INT 최소 인접 품질 [20]

-D INT 최대 읽기 깊이. >=255 무제한. [255]

cns2snp cns2snp in.cns > out.snp

SNP 사이트를 추출합니다. 각 라인은 염색체, 위치, 참조 염기,
합의 기반, Phred와 같은 합의 품질, 읽기 깊이, 평균 수
이 위치를 포함하는 읽기 조회수, 읽기의 최고 매핑 품질
위치, 3bp 측면에서 최소 합의 품질을 다룹니다.
사이트 양쪽의 영역(총 6bp), 두 번째로 좋은 호출, 로그
두 번째로 좋은 것과 세 번째로 좋은 것, 세 번째로 좋은 것의 가능성 비율
요구.

5열은 SNP의 신뢰도를 판단하는 핵심 기준입니다.
그러나 이 품질은 사이트 독립성을 가정하여 계산한 것이므로 귀하는
더 정확한 SNP 호출을 얻으려면 다른 열도 고려해야 합니다. 스크립트
명령 `maq.pl SNP 필터'는 이를 위해 설계되었습니다(아래 참조).

7열은 사이트가 반복 영역에 속하는지 여부를 나타냅니다. 아니오라면
사이트를 덮는 읽기는 높은 매핑 품질로 매핑될 수 있습니다.
영역이 반복적이거나 좋은 읽기가 부족할 수 있습니다. 그러한 사이트의 SNP
일반적으로 신뢰할 수 없습니다.

8번째 열은 대략적으로 측면 영역의 사본 번호를 제공합니다.
참조 게놈. 대부분의 경우 이 숫자는 1.00에 접근합니다.
지역은 거의 독특합니다. 때로는 0.00이 아닌 읽기 깊이를 볼 수 있지만 XNUMX에서
7번째 칼럼. 이는 해당 위치를 포함하는 모든 읽기가 다음 위치에 있음을 나타냅니다.
적어도 두 번의 불일치. Maq는 0 및 1 불일치 히트 수만 계산합니다.
참조. 이는 복잡한 기술 문제 때문입니다.

9번째 열은 인접 품질을 제공합니다. 이 열에 대한 필터링도
신뢰할 수 있는 SNP를 얻기 위해 필요합니다. 이 아이디어는 NQS에서 영감을 얻었지만 NQS는
처음에는 합의 대신 단일 읽기를 위해 설계되었습니다.

cns2view cns2view in.cns > 아웃뷰

모든 사이트에서 자세한 정보를 표시합니다. 출력 형식은 다음과 동일합니다.
cns2snp 보고합니다.

cns2ref cns2ref in.cns > out.ref.fasta

참조 시퀀스를 추출합니다.

cns2win cns2win [-w 윈사이즈] [-c chr] [-b 시작하다] [-e end] [-q 민큐] in.cns >
아웃.윈

경작 창에서 평균 정보를 추출합니다. 출력은 TAB으로 구분되며,
참조명, 좌표를 1,000,000으로 나눈 좌표, SNP 비율,
het rate, 원시 읽기 깊이, 거의 고유한 영역의 읽기 깊이,
창의 평균 읽기 적중 수 및 백분율 GC.

옵션:

-w INT 창 크기 [1000]

-c STR 목적지 참조 서열; 그렇지 않으면 모든 참조가 사용됩니다.
[없는]

-b INT 시작 위치, 제약 조건이 없는 경우 0 [0]

-e INT 끝 위치, 제약 조건이 없는 경우 0 [0]

-q INT 사용할 사이트의 최소 합의 품질 [0]

시뮬레이션 관련

가짜 가짜 [-r 돌연변이] [-R 인델프랙] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

무작위로 참조에 대체 및 삽입결실을 도입합니다. 교체 및
단일 염기쌍 indel을 추가할 수 있습니다.

옵션:

-r 흙손 돌연변이율 [0.001]

-R 흙손 indel이 될 돌연변이의 비율 [0.1]

시무트레인 시무트레인 out.simupars.dat in.read.fastq

읽기 시뮬레이션을 위한 매개변수를 추정/훈련합니다.

시뮬레이션하다 시뮬레이션하다 [-d 크기를 늘리다] [-s 표준 개발] [-N nRead] [-1 읽기Len1] [-2 읽기Len2] [-r
mutRate] [-R 인델프랙] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

쌍을 이루는 끝 읽기를 시뮬레이션합니다. 파일 in.simupars.dat 읽기 길이를 결정하고
품질 유통. 에서 생성됩니다. 시무트레인, 또는 다음에서 다운로드할 수 있습니다.
맥 홈페이지. 출력 읽기 파일에서 읽기 이름은 참조로 구성됩니다.
시퀀스 이름 및 시뮬레이션된 읽기 쌍의 외부 좌표. 에 의해
기본 시뮬레이션하다 생성된 이배체 시퀀스에서 읽기가 발생한다고 가정합니다.
하나의 염기쌍 indel을 포함하여 두 개의 서로 다른 돌연변이 세트를 추가하여
in.ref.fasta.

옵션:

-d INT 인서트 크기의 외부 거리 평균 [170]

-s INT 인서트 크기의 표준 편차 [20]

-N INT 생성할 읽기 쌍의 수 [1000000]

-1 INT 첫 번째 읽기의 길이 [에 의해 설정됨 in.simupars.dat]

-2 INT 두 번째 읽기의 길이 [에 의해 설정 in.simupars.dat]

-r 흙손 돌연변이율 [0.001]

-R 흙손 1bp 삽입결실의 분수 [0.1]

-h 모든 돌연변이 추가 in.ref.fasta 단일에서 읽기 생성
돌연변이 시퀀스(반수체 모드)

알림:

* 이 명령에서 생성된 읽기는 독립적이며
진실. 얼라인먼트 평가는 이것에 의해 영향을 덜 받는 반면, 에 대한 평가는
SNP 호출은 주의해서 수행해야 합니다. 오류 종속성은 다음 중 하나일 수 있습니다.
잘못된 SNP 호출의 주요 원인.

시뮤스타트 시뮤스타트 in.simu-aln.map > out.simust

시뮬레이션된 읽기에서 매핑 품질을 평가합니다.

단단한 관련

fasta2csfa fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

뉴클레오티드 FASTA를 색상으로 구분된 FASTA로 변환합니다. 깃발 -c 그런 다음 적용해야합니다
지도 명령. 출력에서 문자 'A'는 색상 0, 'C'는 1, 'G'
출력의 각 시퀀스는 입력보다 2bp 짧습니다.

csmap2nt csmap2nt out.nt.map in.ref.nt.bfa in.cs.map

색상 정렬을 뉴클레오티드 정렬로 변환합니다. 입력 in.ref.nt.bfa 이다
뉴클레오티드 바이너리 FASTA 참조 파일. 원본 파일과 일치해야 합니다.
색상 참조가 변환됩니다. 뉴클레오티드 합의라고 할 수 있습니다.
결과 정렬에서.

기타/고급 명령

서브맵 서브맵 [-q 최소맵Q] [-Q 최대합 오류] [-m 최대MM] [-p] 아웃.맵 지도에서

잘못된 정렬 필터링 지도에서. 명령줄 옵션은
`조립하다' 명령.

이랜드2마크 이랜드2마크 [-q 부적격] 아웃.맵 인리스트 인.이랜드

eland 정렬을 maq의 .map 형식으로 변환합니다. 파일 인리스트 다음으로 구성됩니다.
eland 정렬 파일의 일곱 번째 열에 나타나는 시퀀스 이름
인.이랜드 maq 정렬에서 볼 것으로 예상되는 이름. 다음은
예:

cX.fa 문자X
c1.fa 문자1
c2.fa 문자2

eland를 사용하여 여러 배치로 읽기를 정렬하는 경우 다음을 수행하는 것이 중요합니다.
같은 것을 사용하십시오 인리스트 변환을 위해. 또한 maq는 모든
정렬하고 메모리에서 정렬합니다. 여러 eland를 연결한 경우
하나의 거대한 파일로 출력하려면 더 작은 파일로 분리해야
maq가 모든 시스템 메모리를 먹는 것을 방지합니다.

이 명령은 실제로 Maqview에서 Eland 정렬을 표시하는 것을 목표로 합니다. 품질이 아니므로
정보를 사용할 수 있는 경우 결과 maq 정렬 파일을 사용해서는 안 됩니다.
합의 유전자형을 호출합니다.

수출2MAQ 수출2MAQ [-1 읽기1렌] [-2 읽기2렌] [-a 최대 거리] [-n] 아웃.맵 인리스트
수출

Illumina의 내보내기 형식을 Maq의 형식으로 변환 .지도 체재. 내보내기 형식이 새롭습니다.
매핑도 계산하는 SolexaPipeline-0.3.0 이후의 정렬 형식
maq와 같은 자질. 결과 파일은 합의 유전자형을 호출하는 데 사용할 수 있습니다.
maq가 이를 정확하게 수행하는 데 필요한 대부분의 정보를 사용할 수 있기 때문입니다.

옵션:

-1 INT 첫 번째 읽기의 길이 [0]

-2 INT 두 번째 읽기의 길이 [0]

-a INT 올바른 읽기 쌍을 위한 최대 외부 거리 [250]

-n 필터링된 읽기 유지

막펄 명령


데모 maq.pl 데모 [-h] [-s] [-N n쌍] [-d 아웃디어] 인.파스타 in.simudat

의 사용을 시연 및 동반 스크립트. 이 명령은
FASTA 파일에서 읽기 시뮬레이션 인.파스타. 시퀀스 길이 및 품질
에 의해 결정된다 in.simudat 생성되는 시무트레인 또는 수 있습니다
Maq 웹사이트에서 다운로드. 시뮬레이션된 읽기는 다음으로 매핑됩니다.
maq.pl 이지런. 정렬 정확도는 다음과 같이 평가됩니다. 시뮤스타트Walk Through California 프로그램,
합의 정확도 시뮤크스, SNP 정확도 maq_eval.pl.

기본적으로 짝지어진 끝 읽기가 시뮬레이션되고 이배체 시퀀스는 다음과 같이 됩니다.
반수체 유형에 돌연변이를 추가하여 입력에서 생성됩니다. 인서트
크기와 돌연변이 비율은 시뮬레이션하다.

옵션:

-h 이배체 시퀀스 대신 반수체 시퀀스 시뮬레이션

-s 페어드 엔드 모드 대신 싱글 엔드 모드를 사용하여 읽기 정렬

-N INT 시뮬레이션할 읽기 쌍의 수 [1000000]

-d DIR 출력 디렉토리 [maqdemo]

알림:

* 출력 파일 maq_eval.pl 문서화되지 않았지만
이 파일 중 일부를 잘 추측하십시오.

* 이 명령은 maq 제품군의 사용을 보여줍니다. 실제 정확도
데이터는 거의 항상 순수 시뮬레이션에서 보는 것보다 낮습니다.

이지런 maq.pl 이지런 [-1 읽기1렌] [-d out.dir] [-n nRead] [-A 3어댑터] [-e 최소 깊이]
[-q minCnsQ] [-p] [-2 읽기2렌] [-a 맥스인] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

작은 게놈에 대한 파이프라인을 분석합니다. Easyrun 명령은 대부분의 분석을 실행합니다.
에서 구현 된 . 기본적으로, 이지런 모든 입력 읽기 시퀀스를 가정합니다.
파일은 단일 종단이고 독립적입니다. 언제 -p 지정된 경우 두 개의 읽기 시퀀스
각 끝에 하나씩 파일이 필요합니다.

여러 파일이 생성됩니다. out.dir, 그 중 다음 파일은
주요 출력:

cns.최종.snp 필터링된 낮은 품질의 최종 SNP 호출

cns.fq FASTQ 형식의 합의 시퀀스 및 품질

옵션:

-d DIR 출력 디렉토리 [easyrun]

-n INT 한 배치의 정렬에서 읽기/쌍 수 [2000000]

-S 짧은 indel의 split-read 분석 적용(매우 느림)

-N INT 풀의 일배체형/균주의 수(>=2) [2]

-A FILE 3' 어댑터용 파일입니다. 파일은 한 줄의 시퀀스를 포함해야 합니다.
[없는]

-1 INT 첫 번째 읽기의 길이, 자동의 경우 0 [0]

-e INT SNP를 호출하는 데 필요한 최소 읽기 깊이(SNPfilter용) [3]

-q INT SNP에 대한 최소 합의 품질 cns.최종.snp [30]

-p 페어링된 끝 정렬 모드로 전환

-2 INT 두 번째 읽을 때의 길이 -p 적용됩니다 [0]

-a INT 최대 인서트 크기 -p 적용됩니다 [250]

참고 사항 :

* 풀링된 샘플에 대한 SNP 호출의 경우 사용자는 올바른 `-N' 게다가
`-E 0 '.

* 입력 파일은 maq의 바이너리 형식일 수 있습니다. maq.pl 자동으로 감지합니다
파일 형식.

SNP 필터 maq.pl SNP 필터 [-d 최소 깊이] [-D 최대 깊이] [-Q 최대맵Q] [-q minCnsQ] [-w
indelWin 크기] [-n minNeiQ] [-F 인델페] [-f 인델소아] [-s 최소 점수] [-m
maxAcross] [-a] [-N 최대WinSNP] [-W densWin크기] in.cns2snp.snp >
out.filtered.snp

적은 수의 읽기로 처리되는 SNP를 배제합니다( -d), 너무 많은
읽기(에 의해 지정됨 -D), 가까움(로 지정됨 -w) 잠재적인 인델로, 떨어지는
가능한 반복 영역에서( -Q) 또는 품질이 낮습니다.
인접 기지 (에 의해 지정 -n). 만약 최대WinSNP 또는 그 이상의 SNP가
densWin크기 창에서도 함께 필터링됩니다.

옵션:

-d INT SNP를 호출하는 데 필요한 최소 읽기 깊이[3]

-D INT SNP를 호출하는 데 필요한 최대 읽기 깊이(<255, 그렇지 않으면 무시됨)
[256]

-Q INT SNP를 포함하는 읽기에 필요한 최대 매핑 품질 [40]

-q INT 최소 합의 품질 [20]

-n INT 최소 인접 합의 품질 [20]

-w INT 잠재적 삽입 삭제 주변의 창 크기입니다. 가까운 SNP
indel은 억제됩니다 [3]

-F FILE XNUMXD덴탈의 인델페 출력 [null]

-f FILE XNUMXD덴탈의 인델소아 출력 [null]

-s INT 고려되어야 하는 soa-indel의 최소 점수 [3]

-m INT soa-indel에 매핑할 수 있는 최대 읽기 수 [1]

-a 단일 끝 정렬을 위한 대체 필터

인델페 maq.pl 인델페 인델페 > 아웃.인델페

호모폴리머 트랙에 대한 삽입결실 없이 매핑된 읽기 수를 수정합니다. 이것
명령은 4번째, 10번째 및 마지막 XNUMX개 열을 수정합니다. 인델페
결과를 출력 아웃.인델페. 수정 후 아래와 같이 AWK
명령은 추정 동형 접합 인델을 제공합니다.

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

다음은 이형 접합체를 제공합니다.

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

이 점에 유의하시기 바랍니다 인델페 명령은 몇 가지 경험적 규칙을 구현합니다.
불순한 단독 중합체 실행 또는 이중 뉴클레오티드/삼중항에는 수정되지 않습니다.
반복한다. 결과적으로 두 개의 awk 명령은 대략적인 hom/het만 제공합니다.
인델.

사용 예


· Easyrun 스크립트:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· easyrun 뒤에 있는 주요 명령:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
maq 맵 part1.map ref.bfa part1.bfq;
maq 맵 part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq 어셈블 cns.cns ref.bfa aln.map;

onworks.net 서비스를 사용하여 maq 온라인 사용


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

  • 1
    추적하다
    추적하다
    strace 프로젝트가 다음 위치로 이동되었습니다.
    https://strace.io. strace is a
    진단, 디버깅 및 교육
    Linux용 사용자 공간 추적기. 그것은 사용
    모니터하기 위해...
    다운로드
  • 2
    gMKV추출GUI
    gMKV추출GUI
    mkvextract 유틸리티용 GUI(의 일부
    (만약
    전부는 아님) mkvextract의 기능 및
    mkvinfo 유틸리티. C#NET 4.0으로 작성된...
    gMKVExtractGUI 다운로드
  • 3
    JasperReports 라이브러리
    JasperReports 라이브러리
    JasperReports 라이브러리는
    세계에서 가장 인기 있는 오픈 소스
    비즈니스 인텔리전스 및 보고
    엔진. 그것은 완전히 Java로 작성되었습니다.
    그리고 그것은 할 수 있습니다 ...
    JasperReports 라이브러리 다운로드
  • 4
    프라페 북스
    프라페 북스
    Frappe Books는 무료 오픈 소스입니다.
    데스크톱 부기 소프트웨어는
    간단하고 잘 설계된
    소기업 및 프리랜서. 그것'...
    Frappe 책 다운로드
  • 5
    수치 파이썬
    수치 파이썬
    뉴스: NumPy 1.11.2가 마지막 릴리스입니다.
    그것은 sourceforge에서 만들어질 것입니다. 바퀴
    윈도우, 맥, 리눅스 뿐만 아니라
    보관된 소스 배포는 다음과 같을 수 있습니다.
    수치 파이썬 다운로드
  • 6
    CMU 스핑크스
    CMU 스핑크스
    CMUSphinx는 스피커 독립적인 대형
    어휘 연속 음성 인식기
    BSD 스타일 라이선스로 출시되었습니다. 그것은
    또한 오픈 소스 도구 모음 ...
    CMU 스핑크스 다운로드
  • 더»

Linux 명령

Ad