미니맵 - 클라우드의 온라인

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 명령 미니맵입니다.

프로그램:

이름


미니맵 - 긴 DNA 서열 사이의 빠른 매핑

개요


미니맵 [-lSOV] [-k kmer] [-w 윈사이즈] [-I 배치 크기] [-d 덤프파일] [-f OccThres] [-r
대역폭] [-m 최소 공유] [-c 최소 개수] [-L 최소 일치] [-g 최대 간격] [-T 먼지Thres] [-t
nThread] [-x 사전] target.fa query.fa > 출력.paf

기술


미니맵은 두 개 사이의 여러 대략적인 매핑 위치를 효율적으로 찾는 도구입니다.
읽기와 참조 게놈 사이, 게놈과
긴 시끄러운 읽기 사이. Minimap에는 인덱싱 및 매핑 단계가 있습니다. 인덱싱에서
단계에서는 해시 테이블에서 대상 시퀀스의 대규모 배치에 대한 모든 최소화기를 수집합니다. ~에
매핑 단계에서는 동일선상 최소화 적중의 양호한 클러스터를 식별합니다. 미니맵은
대상과 쿼리 시퀀스 간에 자세한 정렬을 생성하지 않습니다. 그것만
이러한 클러스터의 대략적인 시작 및 끝 좌표를 출력합니다.

옵션


색인 옵션
-k INT k-mer 길이 최소화 [15]

-w INT 최소화 창 크기[k-mer 길이의 2/3]. 최소화기는 가장 작은 k-mer입니다.
w 연속 k-mer의 창에서.

-I NUM 최대 로드 NUM 인덱싱 [4G]을 위해 대상 기지를 RAM으로 지정합니다. 이상이 있는 경우
NUM 기지 target.fa, 미니맵을 읽어야 합니다. query.fa 그것을 매핑하기 위해 여러 번
대상 시퀀스의 각 배치에 대해. NUM k/K/m/M/g/G로 끝날 수 있습니다.

-d FILE 최소화 인덱스를 다음으로 덤프 FILE [덤프 없음]

-l 그것을 표시 target.fa 실제로 옵션에 의해 생성된 최소화 지수 -d가 아닌
FASTA 또는 FASTQ 파일.

매핑 옵션
-f 흙손 상단 무시 흙손 가장 많이 발생하는 최소화 프로그램의 비율 [0.001]

-r INT 초기 최소화 적중 클러스터링 [500]에 대한 대략적인 대역폭. ㅏ 최소화기
대상 및 쿼리 시퀀스 모두에 존재하는 최소화기입니다. ㅏ 최소화기
클러스터 대상 사이의 잠재적으로 동일선상에 있는 최소화 적중 그룹입니다.
및 쿼리 시퀀스.

-m 흙손 다음과 같은 경우 초기 최소화 히트 클러스터를 병합합니다. 흙손 또는 더 높은 비율의 최소화기
클러스터 간에 공유됨[0.5]

-c INT 다음을 포함하는 경우 최소화 히트 클러스터를 유지합니다. INT 최소 조회수 이상 [4]

-L INT 공선형화 후 일치 횟수가 다음과 같은 경우 최소화 히트 클러스터를 폐기
기지는 아래에 있습니다 INT [40]. 이 옵션은 주로 출력 크기를 줄입니다. 그것은 가지고있다
속도와 피크 메모리에 거의 영향을 미치지 않습니다.

-g INT 간격에서 최소화 히트 클러스터 분할 INT-bp 이상을 포함하지 않는 것
모든 최소기 적중 [10000]

-T INT SDUST 점수 임계값으로 쿼리 시퀀스의 마스크 영역 INT; 비활성화하려면 0
[0]. SDUST는 복잡성이 낮은 하위 시퀀스를 식별하는 알고리즘입니다. 그렇지 않다
기본적으로 활성화됩니다. SDUST가 선호되는 경우 20에서 25 사이의 값은
추천합니다. 임계값이 높을수록 시퀀스를 덜 마스킹합니다.

-S all-vs-all 매핑을 수행합니다. 이 모드에서 쿼리 시퀀스 이름이
대상 시퀀스 이름보다 사전식으로 더 크면 둘 사이의 적중
억제됩니다. 쿼리 시퀀스 이름이 대상 이름과 동일한 경우
대각선 최소화 히트도 억제됩니다.

-O 다른 히트와 멀리 떨어져 있는 경우 미니마이저 히트를 떨어뜨립니다(실험적). 이것
옵션은 분기된 두 종의 긴 염색체를 매핑하는 데 유용합니다.

-x STR 다음을 기준으로 여러 설정 변경 STR [설정되지 않음]. 적용하는 것이 좋습니다
다음 옵션이 재정의할 수 있도록 다른 옵션보다 먼저 이 옵션
이 옵션으로 수정된 여러 설정.

아바10k PacBio 또는 Oxford Nanopore all-vs-all 읽기 매핑(-Sw5 -L100 -m0)의 경우.

입출력 옵션
-t INT 스레드 수 [3]. Minimap은 수집 시 최대 XNUMX개의 스레드를 사용합니다.
대상 시퀀스에 대한 최소화, 최대 사용 INT매핑 시 +1 스레드(
추가 스레드는 자주 유휴 상태이고 CPU 시간이 거의 걸리지 않는 I/O용입니다.

-V 버전 번호를 stdout으로 인쇄

출력 FORMAT


Minimap은 PAF(Pairwise mApping Format)로 매핑 위치를 출력합니다. PAF는 TAB-
에 설명된 대로 최소 12개의 필드로 구성된 각 행이 있는 구분된 텍스트 형식
다음 표 :

┌────┬──────────────────────────────────────────────── ───────────────────────────┐
타입상품 설명
├────┼──────────────────────────────────────────────── ───────────────────────────┤
│ 1 │ 문자열 │ 쿼리 시퀀스 이름 │
│ 2 │ int │ 쿼리 시퀀스 길이 │
│ 3 │ int │ 쿼리 시작 좌표(0부터 시작) │
│ 4 │ int │ 쿼리 종료 좌표(0부터 시작) │
│ 5 │ char │ 쿼리와 대상이 같은 가닥이면 `+'; `-' 반대일 경우 │
│ 6 │ 문자열 │ 대상 시퀀스 이름 │
│ 7 │ int │ 대상 시퀀스 길이 │
│ 8 │ int │ 원래 가닥의 대상 시작 좌표 │
│ 9 │ int │ 원래 가닥의 대상 끝 좌표 │
│ 10 │ int │ 매핑에서 일치하는 염기의 수 │
│ 11 │ int │ 매핑에서 간격을 포함한 숫자 기반 │
│ 12 │ int │ 매핑 품질(0-255, 누락된 경우 255) │
└────┴──────────────────────────────────────────────── ───────────────────────────┘

정렬을 사용할 수 있는 경우 열 11은 시퀀스 일치의 총 수를 제공합니다.
정렬의 불일치 및 간격; 열 10을 열 11로 나눈 값은 정렬을 제공합니다.
신원. 미니맵은 자세한 정렬을 생성하지 않으므로 이 두 열은
근사치를 내다. PAF는 선택적으로 SAM과 유사한 유형의 키-값에 추가 필드를 가질 수 있습니다.
체재. Minimap은 클러스터의 최소화 히트 수를 cm 태그에 기록합니다.

onworks.net 서비스를 사용하여 온라인에서 미니맵 사용



최신 Linux 및 Windows 온라인 프로그램