InglesPransesEspanyol

Patakbuhin ang mga server | Ubuntu > | Fedora > |


OnWorks favicon

minimap - Online sa Cloud

Patakbuhin ang minimap sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command minimap na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


minimap - mabilis na pagmamapa sa pagitan ng mahabang DNA sequence

SINOPSIS


minimap [-lSOV] [-k kmer] [-w winSize] [-I batchSize] [-d dumpFile] [-f occThres] [-r
BandWidth] [-m minShared] [-c minCount] [-L minMatch] [-g maxGap] [-T alikabokThres] [-t
nThreads] [-x preset] target.fa tanong.fa > output.paf

DESCRIPTION


Ang Minimap ay isang tool upang mahusay na makahanap ng maramihang tinatayang posisyon sa pagmamapa sa pagitan ng dalawa
set ng mahabang sequence, tulad ng sa pagitan ng mga reads at reference genome, sa pagitan ng genome at
sa pagitan ng mahabang maingay na pagbabasa. Ang Minimap ay may indexing at isang mapping phase. Sa pag-index
phase, kinokolekta nito ang lahat ng mga minimizer ng isang malaking batch ng mga target na sequence sa isang hash table; sa
sa yugto ng pagmamapa, kinikilala nito ang magagandang kumpol ng mga hit ng colinear minimizer. Ginagawa ng Minimap
hindi bumuo ng mga detalyadong pagkakahanay sa pagitan ng target at ng mga pagkakasunud-sunod ng query. Ito lamang
output ang tinatayang simula at dulo ng mga coordinate ng mga cluster na ito.

Opsyon


Pag-index pagpipilian
-k Int Minimizer k-mer haba [15]

-w Int Minimizer window size [2/3 ng k-mer length]. Ang minimizer ay ang pinakamaliit na k-mer
sa isang bintana ng w magkasunod na k-mers.

-I NUM Mag-load nang higit pa NUM target base sa RAM para sa pag-index [4G]. Kung mayroong higit sa
NUM base sa target.fa, kailangang basahin ang minimap tanong.fa maraming beses upang i-map ito
laban sa bawat batch ng mga target na sequence. NUM maaaring nagtatapos sa k/K/m/M/g/G.

-d FILE Dump minimizer index sa FILE [walang tambakan]

-l Ipahiwatig iyon target.fa sa katunayan ay isang minimizer index na nabuo sa pamamagitan ng opsyon -d, Hindi
isang FASTA o FASTQ na file.

Pagma-map pagpipilian
-f Lumutang Huwag pansinin ang tuktok Lumutang fraction ng karamihan sa mga nagaganap na minimizer [0.001]

-r Int Tinatayang bandwidth para sa paunang minimizer hit clustering [500]. A minimizer
tamaan ay isang minimizer na nasa parehong target at query sequence. A minimizer
tamaan kumpol ay isang pangkat ng mga potensyal na colinear minimizer hit sa pagitan ng isang target
at isang pagkakasunod-sunod ng query.

-m Lumutang Pagsamahin ang mga paunang minimizer hit cluster kung Lumutang o mas mataas na bahagi ng mga minimizer
ay ibinabahagi sa pagitan ng mga kumpol [0.5]

-c Int Panatilihin ang isang minimizer hit cluster kung naglalaman ito Int o higit pang minimizer hit [4]

-L Int Itapon ang isang minimizer hit cluster kung pagkatapos ng colinearization, ang bilang ng pagtutugma
nasa ibaba ang mga base Int [40]. Ang pagpipiliang ito ay pangunahing binabawasan ang laki ng output. Mayroon itong
maliit na epekto sa bilis at peak memory.

-g Int Hatiin ang isang minimizer hit cluster sa isang gap Int-bp o mas matagal na hindi naglalaman
anumang minimizer hit [10000]

-T Int I-mask ang mga rehiyon sa mga pagkakasunud-sunod ng query na may threshold ng marka ng SDUST Int; 0 upang huwag paganahin
[0]. Ang SDUST ay isang algorithm upang tukuyin ang mga subsequence na mababa ang kumplikado. Hindi ito
pinagana bilang default. Kung mas gusto ang SDUST, ang halaga sa pagitan ng 20 at 25 ay
inirerekomenda. Ang isang mas mataas na threshold ay nagtatakip ng mas kaunting mga pagkakasunud-sunod.

-S Magsagawa ng all-vs-all na pagmamapa. Sa mode na ito, kung ang pangalan ng query sequence ay
lexicographically mas malaki kaysa sa target na sequence name, ang mga hit sa pagitan ng mga ito
ay pipigilan; kung ang pangalan ng pagkakasunud-sunod ng query ay kapareho ng pangalan ng target,
pipigilan din ang diagonal minimizer hit.

-O Mag-drop ng minimizer hit kung malayo ito sa iba pang hit (EXPERIMENTAL). Ito
Ang opsyon ay kapaki-pakinabang para sa pagmamapa ng mahabang chromosome mula sa dalawang diverged species.

-x STR Pagbabago ng maramihang mga setting batay sa STR [hindi nakatakda]. Inirerekomenda na mag-aplay
ang opsyong ito bago ang iba pang mga opsyon, upang ang mga sumusunod na opsyon ay maaaring ma-override
ang maramihang mga setting na binago ng opsyong ito.

ava10k para sa PacBio o Oxford Nanopore all-vs-all read mapping (-Sw5 -L100 -m0).

Input / output pagpipilian
-t Int Bilang ng mga thread [3]. Gumagamit ang Minimap ng hindi hihigit sa tatlong mga thread kapag nangongolekta
mga minimizer sa mga target na sequence, at gumagamit ng hanggang Int+1 na mga thread kapag nagmamapa (ang
ang dagdag na thread ay para sa I/O, na kadalasang idle at tumatagal ng kaunting oras ng CPU).

-V I-print ang numero ng bersyon sa stdout

oUTPUT FORMAT


Ang Minimap ay naglalabas ng mga posisyon sa pagmamapa sa Pairwise mApping Format (PAF). Ang PAF ay isang TAB-
delimited text format na may bawat linya na binubuo ng hindi bababa sa 12 field gaya ng inilalarawan sa
sumusunod na talahanayan:

┌────┬────────┬─────────────────────────────────── ──────────────────────────┐
Siyauripaglalarawan
├────┼────────┼─────────────────────────────────── ──────────────────────────┤
│ 1 │ string │ Pangalan ng sequence ng query │
│ 2 │ int │ Haba ng sequence ng query │
│ 3 │ int │ Query start coordinate (0-based) │
│ 4 │ int │ Query end coordinate (0-based) │
│ 5 │ char │ `+' kung query at target sa parehong strand; `-' kung kabaligtaran │
│ 6 │ string │ Pangalan ng sequence ng target │
│ 7 │ int │ Target na haba ng sequence │
│ 8 │ int │ Target start coordinate sa orihinal na strand │
│ 9 │ int │ Target end coordinate sa orihinal na strand │
│ 10 │ int │ Bilang ng mga tumutugmang base sa pagmamapa │
│ 11 │ int │ Mga base ng numero, kabilang ang mga puwang, sa pagmamapa │
│ 12 │ int │ Kalidad ng pagmamapa (0-255 na may 255 para sa nawawala) │
└────┴────────┴─────────────────────────────────── ──────────────────────────┘

Kapag available na ang alignment, ibinibigay ng column 11 ang kabuuang bilang ng mga tugma ng sequence,
hindi pagkakatugma at gaps sa pagkakahanay; Ang hanay 10 na hinati sa hanay 11 ay nagbibigay ng pagkakahanay
pagkakakilanlan. Dahil ang minimap ay hindi bumubuo ng detalyadong pagkakahanay, ang dalawang column na ito ay
tinatayang. Ang PAF ay maaaring opsyonal na magkaroon ng mga karagdagang field sa SAM-like typed key-value
pormat. Isinusulat ng Minimap ang bilang ng mga hit ng minimizer sa isang cluster sa tag na cm.

Gumamit ng minimap online gamit ang mga serbisyo ng onworks.net


Ad


Ad