IngleseFranceseSpagnolo

Ad


Favicon di OnWorks

minimappa - Online nel cloud

Esegui la minimappa nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questa è la minimappa dei comandi che può essere eseguita nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici postazioni di lavoro online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


minimappa - mappatura veloce tra lunghe sequenze di DNA

SINOSSI


minimappa [-lSOV] [-k kmer] [-w winSize] [-I dimensione del lotto] [-d File spazzatura] [-f occThres] [-r
larghezza di banda] [-m minCondiviso] [-c minCount] [-L minMatch] [-g maxGap] [-T polvereThres] [-t
nThread] [-x preset] target.fa query.fa > uscita.paf

DESCRIZIONE


La minimappa è uno strumento per trovare in modo efficiente più posizioni di mappatura approssimative tra due
insiemi di lunghe sequenze, come tra letture e genomi di riferimento, tra genomi e
tra lunghe letture rumorose. La minimappa ha una fase di indicizzazione e mappatura. Nell'indicizzazione
fase, raccoglie tutti i minimi di un grande batch di sequenze target in una tabella hash; in
la fase di mappatura, identifica buoni cluster di riscontri minimi colineari. La minimappa lo fa
non generare allineamenti dettagliati tra la destinazione e le sequenze di query. Solo
restituisce le coordinate approssimative di inizio e fine di questi cluster.

VERSIONI


Indicizzazione Opzioni
-k INT Minimizza lunghezza k-mer [15]

-w INT Dimensioni della finestra di riduzione al minimo [2/3 della lunghezza k-mer]. Un minimo è il più piccolo k-mer
in una finestra di w k-mer consecutivi.

-I NUM Carica al massimo NUM basi di destinazione nella RAM per l'indicizzazione [4G]. Se ci sono più di
NUM basi in target.fa, la minimappa deve essere letta query.fa più volte per mapparlo
contro ogni lotto di sequenze target. NUM potrebbe terminare con k/K/m/M/g/G.

-d RISORSE Scarica l'indice di riduzione a RISORSE [nessuna discarica]

-l Indica quello target.fa è infatti un indice di minimizzazione generato dall'opzione -dnon,
un file FASTA o FASTQ.

Mappatura Opzioni
-f FLOAT Ignora in alto FLOAT frazione della maggior parte dei minimi che si verificano [0.001]

-r INT Larghezza di banda approssimativa per il clustering di riscontri minimi iniziali [500]. UN minimizzare
colpire è un minimizzatore presente sia nella sequenza di destinazione che in quella di query. UN minimizzare
colpire gruppo è un gruppo di colpi di minimizzazione potenzialmente collineari tra un bersaglio
e una sequenza di query.

-m FLOAT Unisci i cluster di hit del minimo iniziale se FLOAT o frazione superiore di minimi
sono condivisi tra i cluster [0.5]

-c INT Conserva un hit cluster di minimizzazione se contiene INT o più colpi di minimizzazione [4]

-L INT Scarta un hit cluster di minimizzazione se dopo la colinearizzazione, il numero di corrispondenze
le basi sono sotto INT [40]. Questa opzione riduce principalmente le dimensioni dell'output. Esso ha
scarso effetto sulla velocità e sulla memoria di picco.

-g INT Dividi un hit cluster di minimizzazione in corrispondenza di un gap INT-bp o più che non contiene
eventuali riscontri minimi [10000]

-T INT Maschera le regioni sulle sequenze di query con soglia del punteggio SDUST INT; 0 per disabilitare
[0]. SDUST è un algoritmo per identificare sottosequenze a bassa complessità. Non è
abilitato per impostazione predefinita. Se si preferisce SDUST, un valore compreso tra 20 e 25 è
consigliato. Una soglia più alta maschera meno sequenze.

-S Eseguire la mappatura all-vs-all. In questa modalità, se il nome della sequenza di query è
lessicograficamente più grande del nome della sequenza di destinazione, i risultati tra di loro
sarà soppresso; se il nome della sequenza di query è lo stesso del nome di destinazione,
anche i colpi di minimizzazione diagonale verranno soppressi.

-O Rilascia un colpo di minimizzazione se è lontano da altri colpi (SPERIMENTALE). Questo
L'opzione è utile per mappare i cromosomi lunghi di due specie divergenti.

-x STR Modifica di più impostazioni in base a STR [non impostato]. Si consiglia di applicare
questa opzione prima di altre opzioni, in modo tale che le seguenti opzioni possano sovrascrivere
le molteplici impostazioni modificate da questa opzione.

ava10k per PacBio o Oxford Nanopore all-vs-all read mapping (-Sw5 -L100 -m0).

Input / output Opzioni
-t INT Numero di thread [3]. La minimappa utilizza al massimo tre thread durante la raccolta
riduce al minimo le sequenze target e utilizza fino a INT+1 thread durante la mappatura (il
thread extra è per I/O, che è spesso inattivo e richiede poco tempo CPU).

-V Stampa il numero della versione su stdout

USCITA FORMATO


La minimappa emette le posizioni di mappatura nel formato di mappatura a coppie (PAF). PAF è un TAB-
formato di testo delimitato con ogni riga composta da almeno 12 campi come descritto in
la seguente tabella:

? ?
Berretto o sciarpaTipologiaDescrizione
? ?
│ 1 │ stringa │ Nome sequenza query │
│ 2 │ int │ Lunghezza della sequenza di query │
│ 3 │ int │ Coordinata inizio query (in base 0) │
│ 4 │ int │ Coordinata finale della query (in base 0) │
│ 5 │ char │ `+' se query e target sullo stesso strand; `-' se opposto │
│ 6 │ stringa │ Nome sequenza target │
│ 7 │ int │ Lunghezza sequenza target │
│ 8 │ int │ Coordinata iniziale del target sul trefolo originale │
│ 9 │ int │ Coordinata finale di destinazione sul trefolo originale │
│ 10 │ int │ Numero di basi corrispondenti nella mappatura │
│ 11 │ int │ Basi numeriche, comprese le lacune, nella mappatura │
│ 12 │ int │ Qualità della mappatura (0-255 con 255 mancante) │
? ?

Quando l'allineamento è disponibile, la colonna 11 fornisce il numero totale di corrispondenze di sequenza,
disallineamenti e lacune nell'allineamento; la colonna 10 divisa per la colonna 11 dà l'allineamento
identità. Poiché la minimappa non genera un allineamento dettagliato, queste due colonne sono
approssimativo. PAF può facoltativamente avere campi aggiuntivi nel valore-chiave digitato in modo simile a SAM
formato. Minimap scrive il numero di riscontri minimi in un cluster nel tag cm.

Usa la minimappa online utilizzando i servizi onworks.net


Server e workstation gratuiti

Scarica app per Windows e Linux

Comandi Linux

Ad