IngleseFranceseTedescoItalianoPortogheseRussianSpagnolo

Favicon di OnWorks

maq - Online nel cloud

Esegui maq nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questo è il comando maq che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


Maq - Mappatura e assemblaggio con qualità

SINOSSI


trucco command [Opzioni] argomenti

maq.pl command [Opzioni] argomenti

DESCRIZIONE


Maq è un software che costruisce assiemi di mappatura da brevi letture generate dal successivo
macchine di sequenziamento di generazione. È particolarmente progettato per Illumina-Solexa 1G Genetic
Analizzatore e ha una funzionalità preliminare per gestire i dati AB SOLiD.

Con Maq puoi:

· Allinea velocemente le letture Illumina/SOLID al genoma di riferimento. Con le opzioni predefinite, uno
milioni di coppie di letture possono essere mappate sul genoma umano in circa 10 ore di CPU con meno
di 1G di memoria.

· Misurare accuratamente la probabilità di errore dell'allineamento di ogni singola lettura.

· Chiamare i genotipi di consenso, compresi i polimorfismi omozigoti ed eterozigoti, con
una qualità probabilistica Phred assegnata a ciascuna base.

· Trova indel brevi con letture finali accoppiate.

· Trova con precisione delezioni genomiche su larga scala e traslocazioni con letture accoppiate.

· Scopri potenziali CNV controllando la profondità di lettura.

· Valutare l'accuratezza delle qualità di base grezza dai sequenziatori e aiutare a controllare la
errori sistematici.

Tuttavia, Maq può NON:

· Fare de nuovo montaggio. (Maq può chiamare il consenso solo mappando le letture su un noto
riferimento.)

· I cortometraggi della mappa si leggono contro se stessi. (Maq può trovare solo una sovrapposizione completa tra le letture.)

· Allineare le letture capillari o 454 letture al riferimento. (Maq non può allineare le letture più lunghe di
63 pb.)

MAQ COMANDI


Le Comandi

fasta2bfa trucco fasta2bfa in.rif.fasta out.ref.bfa

Converti sequenze in formato FASTA nel formato BFA (binary FASTA) di Maq.

veloceq2bfq trucco veloceq2bfq [-n nread] in.leggi.fastq fuori.leggi.bfqprefisso.out

Converti le letture in formato FASTQ nel formato BFQ (binario FASTQ) di Maq.

OPZIONI:

-n INT numero di letture per file [non specificato]

carta geografica trucco carta geografica [-n nmis] [-a massimi] [-c] [-1 len1] [-2 len2] [-d adattare] [-m mutare]
[-u non mappato] [-es maxer] [-M c⎪g] [-N] [-H tutti colpi] [-C massime] fuori.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

La mappa legge le sequenze di riferimento.

OPZIONI:

-n INT Numero di disallineamenti massimi sempre riscontrabili [2]

-a INT Distanza esterna massima per una coppia di lettura corretta [250]

-A INT Distanza massima esterna di due letture RF pagate (0 per disabilitare) [0]

-c La mappa si legge nello spazio colore (solo per SOLiD)

-1 INT Lunghezza di lettura per la prima lettura, 0 per auto [0]

-2 INT Lunghezza di lettura per la seconda lettura, 0 per auto [0]

-m FLOAT Tasso di mutazione tra le sequenze di riferimento e le letture [0.001]

-d FILE Specificare un file contenente una singola riga della sequenza dell'adattatore 3'
[nullo]

-u FILE Scarica le letture non mappate e le letture contenenti più di nmis non corrisponde a
un file separato [null]

-e INT Soglia sulla somma delle qualità di base non corrispondenti [70]

-H FILE Dump multipli/tutti i risultati di mancata corrispondenza 01 su FILE [nullo]

-C INT Numero massimo di risultati da produrre. Illimitato se maggiore di 512. [250]

-M c⎪g modalità di allineamento della metilazione. Tutti i C (o G) sul filo anteriore saranno
cambiato in T (o A). Questa opzione è solo per il test.

-N memorizzare la posizione di mancata corrispondenza nel file di output fuori.aln.map. Quando questo
è in uso, la lunghezza di lettura massima consentita è 55 bp.

NOTA:

* Le letture finali accoppiate devono essere preparate in due file, uno per ciascuna estremità, con
le letture sono ordinate nello stesso ordine. Questo significa che il k-esimo letto nel primo
il file è accoppiato con il k-esimo letto nel secondo file. La lettura corrispondente
i nomi devono essere identici fino alla coda `/1' o `/2'. Ad esempio, come
sono consentiti due nomi letti: `EAS1_1_5_100_200/1' e
"EAS1_1_5_100_200/2". La coda `/[12]' è solitamente generata dal
GAPipeline per distinguere le due estremità in coppia.

* L'output è un file binario compresso. È influenzato dall'endianità.

* Il modo migliore per eseguire questo comando è fornire da 1 a 3 milioni di letture come
ingresso. Più letture consumano più memoria.

* Opzione -n controlla la sensibilità dell'allineamento. Per impostazione predefinita, un successo con
si possono sempre trovare fino a 2 discrepanze. Più alto -n trova più risultati e anche
migliora la precisione delle qualità di mappatura. Tuttavia, questo viene fatto a costo
di velocità.

* Gli allineamenti con molti disallineamenti di alta qualità dovrebbero essere scartati come falsi
allineamenti o possibili contaminazioni. Questo comportamento è controllato dall'opzione
-e. -e la soglia è calcolata solo approssimativamente perché le qualità di base
sono divisi per 10 in una certa fase dell'allineamento. Il -Q opzione nel
assemblare comando imposta con precisione la soglia.

* Una coppia di read si dice che sia correttamente accoppiata se e solo se il
l'orientamento è FR e la distanza esterna della coppia non è maggiore di
massimi. Non c'è limite alla dimensione minima dell'inserto. Questa impostazione è
determinato dall'algoritmo di allineamento delle estremità accoppiato utilizzato in Maq. Richiedendo un
la dimensione minima dell'inserto porterà ad alcuni allineamenti errati con altamente
qualità di mappatura sovrastimate.

* Attualmente, le coppie di lettura dalla libreria a inserimento lungo Illumina/Solexa hanno una lettura RF
orientamento. La dimensione massima dell'inserto è impostata dall'opzione -A. Tuttavia, a lungo
la libreria di inserimento è anche mescolata con una piccola frazione di lettura di inserimenti brevi
coppie. -a dovrebbe anche essere impostato correttamente.

* A volte può essere sequenziata l'estremità 5' o anche l'intera sequenza dell'adattatore 3'.
Fornitura -d rende Maq per eliminare le contaminazioni dell'adattatore.

* Dati 2 milioni di letture come input, trucco di solito richiede 800 MB di memoria.

mappamerge trucco mappamerge fuori.aln.map in.aln1.map in.aln2.map [...]

Unisci insieme un batch di allineamenti di lettura.

NOTA:

* In teoria, questo comando può unire un numero illimitato di allineamenti. Tuttavia, come
mapmerge leggerà tutti gli input contemporaneamente, potrebbe colpire il
limite del numero massimo di file di apertura impostato dal sistema operativo. Al momento, questo
deve essere risolto manualmente dagli utenti finali.

* Comando mappamerge può essere utilizzato per unire file di allineamento con letture diverse
lunghezze. Tutte le analisi successive non assumono più una lunghezza fissa.

rmdup trucco rmdup out.rmdup.map mappa in.ori

Rimuovi le coppie con coordinate esterne identiche. In linea di principio, si accoppia con
coordinate esterne identiche dovrebbero accadere raramente. Tuttavia, a causa del
amplificazione nella preparazione del campione, ciò si verifica molto più frequentemente che da
opportunità. Analisi pratiche mostrano che la rimozione dei duplicati aiuta a migliorare il
precisione complessiva della chiamata SNP.

assemblare trucco assemblare [-sp] [-m massimo] [-Q maxer] [-r etrato] [-t coef] [-q minQ] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

Chiama le sequenze di consenso da read mapping.

OPZIONI:

-t FLOAT Coefficiente di dipendenza dall'errore [0.93]

-r FLOAT Frazione di eterozigoti tra tutti i siti [0.001]

-s Prendi la qualità di mappatura a estremità singola come qualità di mappatura finale;
in caso contrario verrà utilizzata la qualità della mappatura delle estremità accoppiate

-p Elimina le letture finali accoppiate che non sono mappate nelle coppie corrette

-m INT Numero massimo di discrepanze consentite per una lettura da utilizzare in
consenso chiamata [7]

-Q INT Somma massima consentita dei valori di qualità delle basi non corrispondenti [60]

-q INT Qualità di mappatura minima consentita per l'utilizzo di una lettura in consenso
chiamando [0]

-N INT Numero di aplotipi nel pool (>=2) [2]

NOTA:

* Opzione -Q stabilisce un limite alla somma massima delle qualità di base non corrispondenti.
Le letture che contengono molte discrepanze di alta qualità dovrebbero essere scartate.

* Opzione -N imposta il numero di aplotipi in un pool. È progettato per
risequenziamento dei campioni mettendo insieme più ceppi/individui. Per
risequenziamento del genoma diploide, questa opzione è uguale a 2.

glfgen trucco glfgen [-sp] [-m massimo] [-Q maxer] [-r etrato] [-t coef] [-q minQ] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

Calcola la probabilità logaritmica per tutti i genotipi e memorizza i risultati in formato GLF
(Formato di verosimiglianza genotipizzazione). Si prega di controllare il sito web MAQ per i dettagli
descrizioni del formato del file e delle relative utilità.

indipendente trucco indipendente in.ref.bfa in.aln.map > out.indelpe

Chiama indel coerenti da letture finali accoppiate. L'uscita è delimitata da TAB con
ogni riga composta da cromosoma, posizione iniziale, tipo di indel, numero
di letture attraverso l'indel, dimensione dell'indel e nucleotidi inseriti/cancellati
(separato da due punti), numero di indel sul filo inverso, numero di indel
sul filamento in avanti, sequenza 5' davanti all'indel, sequenza 3' dopo
l'indel, numero di letture allineate senza indel e tre colonne aggiuntive
per filtri.

Alla 3a colonna, tipo dell'indel, una stella indica che l'indel è confermato
da letture da entrambi i filamenti, un più significa che l'indel è colpito da almeno due letture
ma dallo stesso filone, un meno mostra che l'indel si trova solo su una lettura,
e un punto significa che l'indel è troppo vicino a un altro indel e viene filtrato.

Si consiglia agli utenti di eseguire `maq.pl indelpe' per correggere il numero di
legge mappata senza indel. Per maggiori dettagli, vedere il `maq.pl indelpe'
.

indelsoa trucco indelsoa in.ref.bfa in.aln.map > fuori.indelsoa

Chiamare potenziali indel omozigoti e punti di rottura rilevando l'anormale
schema di allineamento attorno agli indel e ai punti di rottura. L'output è anche TAB
delimitato da ogni linea costituita da cromosoma, coordinate approssimative,
lunghezza della regione anormale, numero di letture mappate nella posizione,
numero di letture sul lato sinistro della posizione e numero di letture su
il lato destro. L'ultima colonna può essere ignorata.

L'output contiene molti falsi positivi. Un filtro consigliato potrebbe essere:

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

Si noti che questo comando non mira ad essere un rilevatore indel accurato, ma
aiuta principalmente ad evitare alcuni falsi positivi nelle chiamate di sostituzione. In
inoltre, funziona bene solo con una profondità profonda (~40X per esempio); altrimenti il
il tasso di falsi negativi sarebbe molto alto.

Formato Conversione

sol2sanger trucco sol2sanger in.sol.fastq fuori.sanger.fastq

Converti Solexa FASTQ in formato FASTQ standard/Sanger.

bfq2fastq trucco bfq2fastq in.leggi.bfq out.read.fastq

Converti il ​​formato BFQ di Maq nel formato FASTQ standard.

mapass2maq trucco mapass2maq in.mapass2.map out.maq.map

Converti il ​​formato mappa obsoleto di mapass2 nel formato mappa di Maq. Il vecchio formato lo fa
non contenere nomi letti.

Informazioni Estrazione

Vista mappa trucco Vista mappa [-bN] in.aln.map > out.aln.txt

Visualizza l'allineamento di lettura in testo normale. Per le letture allineate prima dello Smith-
Allineamento Waterman, ogni riga è composta da nome letto, cromosoma, posizione,
filo, inserire la dimensione dalle coorniate esterne di una coppia, bandiera accoppiata, mappatura
qualità, qualità di mappatura single-end, qualità di mappatura alternativa, numero di
discrepanze della migliore hit, somma delle qualità delle basi non corrispondenti della migliore
hit, numero di hit con mancata corrispondenza 0 dei primi 24 bp, numero di hit con mancata corrispondenza 1 di
i primi 24bp sul riferimento, lunghezza della lettura, sequenza di lettura e sua
qualità. La qualità della mappatura alternativa è sempre uguale alla qualità della mappatura se il
le letture non sono accoppiate. Se le letture sono accoppiate, è uguale alla mappatura più piccola
qualità delle due estremità. Questa qualità di mappatura alternativa è in realtà il
qualità di mappatura di una coppia anormale.

La quinta colonna, flag accoppiato, è un flag bit a bit. I suoi 4 bit inferiori danno il
orientamento: 1 sta per FF, 2 per FR, 4 per RF e 8 per RR, dove FR significa
che la lettura con coordinate più piccole è sul filo in avanti, e il suo compagno è
sul filo inverso. Solo FR è consentito per una coppia corretta. I bit più alti
di questa bandiera forniscono ulteriori informazioni. Se la coppia incontra la fine accoppiata
requisito, 16 saranno impostati. Se le due letture sono mappate su differenti
cromosomi, 32 saranno impostati. Se una delle due letture non può essere affatto mappata,
64 sarà impostato. Il flag per una coppia corretta è sempre uguale a 18.

Per le letture allineate successivamente dall'allineamento Smith-Waterman, la bandiera è
sempre 130. Una riga è composta da leggere nome, cromosoma, posizione, filamento, inserto
size, flag (sempre 130), posizione dell'indel sulla lettura (0 se nessun indel),
lunghezza degli indel (positiva per le inserzioni e negativa per le delezioni),
qualità di mappatura del suo compagno, numero di mismatch del miglior colpo, somma di
qualità delle basi non corrispondenti del miglior risultato, due zeri, lunghezza della lettura,
leggere la sequenza e la sua qualità. Il compagno di una lettura segnalata da 130 ottiene sempre un
bandiera 18.

Il flag 192 indica che la lettura non è mappata ma il suo accoppiamento è mappato. Per tale
una coppia di lettura, una lettura ha il flag 64 e l'altra ha 192.

OPZIONI:

-b non visualizzare la sequenza di lettura e la qualità

-N visualizzare le posizioni in cui si verificano le discrepanze. Questo flag funziona solo
con un file .map generato da `maq map -N'.

mapcheck trucco mapcheck [-s] [-m massimo] [-q minQ] in.ref.bfa in.aln.map > out.mapcheck

Leggi il controllo di qualità. Il mapcheck riporta prima la composizione e la profondità di
il riferimento. Dopo c'è un modulo. La prima colonna indica il
posizione su una lettura. Seguono quattro colonne che mostrano il nucleotide
composizione, saranno indicati i tassi di sostituzione tra il riferimento e le letture.
Queste tariffe e i numeri nelle colonne seguenti sono scalati a 999 e
arrotondato all'intero più vicino. Il prossimo gruppo di colonne mostra la distribuzione di
qualità di base lungo le letture a un intervallo di qualità di 10. Un decadimento della qualità
di solito può essere osservato, il che significa che le basi alla fine della lettura sono meno
preciso. L'ultimo gruppo di colonne presenta la frazione di sostituzioni per
leggere le basi ad un intervallo di qualità. Questo misura l'accuratezza della qualità di base
stima. Idealmente, ci aspettiamo di vedere 1 su 3? colonna, 10 nel 2? colonna
e 100 nell'1? colonna.

OPZIONI:

-s Prendi la qualità di mappatura a estremità singola come qualità di mappatura finale

-m INT Numero massimo di errori consentiti per il conteggio di una lettura [4]

-q INT Qualità di mappatura minima consentita per il conteggio di una lettura [30]

pileup trucco pileup [-spvP] [-m massimo] [-Q maxer] [-q minQ] [-l file del sito] in.ref.bfa
in.aln.map > out.pileup

Visualizza l'allineamento in un formato di testo `pileup'. Ogni linea è composta da
cromosoma, posizione, base di riferimento, profondità e le basi sulle letture che coprono
questa posizione. Se -v viene aggiunto sulla riga di comando, qualità di base e mappatura
le qualità saranno presentate nella sesta e settima colonna in ordine.

La quinta colonna inizia sempre con "@". In questa colonna, leggi basi identiche
al riferimento sono mostrati in virgola `,' o punto `.', e leggere basi differenti
dal riferimento nelle lettere. Una virgola o una maiuscola indicano che la base
deriva da una lettura allineata sul filo anteriore, mentre un punto o una minuscola su
il filo inverso.

Questo comando è per gli utenti che desiderano sviluppare i propri chiamanti SNP.

OPZIONI:

-s Prendi la qualità di mappatura a estremità singola come qualità di mappatura finale

-p Elimina le letture finali accoppiate che non sono mappate come coppie corrette

-v Emetti informazioni dettagliate, comprese le qualità di base e la mappatura
qualità

-m INT Numero massimo di discrepanze consentite per una lettura da utilizzare [7]

-Q INT Numero massimo consentito di valori di qualità delle discrepanze [60]

-q INT Qualità di mappatura minima consentita per l'utilizzo di una lettura [0]

-l FILE File contenente i siti in cui verrà stampato il pileup. In questo
file la prima colonna riporta i nomi del riferimento e la seconda
le coordinate. Le colonne aggiuntive verranno ignorate. [nullo]

-P emette anche la posizione di base sulla lettura

cns2fq trucco cns2fq [-Q minMapQ] [-n minNeiQ] [-d minDepth] [-D profondità massima] in.cns >
out.cns.fastq

Estrarre le sequenze di consenso in formato FASTQ. Nelle linee di sequenza, basi
in minuscolo sono essenzialmente ripetizioni o non hanno una copertura sufficiente; basi
in maiuscolo indicare le regioni in cui gli SNP possono essere chiamati in modo affidabile. Nel
linee di qualità, ASCII di un carattere meno 33 dà la qualità PHRED.

OPZIONI:

-Q INT Qualità di mappatura minima [40]

-d INT Profondità di lettura minima [3]

-n INT Qualità vicina minima [20]

-D INT Massima profondità di lettura. >=255 per illimitato. [255]

cns2snp trucco cns2snp in.cns > fuori.snp

Estrarre i siti SNP. Ogni linea è composta da cromosoma, posizione, base di riferimento,
base di consenso, qualità di consenso simile a Phred, profondità di lettura, numero medio di
colpi di letture che coprono questa posizione, la massima qualità di mappatura delle letture
coprendo la posizione, la qualità minima di consenso nell'affiancamento di 3bp
regioni su ciascun lato del sito (6bp in totale), la seconda migliore chiamata, log
rapporto di verosimiglianza tra la seconda migliore e la terza migliore chiamata e la terza migliore
chiamata.

La quinta colonna è il criterio chiave per giudicare l'affidabilità di un SNP.
Tuttavia, poiché questa qualità viene calcolata solo supponendo l'indipendenza del sito, tu
dovrebbe anche prendere in considerazione altre colonne per ottenere chiamate SNP più accurate. sceneggiatura
comando `maq.pl Filtro SNP' è progettato per questo (vedi sotto).

La settima colonna indica se il sito ricade in una regione ripetitiva. se no
leggere la copertura del sito può essere mappata con un'elevata qualità di mappatura, l'affiancamento
regione è forse ripetitiva o nella mancanza di buone letture. Un SNP in tale sito
di solito non è affidabile.

L'ottava colonna indica approssimativamente il numero di copie della regione fiancheggiante nel
genoma di riferimento. Nella maggior parte dei casi, questo numero si avvicina a 1.00, il che significa che
regione è unica. A volte potresti vedere una profondità di lettura diversa da zero ma 0.00 a
la settima colonna. Questo indica che tutte le letture che coprono la posizione hanno a
almeno due disallineamenti. Maq conta solo il numero di risultati di mancata corrispondenza 0 e 1 per
il riferimento. Ciò è dovuto a un problema tecnico complesso.

La nona colonna fornisce la qualità vicina. Anche il filtraggio su questa colonna è
necessario per ottenere SNP affidabili. Questa idea è ispirata a NQS, anche se NQS lo è
inizialmente progettato per una singola lettura invece che per un consenso.

cns2view trucco cns2view in.cns > fuori.vista

Mostra informazioni dettagliate in tutti i siti. Il formato di output è identico a
cns2snp rapporto.

cns2ref trucco cns2ref in.cns > out.ref.fasta

Estrarre la sequenza di riferimento.

cns2win trucco cns2win [-w winsize] [-c chr] [-b iniziare] [-e fine] [-q minQ] in.cns >
out.win

Estrarre le informazioni mediate in una finestra di lavorazione. L'output è delimitato da TAB,
che consiste in nome di riferimento, coordinata divisa per 1,000,000, tasso SNP,
het rate, profondità di lettura grezza, profondità di lettura in regioni approssimativamente uniche, il
numero medio di riscontri di letture nella finestra e percentuale GC.

OPZIONI:

-w INT Dimensione di una finestra [1000]

-c STR Sequenza di riferimento destinata; in caso contrario verranno utilizzati tutti i riferimenti
[nullo]

-b INT Posizione iniziale, 0 per nessun vincolo [0]

-e INT Posizione finale, 0 per nessun vincolo [0]

-q INT Qualità minima di consenso dei siti da utilizzare [0]

Simulazione Leggi Anche

falso trucco falso [-r mutare] [-R indelfrac] in.rif.fasta > out.fakeref.fasta 2>
fuori.falso.snp

Introduci casualmente sostituzioni e indel al riferimento. Sostituzioni e
possono essere aggiunti singoli indel a coppia di basi.

OPZIONI:

-r FLOAT Tasso di mutazione [0.001]

-R FLOAT Frazione di mutazioni da indels [0.1]

simulazione trucco simulazione out.simupars.dat in.leggi.fastq

Stima/addestra i parametri per la simulazione di lettura.

simulare trucco simulare [-d in misura] [-s div.st] [-N nLetture] [-1 leggiLen1] [-2 leggiLen2] [-r
mutRate] [-R indel Frac] [-h] out.read1.fastq out.read2.fastq in.rif.fasta
in.simupars.dat

Simula letture finali accoppiate. File in.simupars.dat determina le lunghezze di lettura e
distribuzione di qualità. È generato da simulazione, o può essere scaricato da
Sito web di Maq. Nei file di lettura dell'output, un nome di lettura è costituito dal riferimento
nome della sequenza e le coordinate esterne della coppia di letture simulate. Di
predefinito simulare presuppone che le letture provengano da una sequenza diploide che viene generata
aggiungendo due diversi insiemi di mutazioni, tra cui una coppia di basi indels, a
in.rif.fasta.

OPZIONI:

-d INT media della distanza esterna delle dimensioni dell'inserto [170]

-s INT deviazione standard delle dimensioni degli inserti [20]

-N INT numero di coppie di letture da generare [1000000]

-1 INT lunghezza della prima lettura [impostata da in.simupars.dat]

-2 INT lunghezza della seconda lettura [impostata da in.simupars.dat]

-r FLOAT tasso di mutazione [0.001]

-R FLOAT frazione di 1bp indel [0.1]

-h aggiungi tutte le mutazioni a in.rif.fasta e generare letture dal singolo
sequenza mutata (modalità aploide)

NOTA:

* Le letture generate da questo comando sono indipendenti, che deviano dalla
verità. Mentre la valutazione dell'allineamento ne è meno influenzata, la valutazione su
La chiamata SNP deve essere eseguita con cautela. La dipendenza dall'errore può essere una di
le principali cause di chiamate SNP errate.

simustata trucco simustata in.simu-aln.map > out.simusta

Valutare le qualità di mappatura da letture simulate.

Solido Leggi Anche

fasta2csfa trucco fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

Converti il ​​nucleotide FASTA in FASTA con codice colore. Bandiera -c dovrebbe essere quindi applicato
a carta geografica comando. Nell'output, la lettera "A" sta per colore 0, "C" per 1, "G"
per 2 e `T' per 3. Ogni sequenza nell'output è 1 bp più corta dell'input.

csmap2nt trucco csmap2nt out.nt.map in.ref.nt.bfa in.cs.map

Converti l'allineamento del colore in allineamento del nucleotide. L'ingresso in.ref.nt.bfa Europe è
file di riferimento FASTA binario nucleotidico. Deve corrispondere al file originale
da cui viene convertito il riferimento colore. Il consenso nucleotidico può essere chiamato
dall'allineamento risultante.

Varie/Avanzate Comandi

sottomappa trucco sottomappa [-q minMapQ] [-Q maxSumErr] [-m maxMM] [-p] fuori.mappa in.mappa

Filtra gli allineamenti errati in in.mappa. Le opzioni della riga di comando sono descritte in
`assemblare' comando.

eland2maq trucco eland2maq [-q defquale] fuori.mappa in.lista in.eland

Converti l'allineamento di eland nel formato .map di maq. File in.lista consiste in
nomi di sequenza che appaiono nella settima colonna del file di allineamento eland
in.eland e il nome che ti aspetti di vedere nell'allineamento maq. Quello che segue è un
esempio:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Se stai allineando le letture in più batch utilizzando eland, è importante
usa lo stesso in.lista per la conversione. Inoltre, maq caricherà tutte le
allineamenti e ordinarli nella memoria. Se hai concatenato più eland
output in un unico file enorme, dovresti separarlo in file più piccoli per
impedisce a maq di consumare tutta la memoria della macchina.

Questo comando in realtà mira a mostrare l'allineamento di Eland in Maqview. Come nessuna qualità
le informazioni sono disponibili, il file di allineamento maq risultante non deve essere utilizzato
chiamare genotipi di consenso.

export2maq trucco export2maq [-1 read1len] [-2 read2len] [-a maxdist] [-n] fuori.mappa in.lista
in.esportazione

Converti il ​​formato Export di Illumina in Maq's .carta geografica formato. Il formato di esportazione è una novità
formato di allineamento dal SolexaPipeline-0.3.0 che calcola anche la mappatura
qualità come maq. Il file risultante può essere utilizzato per chiamare i genotipi di consenso
poiché la maggior parte delle informazioni necessarie è disponibile per maq per farlo in modo accurato.

OPZIONI:

-1 INT Lunghezza della prima lettura [0]

-2 INT Lunghezza della seconda lettura [0]

-a INT Distanza esterna massima per una coppia di lettura corretta [250]

-n Mantieni le letture filtrate

MAQ-PERL COMANDI


dimostrazione maq.pl dimostrazione [-h] [-s] [-N nCoppie] [-d outDir] in.fasta in.simudat

Dimostrare l'uso di trucco e i suoi script complementari. Questo comando sarà
simulare letture da un file FASTA in.fasta. La lunghezza e le qualità della sequenza
sono determinati da in.simudat che è generato da trucco simulazione o può essere
scaricato dal sito Maq. Le letture simulate verranno quindi mappate con
maq.pl facile. La precisione dell'allineamento è valutata da trucco simustata, le
accuratezza del consenso da trucco simultanea, e la precisione SNP di maq_eval.pl.

Per impostazione predefinita, le letture finali accoppiate verranno simulate e sarà una sequenza diploide
generato dall'input aggiungendo mutazioni a entrambi i tipi aploidi. L'inserto
le dimensioni e il tasso di mutazione sono controllati da trucco simulare.

OPZIONI:

-h simula una sequenza aploide invece di una sequenza diploide

-s usa la modalità single-end per allineare le letture invece della modalità paired-end

-N INT numero di coppie di letture da simulare [1000000]

-d DIR directory di output [maqdemo]

NOTA:

* I file di output da maq_eval.pl non sono stati documentati, ma potresti fare
una buona ipotesi su alcuni di questi file.

* Questo comando dimostra solo l'uso della suite maq. La precisione sul reale
i dati sono quasi sempre inferiori a quelli che si vedono dalla pura simulazione.

facile maq.pl facile [-1 leggi1Len] [-d out.dir] [-n nLetture] [-A 3adattatore] [-e minDep]
[-q minCnsQ] [-p] [-2 leggi2Len] [-a maxIns] [-S] [-N] in.rif.fasta in1.fastq
[in2.fastq]

Analizza la pipeline per piccoli genomi. Il comando Easyrun eseguirà la maggior parte delle analisi
implementato in trucco. Di default, facile assume tutte le sequenze di lettura in ingresso
i file sono single-end e indipendenti; quando -p è specificato, due sequenze di lettura
sono necessari file, uno per ciascuna estremità.

Diversi file verranno generati in out.dir, tra cui i seguenti file sono
l'output chiave:

cns.final.snp chiamate SNP finali con quelle di bassa qualità filtrate

cns.fq sequenze di consenso e qualità nel formato FASTQ

OPZIONI:

-d DIR directory di output [easyrun]

-n INT numero di letture/coppie in un batch di allineamento [2000000]

-S applicare analisi split-read di indel brevi (forse molto lenti)

-N INT numero di aplotipi/ceppi nel pool (>=2) [2]

-A FILE file per adattatore 3'. Il file dovrebbe contenere una singola riga di sequenza
[nullo]

-1 INT lunghezza della prima lettura, 0 per auto [0]

-e INT profondità di lettura minima richiesta per chiamare un SNP (per SNPfilter) [3]

-q INT qualità minima di consenso per gli SNP in cns.final.snp [30]

-p passare alla modalità di allineamento delle estremità abbinate

-2 INT lunghezza della seconda lettura quando -p viene applicato [0]

-a INT dimensione massima dell'inserto quando -p viene applicato [250]

NOTE:

* Per le chiamate SNP su campioni raggruppati, gli utenti devono impostare correttamente `-N' così come
`-E 0 ».

* Il file di input può essere in formato binario di maq. maq.pl rileverà automaticamente
il formato del file.

Filtro SNP maq.pl Filtro SNP [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s punteggio minimo] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtrato.snp

Escludere SNP coperti da poche letture (specificate da -d), di troppi
legge (specificato da -D), vicino (specificato da -w) a un potenziale indel, cadendo
in una possibile regione ripetitiva (caratterizzata da -Q), o di bassa qualità
basi vicine (specificate da -n). Se maxWinSNP o più SNP compaiono in qualsiasi
densWinSize finestra, verranno anche filtrati insieme.

OPZIONI:

-d INT Profondità di lettura minima richiesta per chiamare un SNP [3]

-D INT Profondità di lettura massima richiesta per chiamare un SNP (<255, altrimenti ignorato)
[256]

-Q INT Richiesta massima qualità di mappatura delle letture che coprono l'SNP [40]

-q INT Qualità minima del consenso [20]

-n INT Qualità minima del consenso adiacente [20]

-w INT Dimensione della finestra attorno ai potenziali indel. SNP che sono vicini
agli indels sarà soppresso [3]

-F FILE Il indipendente uscita [nullo]

-f FILE Il indelsoa uscita [nullo]

-s INT Punteggio minimo per un soa-indel da considerare [3]

-m INT Numero massimo di letture che possono essere mappate su un soa-indel [1]

-a Filtro alternativo per l'allineamento a un'estremità

indipendente maq.pl indipendente in.indelpe > out.indelpe

Correggere il numero di letture mappate senza indel per i tratti omopolimerici. Questo
comando modifica la quarta, la decima e le ultime tre colonne di in.indelpe che collaborano con noi, attingono direttamente dalla storia e dalla tradizione veneziana
emettere il risultato in out.indelpe. Dopo la correzione, quanto segue awk
il comando fornisce presunti indel omozigoti:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

e il seguente dà eterozigoti:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

Si prega di notare che questo indipendente comando implementa solo diverse regole euristiche.
Non corregge per corse di omopolimeri impuri o di-nucleotide/tripletta
si ripete. Di conseguenza, i due comandi awk danno solo un hom/het approssimativo
indel.

ESEMPI


· Script Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Comandi chiave dietro easyrun:
maq fasta2bfa rif.fasta rif.bfa;
maq fastq2bfq parte1.fastq parte1.bfq;
maq fastq2bfq parte2.fastq parte2.bfq;
maq mappa parte1.mappa ref.bfa parte1.bfq;
maq mappa parte2.mappa ref.bfa parte2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq assemble cns.cns ref.bfa aln.map;

Usa maq online utilizzando i servizi onworks.net


Ad


Ad

Gli ultimi programmi online per Linux e Windows