Questo è il comando fastq-mcf che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
fastq-mcf - ea-utils: rileva i livelli di presenza dell'adattatore, calcola le probabilità e le posizioni
degli adattatori
SINOSSI
fastq-mcf [Opzioni] [compagni1.fq ...]
DESCRIZIONE
Versione: 1.04.676
Rileva i livelli di presenza dell'adattatore, calcola le probabilità e le posizioni (inizio, fine) del
adattatori. Rimuove le sequenze dell'adattatore dai file fastq.
Le statistiche vanno a stderr, a meno che -o è specificato.
Specificare -0 per disattivare tutte le impostazioni predefinite
Se specifichi più ingressi 'paired-end', allora a -o l'opzione è richiesta per ciascuno. CIOÈ:
-o leggi1.clip.q -o leggi2.clip.fq
VERSIONI
-h Questo aiuto
-o File di output FIL (dati a stdout)
-s NN Scala logaritmica per la corrispondenza della lunghezza minima dell'adattatore (2.2)
-t N % soglia di occorrenza prima del clipping dell'adattatore (0.25)
-m N Lunghezza minima del clip, sostituisce l'auto scalato (1)
-p N Percentuale massima differenza adattatore (10)
-l N Lunghezza minima residua della sequenza (19)
-L N Lunghezza massima della sequenza rimanente (nessuna)
-D N Rimuovi letture duplicate: Read_1 ha basi N identiche (0)
-k N skew percentuale inferiore alla rimozione del ciclo (2)
-x N 'N' (cattiva lettura) percentuale che causa la rimozione del ciclo (20)
-q Soglia di qualità N che causa la rimozione della base (10)
-w Dimensione finestra N per rifilatura di qualità (1)
-H rimuovere >95% di letture omopolimeriche (no)
-X rimuovere letture a bassa complessità (no)
-0 Imposta tutti i parametri predefiniti su zero/non fare nulla
-U|u Forza la disattivazione/attivazione del filtro PF Illumina (auto)
-P N Scala di frequenza (automatica)
-R Non rimuovere le N dai fronti/estremità delle letture
-n Non ritagliare, emetti solo ciò che verrebbe fatto
-C N Numero di letture da utilizzare per il sottocampionamento (300k)
-S Salva tutte le letture scartate in file '.skip'
-d Emetti un sacco di cose di debug casuali
Qualità registrazione opzioni:
--regola-ciclo
CYC,AMT Regolare il ciclo CYC (negativo = offset dalla fine) per importo AMT
--phred-regolare
PUNTEGGIO,AMT Regola il punteggio PUNTEGGIO per importo AMT
--phred-regola-max
PUNTEGGIO Modifica i punteggi > PUNTEGGIO a SCOTE
Filtraggio opzioni*:
--[mate-]qual-media
NUM Punteggio di qualità medio minimo
--[mate-]qual-gt
NUM,THR Almeno NUM quals > THR
--[compagno-]max-ns
NUM N-chiamate massime in una lettura (può essere una %)
--[compagno-]min-len
NUM Lunghezza minima rimanente (uguale a -l)
--omopolimero-pct
Percentuale filtro PCT omopolimero (95)
--lowcompless-pct
PCT Complessità filtro percentuale (95)
Se viene utilizzato il prefisso mate, si applica alla sola lettura del secondo codice non a barre
I file dell'adattatore sono formattati "fasta":
Specificare n/a per disattivare il clipping dell'adattatore e utilizzare semplicemente i filtri
Aumentando la scala si allungano le lunghezze di riconoscimento, una scala di 100 forzerà
riconoscimento completo degli adattatori.
Le sequenze dell'adapter con _5p nella loro etichetta corrisponderanno a 'end's e le sequenze con _3p in
la loro etichetta corrisponderà a 'inizio', altrimenti la 'fine' sarà autodeterminata.
Skew è quando un ciclo è scadente, "sbilanciato" verso una particolare base. Se un qualsiasi nucleotide è
inferiore alla percentuale di inclinazione, quindi l'intero ciclo viene rimosso. Disabilita per metil-seq,
ecc.
Impostare l'inclinazione (-k) o N-pct (-x) a 0 per disattivarlo (dovrebbe essere fatto per miRNA, amplicon
e altre situazioni di bassa complessità!)
Il filtro di lettura duplicato è appropriato per le attività di assemblaggio e mai quando la lunghezza della lettura
copertura prevista. -D 50 utilizzerà 4.5 GB di RAM su 100 m di letture del DNA: fai attenzione. Ottimo per l'RNA
montaggio.
*I filtri di qualità vengono valutati dopo il ritaglio/ritaglio
Il filtraggio dell'omopolimero è un sottoinsieme di bassa complessità, ma non verrà monitorato separatamente
a meno che non siano entrambi accesi.
Usa fastq-mcf online utilizzando i servizi onworks.net