Questo è il comando htseq-qa che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
htseq-qa - Esegui una semplice valutazione della qualità delle letture di sequenziamento ad alto rendimento
Lo script Python htseq-qa prende un file con letture in sequenza (grezze o allineate
legge) e produce un file PDF con grafici utili per valutare la qualità tecnica di una corsa.
TRACCIARE
Ecco una trama tipica: [immagine]
Il grafico è costituito da un file SAM, che conteneva letture allineate e non allineabili. La sinistra
colonna è composta dal non allineato, la colonna di destra dalle letture allineate. L'intestazione
ti informa sul nome del file SAM e sul numero di letture.
La riga superiore mostra la frequenza con cui è stata chiamata la base per ogni posizione nella lettura. In questo
campione, le letture non allineabili hanno un evidente eccesso in A. Le letture allineate hanno un equilibrio
tra le letture complementari: A e C (colori rossastri) hanno livelli uguali, così come C e
G (colori verdastri). Le sequenze sembrano essere ricche di AT. Inoltre, quasi tutti allineati
le letture iniziano con una T, seguita da una A, quindi una C nel 70% e una A nel 30% delle letture.
Un tale squilibrio sarebbe motivo di preoccupazione se non ha una buona spiegazione. qui, il
motivo è che la frammentazione del campione è stata effettuata mediante digestione enzimatica.
La metà inferiore mostra l'abbondanza di punteggi di qualità per l'identificazione delle basi nelle diverse posizioni
nella lettura. Quasi tutte le letture allineate hanno una qualità di 34 su tutta la loro lunghezza, mentre
per le letture non allineate, alcune letture hanno punteggi di qualità inferiori verso le loro estremità.
USO
Si noti che htseq-qa ha bisogno di matplotlib per produrre la trama, quindi è necessario installarlo
modulo, come descritto qui sul sito web matplotlib.
Dopo aver installato HTSeq (vedi install) e matplotlib, puoi eseguire htseq-qa dal
riga di comando:
htseq-qa [opzioni] read_file
Se il file htseq-qa non è nel tuo percorso, puoi, in alternativa, chiamare lo script con
python -m HTSeq.scripts.qa [opzioni] read_file
I leggi_file è un file FASTQ o un file SAM. Per un file SAM, un grafico con due
columns viene prodotto come sopra, per un file FASTQ si ottiene solo una colonna.
L'output viene scritto in un file con lo stesso nome di leggi_file, con il suffisso .pdf
aggiunto. Visualizzalo con un visualizzatore di PDF come Acrobat Reader.
Opzioni
-t , --type=
Il tipo di file del leggi_file. Valori supportati per siamo:
· sam: un file SAM (notare che il Strumenti SAM contengono script Perl per convertire la maggior parte
formati di allineamento a SAM)
· solexa-esportazione: Un _esporta.txt file come prodotto dal software SolexaPipeline
dopo essersi allineato con Eland (htseq-qa si aspetta la nuova codifica di qualità Solexa come
prodotto dalla versione 1.3 o successiva della SolexaPipeline)
· veloce: un file FASTQ con codifica di qualità standard (Sanger o Phred)
· solexa-fastq: un file FASTQ con codifica di qualità Solexa, come prodotto dal
Solexa Pipeline dopo la determinazione delle basi con otarda (htseq-qa aspetta la nuova Solexa
codifica di qualità prodotta dalla versione 1.3 o successiva di SolexaPipeline)
-o , --outfile=
nome del file di output (il valore predefinito è ``.pdf``)
-r , --readlength=
la lunghezza massima di lettura (quando non specificata, lo script indovina dal file
-g , --gamma=
il fattore gamma per la regolazione del contrasto del grafico del punteggio di qualità
-N, --nosplit
non dividere le letture in non allineate e allineate, ovvero produrre un grafico a una colonna
-M, --maxqual
il punteggio di qualità massimo che appare nei dati (predefinito: 40)
-H, --Aiuto
Mostra un riepilogo dell'utilizzo ed esci
Usa htseq-qa online utilizzando i servizi onworks.net