Questo è il comando htseq-qa che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre numerose workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online di Windows o emulatore online di MAC OS
PROGRAMMA:
NOME
htseq-qa - Esegue una semplice valutazione della qualità delle letture di sequenziamento ad alto rendimento
Lo script Python htseq-qa prende un file con letture di sequenziamento (grezze o allineate)
legge) e produce un file PDF con grafici utili per valutare la qualità tecnica di una corsa.
TRACCIARE
Ecco un grafico tipico: [immagine]
Il grafico è ricavato da un file SAM, che conteneva letture allineate e non allineabili. La parte sinistra
la colonna è composta da quella non allineata, la colonna di destra da quella allineata. L'intestazione
ti informa sul nome del file SAM e sul numero di letture.
La riga superiore mostra la frequenza con cui è stata chiamata la base per ogni posizione nella lettura. In questo
campione, le letture non allineabili hanno un chiaro eccesso in A. Le letture allineate hanno un equilibrio
tra letture complementari: A e C (colori rossastri) hanno livelli uguali, e così anche C e
G (colori verdastri). Le sequenze sembrano essere ricche di AT. Inoltre, quasi tutte allineate
le letture iniziano con una T, seguita da una A, quindi una C nel 70% delle letture e una A nel 30% delle letture.
Un tale squilibrio sarebbe motivo di preoccupazione se non avesse una buona spiegazione. Qui, il
Il motivo è che la frammentazione del campione è stata effettuata tramite digestione enzimatica.
La metà inferiore mostra l'abbondanza di punteggi di qualità delle chiamate di base nelle diverse posizioni
nella lettura. Quasi tutte le letture allineate hanno una qualità di 34 su tutta la loro lunghezza, mentre
per le letture non allineate, alcune letture hanno punteggi di qualità più bassi verso le estremità.
USO
Si noti che htseq-qa necessita di matplotlib per produrre il grafico, quindi è necessario installarlo
modulo, come descritto qui sul sito web matplotlib.
Dopo aver installato HTSeq (vedi install) e matplotlib, puoi eseguire htseq-qa dal
riga di comando:
htseq-qa [opzioni] read_file
Se il file htseq-qa non è nel tuo percorso, puoi, in alternativa, chiamare lo script con
python -m HTSeq.scripts.qa [opzioni] read_file
. leggere_file è un file FASTQ o un file SAM. Per un file SAM, un grafico con due
le colonne vengono prodotte come sopra, per un file FASTQ si ottiene solo una colonna.
L'output viene scritto in un file con lo stesso nome di leggere_file, con il suffisso .pdf
aggiunto. Visualizzalo con un visualizzatore PDF come Acrobat Reader.
Opzioni
-t , --tipo=
Il tipo di file del leggere_file. Valori supportati per siamo:
· sam: un file SAM (Nota che il Strumenti SAM contengono script Perl per convertire la maggior parte
formati di allineamento a SAM)
· solexa-export: Un _esporta.txt file prodotto dal software SolexaPipeline
dopo l'allineamento con Eland (htseq-qa si aspetta la nuova codifica di qualità Solexa come
prodotto dalla versione 1.3 o successiva di SolexaPipeline)
· veloce: un file FASTQ con codifica di qualità standard (Sanger o Phred)
· solexa-fastq: un file FASTQ con codifica di qualità Solexa, come prodotto da
SolexaPipeline dopo la chiamata di base con Bustard (htseq-qa si aspetta la nuova Solexa
codifica di qualità come prodotta dalla versione 1.3 o successiva di SolexaPipeline)
-o , --file di uscita=
nome del file di output (il valore predefinito è ``.pdf``)
-r , --lunghezza di lettura=
la lunghezza massima di lettura (quando non specificata, lo script indovina dal file
-g , --gamma=
il fattore gamma per la regolazione del contrasto del grafico del punteggio di qualità
-N, --nosplit
non dividere le letture in allineate e non allineate, ovvero non produrre un grafico a una colonna
-M, --maxqual
il punteggio di qualità massimo che appare nei dati (predefinito: 40)
-H, --Aiuto
Mostra un riepilogo dell'utilizzo ed esci
Utilizzare htseq-qa online utilizzando i servizi onworks.net
