Este es el comando htseq-qa que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
htseq-qa: realiza una evaluación de calidad simple de lecturas de secuenciación de alto rendimiento
El script de Python htseq-qa toma un archivo con lecturas secuenciales (sin formato o alineado
lee) y produce un archivo PDF con gráficos útiles para evaluar la calidad técnica de una ejecución.
TRAMA
Aquí hay una trama típica: [imagen]
El gráfico se realiza a partir de un archivo SAM, que contiene lecturas alineadas y no alineables. La izquierda
La columna está hecha de lo no alineado, la columna de la derecha de las lecturas alineadas. El encabezado
le informa sobre el nombre del archivo SAM y el número de lecturas.
La fila superior muestra la frecuencia con la que se llamó a qué base para cada posición en la lectura. En esto
muestra, las lecturas no alineables tienen un claro exceso en A. Las lecturas alineadas tienen un equilibrio
entre lecturas complementarias: A y C (colores rojizos) tienen niveles iguales, al igual que C y
G (colores verdosos). Las secuencias parecen ser ricas en AT. Además, casi todos alineados
las lecturas comienzan con una T, seguida de una A, y luego, una C en el 70% y una A en el 30% de las lecturas.
Tal desequilibrio sería motivo de preocupación si no tiene una buena explicación. Aquí el
La razón es que la fragmentación de la muestra se realizó mediante digestión enzimática.
La mitad inferior muestra la abundancia de puntajes de calidad de llamadas base en las diferentes posiciones.
en la lectura. Casi todas las lecturas alineadas tienen una calidad de 34 en toda su extensión, mientras que
para las lecturas no alineadas, algunas lecturas tienen puntuaciones de calidad más bajas hacia sus extremos.
USO
Tenga en cuenta que htseq-qa necesita matplotlib para producir la trama, por lo que debe instalar este
módulo, como se describe aquí. en el sitio web de matplotlib.
Una vez que haya instalado HTSeq (consulte instalar) y matplotlib, puede ejecutar htseq-qa desde la
línea de comando:
htseq-qa [opciones] read_file
Si el archivo htseq-qa no está en su camino, puede, alternativamente, llamar al script con
python -m HTSeq.scripts.qa [opciones] read_file
La pestaña leer_archivo es un archivo FASTQ o un archivo SAM. Para un archivo SAM, una parcela con dos
columnas se produce como arriba, para un archivo FASTQ, solo obtiene una columna.
La salida se escribe en un archivo con el mismo nombre que leer_archivo, con el sufijo .pdf
adicional. Véalo con un visor de PDF como Acrobat Reader.
-t , --type =
El tipo de archivo del leer_archivo. Valores admitidos para son:
· sam: un archivo SAM (tenga en cuenta que el SAMherramientas contienen scripts de Perl para convertir la mayoría
formatos de alineación a SAM)
· exportación de solexa: Un _exportar.txt archivo producido por el software SolexaPipeline
después de alinearse con Eland (htseq-qa espera la nueva codificación de calidad Solexa como
producido por la versión 1.3 o más reciente de SolexaPipeline)
· rapido: un archivo FASTQ con codificación de calidad estándar (Sanger o Phred)
· solexa-fastq: un archivo FASTQ con codificación de calidad Solexa, producido por el
SolexaPipeline después de llamar a bases con Bustard (htseq-qa espera el nuevo Solexa
codificación de calidad producida por la versión 1.3 o posterior de SolexaPipeline)
-o , --outfile =
nombre de archivo de salida (el predeterminado es ''.pdf '')
-r , --readlength =
la longitud máxima de lectura (cuando no se especifica, el script adivina del archivo
-g , --gamma =
el factor gamma para el ajuste de contraste del gráfico de puntuación de calidad
-norte, --nos dividir
no divida las lecturas en alineadas y no alineadas, es decir, produzca una gráfica de una columna
-metro, --maxqual
el puntaje de calidad máximo que aparece en los datos (predeterminado: 40)
-h, --ayuda
Mostrar un resumen de uso y salir
Use htseq-qa en línea usando los servicios de onworks.net
