InglésFrancésAlemánItalianoPortuguésrusoEspañol

icono de página de OnWorks

maq - Online en la nube

Ejecute maq en el proveedor de alojamiento gratuito de OnWorks a través de Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando maq que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


Maq - Mapeo y ensamblaje con cualidades

SINOPSIS


pero Q comando [opciones] argumentos

maq.pl comando [opciones] argumentos

DESCRIPCIÓN


Maq es un software que crea ensamblajes de mapeo a partir de lecturas breves generadas por el siguiente
máquinas secuenciadoras de generación. Está especialmente diseñado para Illumina-Solexa 1G Genetic
Analyzer y tiene una funcionalidad preliminar para manejar datos AB SOLiD.

Con Maq puedes:

· Alinear rápidamente las lecturas de Illumina / SOLiD con el genoma de referencia. Con las opciones predeterminadas, uno
millones de pares de lecturas se pueden asignar al genoma humano en aproximadamente 10 horas de CPU con menos
más de 1G de memoria.

· Mida con precisión la probabilidad de error de la alineación de cada lectura individual.

· Llamar a los genotipos de consenso, incluidos los polimorfismos homocigotos y heterocigotos, con
una calidad probabilística Phred asignada a cada base.

· Encuentra indelos cortos con lecturas finales emparejadas.

· Encuentre con precisión deleciones y translocaciones genómicas a gran escala con lecturas finales emparejadas.

· Descubra posibles CNV comprobando la profundidad de lectura.

· Evaluar la precisión de las cualidades de la base sin procesar de los secuenciadores y ayudar a verificar la
errores sistemáticos.

Sin embargo, Maq puede NO :

· Hacer de nuevo montaje. (Maq solo puede llamar al consenso mapeando lecturas a un conocido
referencia.)

· Los cortos del mapa se leen en contra de sí mismos. (Maq solo puede encontrar una superposición completa entre lecturas).

· Alinear lecturas capilares o lecturas 454 con la referencia. (Maq no puede alinear lecturas más largas que
63pb.)

MAQ COMANDOS


Clave Comandos

fasta2bfa pero Q fasta2bfa in.ref.fasta fuera.ref.bfa

Convierta secuencias en formato FASTA al formato BFA (binario FASTA) de Maq.

fastq2bfq pero Q fastq2bfq [-n nreads] en.read.fastq out.read.bfqfuera.prefijo

Convierta las lecturas en formato FASTQ al formato BFQ (binary FASTQ) de Maq.

OPCIONES:

-n INT número de lecturas por archivo [no especificado]

mapa pero Q mapa [-n nmis] [-a máximos] [-c] [-1 len1] [-2 len2] [-d adap3] [-m mutar]
[-u sin asignar] [-e Max Err] [-M c⎪g] [-N] [-H todos los éxitos] [-C máximos éxitos] fuera.aln.mapa
in.ref.bfa en.read1.bfq [en.read2.bfq] 2> out.map.log

El mapa lee las secuencias de referencia.

OPCIONES:

-n INT Número máximo de discrepancias que siempre se pueden encontrar [2]

-a INT Distancia exterior máxima para un par de lectura correcto [250]

-A INT Distancia exterior máxima de dos lecturas pagadas por RF (0 para deshabilitar) [0]

-c El mapa se lee en el espacio de color (solo para SOLiD)

-1 INT Longitud de lectura para la primera lectura, 0 para automático [0]

-2 INT Longitud de lectura para la segunda lectura, 0 para automático [0]

-m FLOAT Tasa de mutación entre las secuencias de referencia y las lecturas [0.001]

-d ARCHIVO Especifique un archivo que contenga una sola línea de la secuencia del adaptador 3 '
[nulo]

-u ARCHIVO Volcar lecturas no asignadas y lecturas que contengan más de nmis desajustes a
un archivo separado [nulo]

-e INT Umbral de la suma de las calidades básicas que no coinciden [70]

-H ARCHIVO Volcar múltiples / todos los 01-hits que no coinciden en ARCHIVO [nulo]

-C INT Número máximo de visitas a la salida. Ilimitado si es mayor de 512. [250]

-M c⎪g modo de alineación de metilación. Todo C (o G) en la hebra delantera será
cambiado a T (o A). Esta opción es solo para pruebas.

-N almacenar la posición de la falta de coincidencia en el archivo de salida fuera.aln.mapa. Cuando esto
está en uso, la longitud máxima de lectura permitida es 55 pb.

NOTA:

* Las lecturas finales emparejadas deben prepararse en dos archivos, uno para cada extremo, con
las lecturas se ordenan en el mismo orden. Esto significa que el k-ésimo leído en el primer
El archivo se empareja con el k-ésimo leído en el segundo archivo. La lectura correspondiente
los nombres deben ser idénticos hasta la cola `/ 1 'o` / 2'. Por ejemplo, tal
se permiten un par de nombres de lectura: `EAS1_1_5_100_200 / 1 'y
`EAS1_1_5_100_200 / 2 '. La cola `/ [12] 'generalmente es generada por el
GAPipeline para distinguir los dos extremos en un par.

* La salida es un archivo binario comprimido. Se ve afectado por la endianidad.

* La mejor manera de ejecutar este comando es proporcionar entre 1 y 3 millones de lecturas como
aporte. Más lecturas consumen más memoria.

* Opción -n controla la sensibilidad de la alineación. Por defecto, un acierto con
siempre se pueden encontrar hasta 2 desajustes. Más alto -n encuentra más hits y también
mejora la precisión de las cualidades cartográficas. Sin embargo, esto se hace a costa
de velocidad.

* Las alineaciones con muchas discrepancias de alta calidad deben descartarse como falsas
alineaciones o posibles contaminaciones. Este comportamiento está controlado por la opción
-e. La -e El umbral solo se calcula de forma aproximada porque las calidades base
se dividen por 10 en una determinada etapa de la alineación. los -Q opción en el
montar comando establece con precisión el umbral.

* Se dice que un par de lecturas están emparejadas correctamente si y solo si el
la orientación es FR y la distancia exterior del par no es mayor que
máximos. No hay límite en el tamaño mínimo de la plaquita. Esta configuración es
determinado por el algoritmo de alineación de extremos emparejados utilizado en Maq. Requerir un
El tamao mnimo de la plaquita conducir a alineaciones incorrectas con
cualidades cartográficas sobreestimadas.

* Actualmente, los pares de lectura de la biblioteca de inserción larga de Illumina / Solexa tienen lectura de RF
orientación. El tamaño máximo de la plaquita se establece mediante la opción -A. Sin embargo, desde hace mucho tiempo
la biblioteca de inserción también se mezcla con una pequeña fracción de lectura de inserción corta
pares. -a también debe configurarse correctamente.

* A veces se puede secuenciar el extremo 5 'o incluso la secuencia completa del adaptador 3'.
Proporcionar -d renderiza Maq para eliminar las contaminaciones del adaptador.

* Dados 2 millones de lecturas como entrada, pero Q suele ocupar 800 MB de memoria.

combinación de mapas pero Q combinación de mapas fuera.aln.mapa en.aln1.mapa en.aln2.mapa [...]

Fusionar un lote de alineaciones de lectura.

NOTA:

* En teoría, este comando puede combinar un número ilimitado de alineaciones. Sin embargo, como
mapmerge leerá todas las entradas al mismo tiempo, puede tocar el
límite del número máximo de archivos de apertura establecido por el sistema operativo. En la actualidad, este
tiene que ser resuelto manualmente por los usuarios finales.

* Comando combinación de mapas se puede utilizar para fusionar archivos de alineación con diferentes lecturas
longitudes. Todos los análisis posteriores ya no asumen una longitud fija.

rmdup pero Q rmdup out.rmdup.mapa en.ori.map

Quite los pares con coordenadas exteriores idénticas. En principio, se empareja con
Las coordenadas exteriores idénticas deberían suceder raramente. Sin embargo, debido a la
amplificación en la preparación de la muestra, esto ocurre con mucha más frecuencia que por
oportunidad. Los análisis prácticos muestran que la eliminación de duplicados ayuda a mejorar la
precisión general de las llamadas SNP.

montar pero Q montar [-sp] [-m maximis] [-Q Max Err] [-r hetrar] [-t coef] [-q minQ] [-N
nHap] fuera.cns in.ref.bfa en.aln.mapa 2> fuera.cns.log

Llame a las secuencias de consenso del mapeo de lectura.

OPCIONES:

-t FLOAT Coeficiente de dependencia del error [0.93]

-r FLOAT Fracción de heterocigotos entre todos los sitios [0.001]

-s Tome la calidad del mapeo de un solo extremo como la calidad del mapeo final;
de lo contrario, se utilizará la calidad de mapeo final emparejado

-p Descarte las lecturas finales emparejadas que no estén asignadas en pares correctos

-m INT Número máximo de discrepancias permitidas para que se utilice una lectura en
llamada de consenso [7]

-Q INT Suma máxima permitida de valores de calidad de bases no coincidentes [60]

-q INT Calidad de mapeo mínima permitida para que una lectura se use en consenso
llamando [0]

-N INT Número de haplotipos en el grupo (> = 2) [2]

NOTA:

* Opción -Q establece un límite en la suma máxima de calidades base que no coinciden.
Deben descartarse las lecturas que contengan muchas discrepancias de alta calidad.

* Opción -N establece el número de haplotipos en un grupo. Está diseñado para
resecuenciación de muestras mediante la combinación de múltiples cepas / individuos. Para
resecuenciación del genoma diploide, esta opción es igual a 2.

glfgen pero Q glfgen [-sp] [-m maximis] [-Q Max Err] [-r hetrar] [-t coef] [-q minQ] [-N
nHap] fuera.cns in.ref.bfa en.aln.mapa 2> fuera.cns.log

Calcule la probabilidad logarítmica para todos los genotipos y almacene los resultados en formato GLF
(Formato de probabilidad de genotipado). Consulte el sitio web de MAQ para obtener información detallada
descripciones del formato de archivo y las utilidades relacionadas.

indelpe pero Q indelpe in.ref.bfa en.aln.mapa > fuera.indelpe

Llame a indels consistentes a partir de lecturas finales emparejadas. La salida está delimitada por TAB con
cada línea consta de cromosoma, posición inicial, tipo de indel, número
de lecturas a través del indel, tamaño del indel y nucleótidos insertados / eliminados
(separados por dos puntos), número de indeles en la hebra inversa, número de indeles
en la hebra delantera, secuencia 5 'delante de la indel, secuencia 3' siguiendo
el indel, número de lecturas alineadas sin indel y tres columnas adicionales
para filtros.

En la tercera columna, tipo de indel, una estrella indica que el indel está confirmado
por lecturas de ambas hebras, un signo más significa que la indel recibe al menos dos lecturas
pero de la misma hebra, un signo menos muestra que el indel solo se encuentra en una lectura,
y un punto significa que el indel está demasiado cerca de otro indel y está filtrado.

Se recomienda a los usuarios que ejecuten maq.pl indelpe para corregir el número de
lecturas mapeadas sin indeles. Para obtener más detalles, consulte el archivo `maq.pl indelpe '
.

indelsoa pero Q indelsoa in.ref.bfa en.aln.mapa > fuera.indelsoa

Llame a posibles indeles homocigotos y puntos de ruptura detectando lo anormal
patrón de alineación alrededor de indeles y puntos de rotura. La salida también es TAB
delimitado con cada línea que consta de cromosoma, coordenada aproximada,
longitud de la región anormal, número de lecturas mapeadas en la posición,
número de lecturas en el lado izquierdo de la posición y número de lecturas en
el lado derecho. La última columna se puede ignorar.

La salida contiene muchos falsos positivos. Un filtro recomendado podría ser:

awk '$ 5 + $ 6- $ 4> = 3 && $ 4 <= 1' pulgadas indelsoa

Tenga en cuenta que este comando no pretende ser un detector de indel preciso, sino
principalmente ayuda a evitar algunos falsos positivos en llamadas de sustitución. En
Además, solo funciona bien dada la profundidad profunda (~ 40X por ejemplo); de lo contrario el
La tasa de falsos negativos sería muy alta.

Formato Conversión

sol2sanger pero Q sol2sanger en.sol.fastq out.sanger.fastq

Convierta Solexa FASTQ a formato estándar / Sanger FASTQ.

bfq2fastq pero Q bfq2fastq en.read.bfq out.read.fastq

Convierta el formato BFQ de Maq al formato FASTQ estándar.

mapass2maq pero Q mapass2maq en.mapass2.map out.maq.mapa

Convierta el formato de mapa obsoleto de mapass2 al formato de mapa de Maq. El formato antiguo lo hace
no contener nombres leídos.

Información Extrayendo

vista del mapa pero Q vista del mapa [-bN] en.aln.mapa > fuera.aln.txt

Muestre la alineación de lectura en texto sin formato. Para lecturas alineadas antes del Smith-
Alineación Waterman, cada línea consta de nombre leído, cromosoma, posición,
hebra, tamaño de inserción de las coorniates exteriores de un par, bandera emparejada, mapeo
calidad, calidad de mapeo de un solo extremo, calidad de mapeo alternativo, número de
desajustes del mejor acierto, suma de cualidades de bases incompatibles del mejor
aciertos, número de aciertos de desajuste 0 de los primeros 24 pb, número de aciertos de desajuste 1 de
los primeros 24 pb en la referencia, la longitud de la lectura, la secuencia de lectura y su
calidad. La calidad del mapeo alternativo siempre es igual a la calidad del mapeo si el
las lecturas no están emparejadas. Si las lecturas están emparejadas, equivale al mapeo más pequeño
calidad de los dos extremos. Esta calidad de mapeo alternativa es en realidad la
mapeo de la calidad de un par anormal.

La quinta columna, indicador emparejado, es un indicador bit a bit. Sus 4 bits inferiores dan el
orientación: 1 representa FF, 2 para FR, 4 para RF y 8 para RR, donde FR significa
que la lectura con coordenada más pequeña está en la hebra delantera, y su pareja es
en la hebra del reverso. Solo se permite FR para un par correcto. Los bits más altos
de esta bandera dan más información. Si el par se encuentra con el final emparejado
requisito, se establecerá 16. Si las dos lecturas se asignan a diferentes
cromosomas, se establecerán 32. Si una de las dos lecturas no se puede mapear en absoluto,
64 se establecerá. La bandera de un par correcto siempre es igual a 18.

Para lecturas alineadas por la alineación Smith-Waterman posteriormente, la bandera es
siempre 130. Una línea consta de nombre leído, cromosoma, posición, cadena, inserto
tamaño, bandera (siempre 130), posición del indel en la lectura (0 si no hay indel),
longitud de los indeles (positivo para inserciones y negativo para deleciones),
mapeo de la calidad de su pareja, número de desajustes del mejor acierto, suma de
cualidades de bases no coincidentes del mejor acierto, dos ceros, longitud de la lectura,
leer secuencia y su calidad. La relación de posición de una lectura marcada con 130 indicadores siempre obtiene un
bandera 18.

El indicador 192 indica que la lectura no está mapeada pero su relación de pareja está mapeada. Para tal
un par de lectura, una lectura tiene el indicador 64 y la otra tiene 192.

OPCIONES:

-b no muestra la secuencia de lectura y la calidad

-N mostrar las posiciones donde ocurren los desajustes. Esta bandera solo funciona
con un archivo .map generado por `maq map -N '.

chequeo de mapa pero Q chequeo de mapa [-s] [-m maximis] [-q minQ] in.ref.bfa en.aln.mapa > out.mapcheck

Leer control de calidad. Mapcheck informa primero la composición y la profundidad de
la referencia. Después de eso hay una forma. La primera columna indica el
posición en una lectura. Siguiendo cuatro columnas que muestran el nucleótido
Se indicará la composición, las tasas de sustitución entre la referencia y las lecturas.
Estas tasas y los números en las siguientes columnas se escalan a 999 y
redondeado al entero más cercano. El siguiente grupo de columnas muestra la distribución de
calidades base a lo largo de las lecturas en un intervalo de calidad de 10. Una disminución en la calidad
generalmente se puede observar, lo que significa que las bases al final de la lectura son menos
preciso. El último grupo de columnas presenta la fracción de sustituciones de
leer bases en un intervalo de calidad. Esto mide la precisión de la calidad base.
Estimacion. Idealmente, esperamos ver 1 de los 3? columna, 10 en el 2? columna
y 100 en el 1? columna.

OPCIONES:

-s Tome la calidad de mapeo de un solo extremo como la calidad de mapeo final

-m INT Número máximo de discrepancias permitidas para que se cuente una lectura [4]

-q INT Calidad de mapeo mínima permitida para que se cuente una lectura [30]

amontonar pero Q amontonar [-spvP] [-m maximis] [-Q Max Err] [-q minQ] [-l archivo de sitio] in.ref.bfa
en.aln.mapa > fuera.pileup

Muestre la alineación en un formato de texto "pileup". Cada línea consta de
cromosoma, posición, base de referencia, profundidad y las bases en lecturas que cubren
esta posición. Si -v se agrega en la línea de comando, calidades base y mapeo
Las cualidades se presentarán en la sexta y séptima columnas en orden.

La quinta columna siempre comienza con '@'. En esta columna, lea bases idénticas
a la referencia se muestran en coma `, 'o punto`.', y leen bases diferentes
de la referencia en letras. Una coma o una mayúscula indica que la base
proviene de una lectura alineada en la hebra delantera, mientras que un punto o una minúscula en
la hebra inversa.

Este comando es para usuarios que desean desarrollar sus propios llamadores SNP.

OPCIONES:

-s Tome la calidad de mapeo de un solo extremo como la calidad de mapeo final

-p Descartar las lecturas finales emparejadas que no están asignadas como pares correctos

-v Genere información detallada, incluidas las cualidades base y el mapeo
cualidades

-m INT Número máximo de discrepancias permitidas para que se utilice una lectura [7]

-Q INT Número máximo permitido de valores de calidad de discrepancias [60]

-q INT Calidad de mapeo mínima permitida para usar una lectura [0]

-l ARCHIVO Archivo que contiene los sitios en los que se imprimirá el pileup. En esto
archivo, la primera columna da los nombres de la referencia y la segunda
las coordenadas. Se ignorarán las columnas adicionales. [nulo]

-P también muestra la posición base en la lectura

cns2fq pero Q cns2fq [-Q minMapQ] [-n minNeiQ] [-d minDepth] [-D máxima profundidad] pulg. cns >
fuera.cns.fastq

Extraiga las secuencias de consenso en formato FASTQ. En las líneas de secuencia, bases
en minúsculas son esencialmente repeticiones o no tienen cobertura suficiente; bases
en mayúsculas indican las regiones donde los SNP se pueden llamar de forma fiable. En el
líneas de calidad, ASCII de un carácter menos 33 da la calidad PHRED.

OPCIONES:

-Q INT Calidad cartográfica mínima [40]

-d INT Profundidad de lectura mínima [3]

-n INT Calidad vecina mínima [20]

-D INT Profundidad máxima de lectura. > = 255 para ilimitado. [255]

cns2snp pero Q cns2snp pulg. cns > out.snp

Extraiga sitios SNP. Cada línea consta de cromosoma, posición, base de referencia,
base de consenso, calidad de consenso similar a Phred, profundidad de lectura, el número medio de
hits de lecturas que cubren esta posición, la calidad de mapeo más alta de las lecturas
cubriendo la posición, la calidad mínima de consenso en el flanco de 3 pb
regiones a cada lado del sitio (6 pb en total), la segunda mejor llamada, registro
Relación de probabilidad de la segunda mejor opción y la tercera mejor opción, y la tercera mejor opción
llamada.

La quinta columna es el criterio clave a la hora de juzgar la fiabilidad de un SNP.
Sin embargo, como esta calidad solo se calcula asumiendo la independencia del sitio,
También debe considerar otras columnas para obtener llamadas SNP más precisas. Texto
comando `maq.pl Filtro SNP'está diseñado para esto (ver más abajo).

La séptima columna implica si el sitio se encuentra en una región repetitiva. Si no
lectura que cubre el sitio se puede mapear con alta calidad de mapeo, el flanqueo
La región posiblemente sea repetitiva o carezca de buenas lecturas. Un SNP en dicho sitio
generalmente no es confiable.

La octava columna da aproximadamente el número de copia de la región flanqueante en el
genoma de referencia. En la mayoría de los casos, este número se acerca a 1.00, lo que significa que
la región es única. A veces puede ver una profundidad de lectura distinta de cero, pero 0.00 en
la séptima columna. Esto indica que todas las lecturas que cubren la posición tienen en
al menos dos desajustes. Maq solo cuenta el número de aciertos de discordancia 0 y 1 para
la referencia. Esto se debe a un problema técnico complejo.

La novena columna da la calidad vecina. El filtrado en esta columna también es
necesarios para obtener SNP fiables. Esta idea está inspirada en NQS, aunque NQS es
inicialmente diseñado para una sola lectura en lugar de un consenso.

cns2ver pero Q cns2ver pulg. cns > fuera.ver

Muestre información detallada en todos los sitios. El formato de salida es idéntico al
cns2snp informar.

cns2ref pero Q cns2ref pulg. cns > fuera.ref.fasta

Extrae la secuencia de referencia.

cns2win pero Q cns2win [-w winsize] [-c chr] [-b comenzar] [-e final] [-q minQ] pulg. cns >
salir.ganar

Extraiga la información promediada en una ventana de labranza. La salida está delimitada por TAB,
que consta de nombre de referencia, coordenada dividida por 1,000,000, tasa de SNP,
het rate, profundidad de lectura sin procesar, profundidad de lectura en regiones aproximadamente únicas,
promedio de aciertos de lecturas en la ventana y porcentaje de GC.

OPCIONES:

-w INT Tamaño de una ventana [1000]

-c STR Secuencia de referencia destinada; de lo contrario, se utilizarán todas las referencias
[nulo]

-b INT Posición inicial, 0 para ninguna restricción [0]

-e INT Posición final, 0 para ninguna restricción [0]

-q INT Calidad mínima de consenso de los sitios que se utilizarán [0]

Simulación Relacionado:

falsomut pero Q falsomut [-r mutar] [-R indelfrac] in.ref.fasta > out.fakeref.fasta 2>
fuera.falso.snp

Introduzca aleatoriamente sustituciones e indeles en la referencia. Sustituciones y
Se pueden agregar indeles de un solo par de bases.

OPCIONES:

-r FLOAT Tasa de mutación [0.001]

-R FLOAT Fracción de mutaciones que se convertirán en indeles [0.1]

Simutrain pero Q Simutrain fuera.simupars.dat en.read.fastq

Estimar / entrenar parámetros para simulación de lectura.

simular pero Q simular [-d en tamaño] [-s desvst] [-N nReads] [-1 leerLen1] [-2 leerLen2] [-r
mutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
en.simupars.dat

Simular lecturas finales emparejadas. Expediente en.simupars.dat determina las longitudes de lectura y
distribución de calidad. Se genera a partir de Simutrain, o se puede descargar desde
Sitio web de Maq. En los archivos de lectura de salida, un nombre de lectura consta de la referencia
nombre de la secuencia y las coordenadas externas del par de lecturas simuladas. Por
defecto simular asume que las lecturas provienen de una secuencia diploide que se genera
agregando dos conjuntos diferentes de mutaciones, incluido un indels de un par de bases, para
in.ref.fasta.

OPCIONES:

-d INT media de la distancia exterior de los tamaños de plaquita [170]

-s INT desviación estándar de los tamaños de plaquita [20]

-N INT número de pares de lecturas que se generarán [1000000]

-1 INT longitud de la primera lectura [establecida por en.simupars.dat]

-2 INT longitud de la segunda lectura [establecida por en.simupars.dat]

-r FLOAT tasa de mutación [0.001]

-R FLOAT fracción de indels de 1 pb [0.1]

-h agregar todas las mutaciones a in.ref.fasta y generar lecturas del single
secuencia mutada (modo haploide)

NOTA:

* Las lecturas generadas a partir de este comando son independientes, lo que se desvía del
verdad. Mientras que la evaluación de la alineación se ve menos afectada por esto, la evaluación en
Las llamadas SNP deben realizarse con precaución. La dependencia de errores puede ser una de
las principales causas de las llamadas SNP incorrectas.

simustato pero Q simustato en.simu-aln.map > simustat

Evalúe las cualidades del mapeo a partir de lecturas simuladas.

Sólido Relacionado:

fasta2csfa pero Q fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

Convierta el nucleótido FASTA en FASTA codificado por colores. Bandera -c luego debe aplicarse
a mapa mando. En la salida, la letra "A" representa el color 0, "C" el 1, "G"
para 2 y 'T' para 3. Cada secuencia en la salida es 1 pb más corta que la entrada.

csmap2nt pero Q csmap2nt out.nt.mapa en.ref.nt.bfa en.cs.map

Convierta la alineación de color en alineación de nucleótidos. La entrada en.ref.nt.bfa es la
archivo de referencia FASTA binario de nucleótidos. Debe corresponder al archivo original
a partir del cual se convierte la referencia de color. El consenso de nucleótidos se puede llamar
de la alineación resultante.

Varios / Avanzado Comandos

submapa pero Q submapa [-q minMapQ] [-Q MaxSumErr] [-m maxMM] [-p] fuera.mapa pulg. mapa

Filtrar alineaciones incorrectas en pulg. mapa. Las opciones de la línea de comandos se describen en la
`montar'comando.

eland2maq pero Q eland2maq [-q descalificar] fuera.mapa en lista en.eland

Convierta la alineación de eland al formato .map de maq. Expediente en lista consiste en
nombres de secuencia que aparecen en la séptima columna del archivo de alineación de eland
en.eland y el nombre que espera ver en la alineación maq. La siguiente es una
ejemplo:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Si está alineando lecturas en varios lotes usando eland, es importante
usa el mismo en lista para la conversión. Además, maq cargará todos los
alineaciones y ordenarlas en la memoria. Si ha concatenado varios eland
salidas en un archivo enorme, debe separarlo en archivos más pequeños para
evitar que maq se coma toda la memoria de su máquina.

Este comando en realidad tiene como objetivo mostrar la alineación de Eland en Maqview. Como sin calidad
la información está disponible, el archivo de alineación maq resultante no debe utilizarse
para llamar genotipos de consenso.

exportar2maq pero Q exportar2maq [-1 leer1len] [-2 leer2len] [-a maxdist] [-n] fuera.mapa en lista
en exportación

Convierta el formato de exportación de Illumina a Maq .mapa formato. El formato de exportación es un nuevo
formato de alineación desde SolexaPipeline-0.3.0 que también calcula el mapeo
cualidades como maq. El archivo resultante se puede utilizar para llamar genotipos de consenso
ya que la mayor parte de la información necesaria está disponible para que maq haga esto con precisión.

OPCIONES:

-1 INT Longitud de la primera lectura [0]

-2 INT Duración de la segunda lectura [0]

-a INT Distancia exterior máxima para un par de lectura correcto [250]

-n Conservar lecturas filtradas

MAQ-PERL COMANDOS


manifestación maq.pl manifestación [-h] [-s] [-N n pares] [-d outDir] en.fasta en.simudat

Demuestre el uso de pero Q y sus guiones complementarios. Este comando
simular lecturas de un archivo FASTA en.fasta. La longitud y las cualidades de la secuencia.
están determinados por en.simudat que se genera a partir de pero Q Simutrain o puede ser
descargado del sitio web de Maq. Las lecturas simuladas luego se mapearán con
maq.pl carrera fácil. La precisión de la alineación se evalúa mediante pero Q simustato,la
precisión de consenso por pero Q simulaciones, y la precisión de SNP por maq_eval.pl.

De forma predeterminada, las lecturas finales emparejadas se simularán y se creará una secuencia diploide.
generado a partir de la entrada agregando mutaciones a cualquier tipo de haploide. El inserto
el tamaño y la tasa de mutación están controlados por pero Q simular.

OPCIONES:

-h simular una secuencia haploide en lugar de una secuencia diploide

-s use el modo de un solo extremo para alinear las lecturas en lugar del modo de extremo emparejado

-N INT número de pares de lecturas que se van a simular [1000000]

-d DIR directorio de salida [maqdemo]

NOTA:

* Los archivos de salida de maq_eval.pl no se han documentado, pero puede hacer
una buena suposición sobre algunos de estos archivos.

* Este comando solo demuestra el uso de la suite maq. La precisión en real
los datos son casi siempre más bajos que los que se ven en la simulación pura.

carrera fácil maq.pl carrera fácil [-1 read1Len] [-d fuera.dir] [-n nReads] [-A 3adaptador] [-e minDep]
[-q minCnsQ] [-p] [-2 read2Len] [-a maxIns] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

Analiza la canalización de genomas pequeños. El comando Easyrun ejecutará la mayoría de los análisis
implementado en pero Q. Por defecto, carrera fácil asume todas las secuencias de lectura de entrada
los archivos son independientes y de un solo extremo; cuando -p se especifica, dos secuencias de lectura
Se requieren archivos, uno para cada extremo.

Se generarán varios archivos en fuera.dir, entre los cuales se encuentran los siguientes archivos
la salida clave:

cns.final.snp las llamadas SNP finales con las de baja calidad filtradas

cns.fq secuencias de consenso y calidades en el formato FASTQ

OPCIONES:

-d DIR directorio de salida [easyrun]

-n INT número de lecturas / pares en un lote de alineación [2000000]

-S aplicar análisis de lectura dividida de indels cortos (tal vez muy lento)

-N INT número de haplotipos / cepas en el grupo (> = 2) [2]

-A ARCHIVO Archivo para adaptador de 3 '. El archivo debe contener una sola línea de secuencia
[nulo]

-1 INT longitud de la primera lectura, 0 para auto [0]

-e INT profundidad de lectura mínima requerida para llamar a un SNP (para SNPfilter) [3]

-q INT calidad mínima de consenso para los SNP en cns.final.snp [30]

-p cambiar al modo de alineación final emparejado

-2 INT longitud de la segunda lectura cuando -p se aplica [0]

-a INT tamaño máximo de plaquita cuando -p se aplica [250]

NOTAS:

* Para llamadas de SNP en muestras agrupadas, los usuarios deben configurar el `-N' al igual que
`-E 0/XNUMX/XNUMX

* El archivo de entrada puede tener el formato binario de maq. maq.pl detectará automáticamente
el formato de archivo.

Filtro SNP maq.pl Filtro SNP [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F en.indelpe] [-f en.indelsoa] [-s puntuación mínima] [-m
MaxAcross] [-a] [-N maxWinSNP] [-W densWinSize] en.cns2snp.snp >
fuera.filtrado.snp

Descarte los SNP que están cubiertos por pocas lecturas (especificados por -d), por demasiados
lee (especificado por -D), cerca (especificado por -w) a un indel potencial, cayendo
en una posible región repetitiva (caracterizada por -Q), o tener baja calidad
bases vecinas (especificadas por -n) Si maxWinSNP o aparecen más SNP en cualquier
densWinSize ventana, también se filtrarán juntos.

OPCIONES:

-d INT Profundidad de lectura mínima requerida para llamar a un SNP [3]

-D INT Profundidad de lectura máxima requerida para llamar a un SNP (<255, de lo contrario ignorado)
[256]

-Q INT Máxima calidad de mapeo requerida de las lecturas que cubren el SNP [40]

-q INT Calidad mínima de consenso [20]

-n INT Calidad mínima de consenso adyacente [20]

-w INT Tamaño de la ventana alrededor de los posibles indeles. SNP que están cerca
a indels será suprimido [3]

-F ARCHIVO El indelpe salida [nulo]

-f ARCHIVO El indelsoa salida [nulo]

-s INT Puntuación mínima para considerar un soa-indel [3]

-m INT Número máximo de lecturas que se pueden asignar en un soa-indel [1]

-a Filtro alternativo para alineación de un solo extremo

indelpe maq.pl indelpe en.indelpe > fuera.indelpe

Corrija el número de lecturas mapeadas sin indeles para tractos de homopolímeros. Esta
comando modificar la cuarta, décima y las últimas tres columnas de en.indelpe y
mostrar el resultado en fuera.indelpe. Después de la corrección, lo siguiente awk
comando da supuestos indeles homocigotos:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && ($ 6 + $ 7) / $ 4> = 0.75'

y lo siguiente da heterocigotos:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && ($ 6 + $ 7) / $ 4 <0.75'

Tenga en cuenta que este indelpe El comando simplemente implementa varias reglas heurísticas.
No corrige las series de homopolímeros impuros o di-nucleótidos / tripletes
repite. En consecuencia, los dos comandos awk solo dan hom / het aproximado
indeles.

EJEMPLOS


· Guión de Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Comandos de teclado detrás de easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq parte1.fastq parte1.bfq;
maq fastq2bfq parte2.fastq parte2.bfq;
maq mapa part1.map ref.bfa part1.bfq;
maq mapa part2.map ref.bfa part2.bfq;
maq mapmerge aln.mapa parte1.mapa parte2.mapa;
maq ensamblar cns.cns ref.bfa aln.map;

Utilice maq en línea utilizando los servicios de onworks.net


Ad


Ad

Últimos programas en línea de Linux y Windows