InglésFrancésEspañol

Ad


icono de página de OnWorks

gmap: en línea en la nube

Ejecute gmap en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando gmap que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


gmap - Programa de alineación y mapeo genómico

SINOPSIS


gmap [CAMPUS...] <RÁPIDO archivos...>, or gato | gmap [OPCIONES ...]

CAMPUS


Entrada opciones (debe incluir -d or -g)
-D, --dir=directorio
Directorio del genoma. Predeterminado (según lo especificado por --con-gmapdb al programa de configuración)
is / var / cache / gmap

-d, --db=CADENA
Base de datos del genoma. Si el argumento es '?' (con las comillas), este comando enumera
bases de datos disponibles.

-k, --kmer=INT
tamaño kmer para usar en la base de datos del genoma (valores permitidos: 16 o menos). Que no
especificado, el programa encontrará el tamaño kmer más alto disponible en el genoma
base de datos

--muestreo=INT
Muestreo para usar en la base de datos del genoma. Si no se especifica, el programa encontrará el
valor de muestreo más pequeño disponible en la base de datos del genoma dentro del tamaño de k-mer seleccionado

-G, --genoma completo
Utilice el genoma completo (se permiten todos los caracteres ASCII; construido explícitamente durante la instalación), no
versión comprimida

-g, --gseg=nombre de archivo
Segmento genómico proporcionado por el usuario

-1, - autoalineación
Alinee una secuencia contra sí misma en formato FASTA a través de stdin (útil para obtener
traducción de proteínas de una secuencia de nucleótidos)

-2, --alinear por pares
Alinee dos secuencias en formato FASTA a través de stdin, la primera es genómica y la segunda
uno es ADNc

--líneacmd=CADENA,CUERDA
Alinee estas dos secuencias proporcionadas en la línea de comando, la primera es genómica y
el segundo es ADNc

-q, --parte=INT/EN T
Procese solo el i-ésimo de cada n secuencias, por ejemplo, 0/100 o 99/100 (útil para
distribuir trabajos a una granja de computadoras).

--tamaño del búfer de entrada=INT
Tamaño del búfer de entrada (el programa lee esta cantidad de secuencias a la vez para mayor eficiencia)
(predeterminado 1000)

Opciones de computación

-B, --lote=INT
Modo por lotes (predeterminado = 2)

Modo Compensación Posiciones Genoma
0 ver nota mmap mmap
1 ver nota mmap y precargar mmap
(predeterminado) 2 ver nota mmap y precargar mmap y precargar
3 ver nota asignar mmap y precargar
4 ver nota asignar asignar
5 expandir asignar asignar

Nota: para una sola secuencia, todas las estructuras de datos usan mmap
Si mmap no está disponible y la asignación no se eligió, usará fileio (muy lento)

Nota sobre --lote y compensaciones: la expansión de compensaciones se puede controlar
independientemente por el --expand-compensaciones bandera. La --lote=5 opción es equivalente a
--lote=4 más --expand-compensaciones=1

--expand-compensaciones=INT
Si expandir el índice de compensaciones genómicas Valores: 0 (no, predeterminado) o 1 (sí).
La expansión proporciona una alineación más rápida, pero requiere más memoria

- empalme
Desactiva el empalme (útil para alinear secuencias genómicas en un genoma)

--min-longitud del intrón=INT
Longitud mínima para un intrón interno (por defecto 9). Por debajo de este tamaño, una brecha genómica
se considerará una eliminación en lugar de un intrón.

-K, --longitud del intrón=INT
Longitud máxima para un intrón interno (predeterminado 200000)

-w, --splicedista local=INT
Longitud máxima para sitios de empalme conocidos en los extremos de la secuencia (por defecto 2000000)

-L, --largo total=INT
Longitud total máxima del intrón (por defecto 2400000)

-x, --quimera-margen=INT
Cantidad de secuencia no alineada que activa la búsqueda de la secuencia restante
(predeterminado 30). Permite la alineación de lecturas quiméricas y puede ayudar con algunos
lecturas no quiméricas. Para apagar, poner a cero.

--no-quimeras
Desactiva el hallazgo de quimeras. Mismo efecto que --quimera-margen=0

-t, - hilos=INT
Número de subprocesos de trabajo

-c, --chrsubconjunto=cadena
Limitar la búsqueda a un cromosoma determinado

-z, --dirección=CADENA
Dirección de ADNc (sense_force, antisense_force, sense_filter, antisense_filter o
auto (predeterminado))

-H, --trimendexonas=INT
Recorte los exones finales con menos coincidencias que las indicadas (en nt, por defecto 9)

--modo canónico=INT
Recompensa por intrones canónicos y semi-canónicos 0 = recompensa baja, 1 = recompensa alta
(predeterminado), 2 = recompensa baja para secuencias de alta identidad y recompensa alta en caso contrario

--especies cruzadas
Utilice una búsqueda más sensible para empalmes canónicos, lo que ayuda especialmente para
alineaciones entre especies y otros casos difíciles

--permitir-cerrar-indeles=INT
Permitir una inserción y eliminación cerca una de la otra (0 = no, 1 = sí (predeterminado), 2 = solo
para alineaciones de alta calidad)

--prob de empalme de microexón=FLOAT
Permita microexones solo si una de las probabilidades del sitio de empalme es mayor que esto
valor (predeterminado 0.95)

--cmetdir=CADENA
Directorio para archivos de índice de metilcitosina (creado con cmetindex) (el predeterminado es
ubicación de los archivos de índice del genoma especificados mediante -D, -Vy -d)

--atoidir=CADENA
Directorio para archivos de índice de edición de ARN A-to-I (creado usando atoiindex) (el valor predeterminado es
ubicación de los archivos de índice del genoma especificados mediante -D, -Vy -d)

--modo=CADENA
Modo de alineación: estándar (predeterminado), cmet-stranded, cmet-nonstranded, atoi-stranded,
atoi-nonstranded, ttoc-stranded o ttoc-nonstranded. Los modos no estándar requieren
que haya ejecutado previamente los programas cmetindex o atoiindex (que también cubren
los modos ttoc) en el genoma

-p, --nivel de poda
Nivel de poda: 0 = sin poda (predeterminado), 1 = seqs pobres, 2 = seqs repetitivas, 3 = seqs pobres y
repetitivo

Tipos de salida

-S, --resumen
Mostrar solo resumen de alineaciones

-A, --alinear
Mostrar alineaciones

-3, --continuo
Mostrar alineación en tres líneas continuas

-4, - continuo por exón
Mostrar alineación en tres líneas por exón

-Z, --comprimir
Salida de impresión en formato comprimido

-E, --exones=CADENA
Imprimir exones ("cdna" o "genómico")

-P, --proteína_dna
Imprimir secuencia de proteínas (cDNA)

-Q, --protein_gen
Imprimir secuencia de proteínas (genómica)

-f, --formato=INT
Otro formato de salida (tenga en cuenta también el -A y -S opciones y otras opciones enumeradas
en Tipos de salida):
psl (o 1) = formato PSL (BLAT),
gff3_gene (o 2) = formato del gen GFF3,
gff3_match_cdna (o 3) = formato GFF3 cDNA_match,
gff3_match_est (o 4) = formato GFF3 EST_match,
splicesites (o 6) = salida de splicesites (para archivo de empalme GSNAP),
intrones = salida de intrones (para archivo de empalme GSNAP),
map_exons (o 7) = formato de mapa de exones IIT FASTA,
map_ranges (u 8) = formato de mapa de rango IIT FASTA,
coords (o 9) = coords en formato de tabla,
sampe = formato SAM (configurando el bit paired_read en la bandera),
samse = formato SAM (sin establecer el bit paired_read)

Opciones de salida

-n, --nrutas=INT
Número máximo de rutas para mostrar (por defecto 5). Si se establece en 1, GMAP no informará
alineamientos quiméricos, ya que implican dos caminos. Si quieres una sola alineación
más alineaciones quiméricas, luego establezca esto en 0.

- puntuación subóptima=INT
Informe solo las rutas cuya puntuación se encuentre dentro de este valor de la mejor ruta. Por defecto,
si no se proporciona esta opción,
el programa imprime todas las rutas encontradas.

-O, --ordenado
Imprima la salida en el mismo orden que la entrada (relevante solo si hay más de un trabajador
hilo)

-5, --md5
Imprima la suma de comprobación MD5 para cada secuencia de consulta

-o, --quimera-superposición
Superposición para mostrar, en su caso, en el punto de interrupción de la quimera

--falla solo
Imprima solo alineaciones fallidas, aquellas sin resultados

- fallas
Excluir la impresión de alineaciones fallidas

-V, --snpsdir=CADENA
Directorio de archivos de índice de SNP (creado con snpindex) (la ubicación predeterminada es
archivos de índice de genoma especificados mediante -D y -d)

-v, --uso-snps=CADENA
Utilice una base de datos que contenga SNP conocidos (en .iit, construido previamente usando
snpindex) para la tolerancia a los SNP

--salida dividida=CADENA
Nombre base para salida de varios archivos, por separado para nomapping,
uniq, mult, (y quimera, si --quimera-margen está seleccionado)

--entrada fallida=CADENA
Imprima alineaciones completamente fallidas como formato de entrada FASTA o FASTQ al
expediente. Si el --salida dividida También se da la bandera, este archivo se genera además
a la salida en el archivo .nomapping.

--append-salida
Cuándo --salida dividida or --entrada fallida se da, esta bandera agregará salida a la
archivos existentes. De lo contrario, el valor predeterminado es crear nuevos archivos.

--tamaño del búfer de salida=INT
Tamaño del búfer, en consultas, para el subproceso de salida (predeterminado 1000). Cuando el número de
resultados a imprimir excede este tamaño, los hilos de trabajo se detienen hasta que el
se borra el atasco

-F, --longitud total
Suponga proteína de longitud completa, comenzando con Met

-a, --cdsstart=INT
Traducir codones de un nucleótido dado (basado en 1)

-T, --truncar
Truncar la alineación alrededor de la proteína de longitud completa, Met to Stop implica -F bandera.

-Y, --tolerante
Traduce ADNc con correcciones para cambios de marco.

Opciones para salida GFF3

--gff3-agregar-separadores=INT
Ya sea para agregar un separador ### después de cada secuencia de consulta Valores: 0 (no), 1 (sí,
defecto)

Opciones para la salida SAM

--no-sam-encabezados
No imprima encabezados que comiencen con '@'

--sam-uso-0M
Inserte 0M en CIGAR entre inserciones y eliminaciones adyacentes Requerido por Picard,
pero puede causar errores en otras herramientas

--force-xs-dir
Para alineaciones de RNA-Seq, no permite XS: A :? cuando la dirección de los sentidos no está clara, y
reemplaza este valor arbitrariamente con XS: A: +. Puede ser útil para algunos programas, como
como Gemelos, que no se pueden manejar XS: A:?. Sin embargo, si usa esta bandera, el
El valor informado de XS: A: + en estos casos no será significativo.

--md-minúsculas-snp
En la cadena MD, cuando los SNP conocidos son dados por el -v bandera,
imprime los nucleótidos de diferencia en minúsculas cuando,
difieren de la referencia pero coinciden con un alelo alternativo conocido

--acción-si-error-de-cigarro
Acción a tomar si hay un desacuerdo entre la longitud del CIGAR y la longitud de la secuencia
Valores permitidos: ignorar, advertencia (predeterminado), abortar

- ID de grupo de lectura=CADENA
Valor para poner en el campo id de grupo de lectura (RG-ID)

--nombre-grupo-de-lectura=CADENA
Valor para poner en el campo de nombre de grupo de lectura (RG-SM)

- biblioteca de grupo de lectura=CADENA
Valor para poner en el campo de biblioteca de grupo de lectura (RG-LB)

- plataforma de grupo de lectura=CADENA
Valor para poner en el campo de la biblioteca de grupo de lectura (RG-PL)

Opciones para puntajes de calidad

- protocolo de calidad=CADENA
Protocolo para puntajes de calidad de entrada. Valores permitidos: illumina (ASCII 64-126)
(equivalente a -J 64 -j -31) sanger (ASCII 33-126) (equivalente a -J 33 -j 0)

El valor predeterminado es sanger (sin cambio de impresión de calidad)
Los archivos de salida SAM deben tener puntuaciones de calidad en el protocolo Sanger

O puede especificar el turno de impresión con esta bandera:

-j, - cambio de impresión de calidad=INT
Cambie las puntuaciones de calidad de FASTQ en esta cantidad en la salida (el valor predeterminado es 0 para Sanger
protocolo; para cambiar la entrada de Illumina a la salida de Sanger, seleccione -31)

Opciones de archivo de mapa externo

-M, --mapdir=directorio
Directorio de mapas

-m, --mapa=archivo iit
Archivo de mapa. Si el argumento es '?' (con las comillas),
esto enumera los archivos de mapas disponibles.

-e, --mapexones
Mapear cada exón por separado

-b, --mapa ambos
Informe los resultados de ambas hebras del genoma

-u, - flanqueando=INT
Mostrar golpes de flanqueo (predeterminado 0)

- comentario de impresión
Mostrar línea de comentario para cada visita

Opciones de salida de alineación

-N, - longitudes
Sin longitudes de intrón alineadas

-I, --modo invertido=INT
Modo de alineación con la hebra genómica (-): 0 = No invertir el ADNc (predeterminado)
1 = Invertir ADNc e imprimir hebra genómica (-) 2 = Invertir ADNc e imprimir genómico (+)
hebra

-i, --introngap=INT
Nucleótidos para mostrar en cada extremo del intrón (3 por defecto)

-l, --longitud de envoltura=INT
Longitud de envoltura para alineación (50 por defecto)

Opciones de salida de filtrado

--cobertura mínima recortada=FLOAT
No imprima alineaciones con cobertura recortada menos este valor (predeterminado = 0.0, que
significa que no hay filtrado) Tenga en cuenta que las alineaciones quiméricas se generarán independientemente de esto
filtrar

--min-identidad=FLOAT
No imprima alineaciones con identidad menos este valor (predeterminado = 0.0, lo que significa que no
filtrado) Tenga en cuenta que las alineaciones quiméricas se emitirán independientemente de este filtro
Opciones de ayuda

--cheque
Verifique las suposiciones del compilador

--versión
Mostrar versión

--ayuda Mostrar este mensaje de ayuda

Otras herramientas de la suite GMAP se encuentran en / usr / lib / gmap

Use gmap en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad


Participar