InglésFrancésEspañol

Ad


icono de página de OnWorks

minimapa: en línea en la nube

Ejecute minimap en el proveedor de alojamiento gratuito de OnWorks a través de Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el minimapa de comandos que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


minimapa: mapeo rápido entre secuencias largas de ADN

SINOPSIS


minimapa [-lSOV] [-k kmer] [-w ganarTamaño] [-I tamaño del lote] [-d volcado de archivo] [-f ocThres] [-r
banda ancha] [-m minCompartido] [-c cuentamin] [-L partido mínimo] [-g MaxGap] [-T polvoTres] [-t
nHilos] [-x preestablecido] objetivo.fa consulta.fa > salida.paf

DESCRIPCIÓN


Minimap es una herramienta para encontrar de manera eficiente múltiples posiciones de mapeo aproximadas entre dos
conjuntos de secuencias largas, como entre lecturas y genomas de referencia, entre genomas y
entre lecturas largas y ruidosas. Minimap tiene una fase de indexación y mapeo. En la indexación
fase, recopila todos los minimizadores de un gran lote de secuencias objetivo en una tabla hash; en
En la fase de mapeo, identifica buenos grupos de aciertos del minimizador colineal. Minimapa hace
no generar alineaciones detalladas entre el objetivo y las secuencias de consulta. Sólo
genera las coordenadas iniciales y finales aproximadas de estos grupos.

CAMPUS


Indexación opciones
-k INT Minimizador k-mer longitud [15]

-w INT Tamaño de la ventana minimizadora [2/3 de la longitud de k-mer]. Un minimizador es el k-mer más pequeño
en una ventana de w k-mers consecutivos.

-I NUM Cargar como máximo NUM bases de destino en RAM para indexar [4G]. Si hay mas de
NUM bases en objetivo.fa, el minimapa debe leer consulta.fa varias veces para mapearlo
contra cada lote de secuencias objetivo. NUM puede terminar con k / K / m / M / g / G.

-d ARCHIVO Volcar el índice del minimizador a ARCHIVO [sin volcado]

-l Indican que objetivo.fa es de hecho un índice minimizador generado por la opción -dno,
un archivo FASTA o FASTQ.

Mapeo opciones
-f FLOAT Ignorar la parte superior FLOAT fracción de la mayoría de los minimizadores que ocurren [0.001]

-r INT Ancho de banda aproximado para el clúster de aciertos del minimizador inicial [500]. A minimizador
hit es un minimizador presente en las secuencias de destino y de consulta. A minimizador
hit grupo es un grupo de impactos de minimizador potencialmente colineales entre un objetivo
y una secuencia de consultas.

-m FLOAT Fusionar clústeres de aciertos del minimizador inicial si FLOAT o mayor fracción de minimizadores
se comparten entre los clústeres [0.5]

-c INT Conserve un clúster de aciertos de minimizador si contiene INT o más golpes de minimizador [4]

-L INT Descartar un clúster de aciertos de minimizador si después de la colinealización, el número de coincidencias
las bases están debajo INT [40]. Esta opción reduce principalmente el tamaño de la salida. Tiene
poco efecto sobre la velocidad y la memoria máxima.

-g INT Dividir un grupo de impactos de minimizador en un espacio INT-bp o más largo que no contiene
cualquier minimizador acierta [10000]

-T INT Enmascarar regiones en secuencias de consulta con umbral de puntuación SDUST INT; 0 para deshabilitar
[0]. SDUST es un algoritmo para identificar subsecuencias de baja complejidad. No lo es
habilitado por defecto. Si se prefiere SDUST, un valor entre 20 y 25 es
recomendado. Un umbral más alto enmascara menos secuencias.

-S Realice un mapeo de todos contra todos. En este modo, si el nombre de la secuencia de consulta es
lexicográficamente más grande que el nombre de la secuencia de destino, los hits entre ellos
será suprimido; si el nombre de la secuencia de consulta es el mismo que el nombre del objetivo,
También se suprimirán los golpes diagonales del minimizador.

-O Deja caer un golpe minimizador si está lejos de otros golpes (EXPERIMENTAL). Esta
La opción es útil para mapear cromosomas largos de dos especies divergentes.

-x STR Cambiar múltiples configuraciones basadas en STR [no establecido]. Se recomienda aplicar
esta opción antes que otras opciones, de modo que las siguientes opciones pueden anular
las múltiples configuraciones modificadas por esta opción.

ava10k para mapas de lectura de todos contra todos PacBio u Oxford Nanopore (-Sw5 -L100 -m0).

De entrada y salida opciones
-t INT Número de hilos [3]. Minimapa utiliza como máximo tres subprocesos al recolectar
minimizadores en las secuencias de destino, y utiliza hasta INT+1 hilos al mapear (el
El subproceso adicional es para E / S, que con frecuencia está inactivo y requiere poco tiempo de CPU).

-V Imprimir el número de versión en la salida estándar

SALIDA FORMATO


El minimapa muestra las posiciones de mapeo en el formato de mapeo por pares (PAF). PAF es un TAB-
formato de texto delimitado con cada línea que consta de al menos 12 campos como se describe en
la siguiente tabla:

┌────┬────────┬──────────────────────────────────── ──────────────────────────┐
ColumnaTipo de PropiedadDescripción
├────┼────────┼──────────────────────────────────── ──────────────────────────┤
│ 1 │ cadena │ Nombre de secuencia de consulta │
│ 2 │ int │ Longitud de secuencia de consulta │
│ 3 │ int │ Coordenada de inicio de consulta (basada en 0) │
│ 4 │ int │ Coordenada de fin de consulta (basada en 0) │
│ 5 │ char │ `+ 'si la consulta y el objetivo están en la misma línea; `- 'si es opuesto │
│ 6 │ cadena │ Nombre de la secuencia de destino │
│ 7 │ int │ Longitud de la secuencia de destino │
│ 8 │ int │ Coordenada de inicio del objetivo en la hebra original │
│ 9 │ int │ Coordenada final del objetivo en la hebra original │
│ 10 │ int │ Número de bases coincidentes en el mapeo │
│ 11 │ int │ Bases numéricas, incluidas las lagunas, en el mapeo │
│ 12 │ int │ Calidad de mapeo (0-255 con 255 para faltar) │
└────┴────────┴──────────────────────────────────── ──────────────────────────┘

Cuando la alineación está disponible, la columna 11 da el número total de coincidencias de secuencia,
desajustes y lagunas en la alineación; la columna 10 dividida por la columna 11 da la alineación
identidad. Como el minimapa no genera una alineación detallada, estas dos columnas se
aproximado. PAF puede tener, opcionalmente, campos adicionales en la clave-valor con tipo SAM
formato. Minimap escribe el número de aciertos del minimizador en un clúster en la etiqueta cm.

Utilice el minimapa en línea mediante los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad