miniasm - Online en la nube

Este es el comando miniasm que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


miniasm - ensamblador de novo para secuencias de lectura largas

SINOPSIS


miniasmo [-b12V] [-m partido mínimo] [-i minIden] [-s minSpan] [-c minCov] [-o minOvlp] [-h
MaxHang] [-I intTres] [-g maxGapDiff] [-d maxBubDist] [-e minUtgTamaño] [-f Leer archivo] [-n
nRondas] [-r relación de caída] [-F relación de caída final] [-p información de salida] mapeo.paf > salida.gfa

DESCRIPCIÓN


Miniasm es un ensamblador de novo basado en OLC muy rápido para lecturas largas y ruidosas. Se necesita todo contra
todos leen auto-mapeos en el formato PAF como entrada y generan un gráfico de ensamblaje en el GFA
formato. A diferencia de los ensambladores convencionales, el miniasma no tiene un paso de consenso. Eso
simplemente concatena fragmentos de secuencias de lectura para generar las secuencias unitig finales. Por lo tanto
la tasa de error por base es similar a las lecturas de entrada sin procesar.

CAMPUS


Preselección opciones
-m INT Caída de asignaciones que tengan menos de INT bases coincidentes (col10 en PAF) [100]. Esta
La opción tiene el mismo rol que -L del minimapa.

-s INT Caída de asignaciones más cortas que INT-pb [1000]. Esta opción también afecta al segundo
ronda de filtrado de lectura y longitud mínima de superposición.

-i FLOAT Durante el filtrado de lectura, ignore las asignaciones con col10 / col11 a continuación FLOAT [0.05].
Las asignaciones ignoradas todavía se utilizan para superposiciones de lectura.

-c INT Cobertura mínima por otras lecturas [3]. En la primera ronda de filtrado, miniasma
encuentra la región más larga cubierta por INT o más lecturas. En la segunda ronda,
Además requiere que cada base restante esté cubierta por INT bases al menos
minSpan/ 2 desde el final de otras lecturas.

Superposición opciones
-o INT Longitud mínima de superposición [igual que minSpan]

-h INT Longitud máxima de voladizo [1000]. Un voladizo es una región no mapeada que debe ser
mapeado dada una verdadera superposición o verdadera contención. Si el voladizo es demasiado largo,
la asignación se considera una coincidencia interna y se ignorará.

-I FLOAT Relación mínima entre la longitud del mapeo y el mapeo + la longitud del voladizo para un mapeo
considerado una contención o una superposición [0.8]. Esta opción tiene un papel similar a
-h, excepto que controla la proporción, no la longitud.

Gráfico diseño opciones
-g INT Diferencias máximas de brecha entre dos lecturas en un mapeo [1000]. Este parámetro es
sólo se utiliza para la reducción transitiva.

-d INT Distancia máxima de palpado para estallido de burbujas [50000]. Burbujas más largas que INT
no será reventado.

-e INT Un unitig se considera pequeño si está compuesto por menos de INT lee [4].
Miniasm puede intentar eliminar pequeñas unidades en varios pasos.

-f ARCHIVO Leer archivo de secuencia en formato FASTA o FASTQ para generar secuencias unitig
[nulo]. Si esta opción está ausente, miniasm produce una salida GFA sin
secuencias

-r FLOAT1, [FLOAT2]
Relación de caída de superposición máxima y mínima [0.7,0.5]. Deje que la superposición (v-> w) sea la superposición
longitud del borde v-> w y maxovlp (v) = max_w {superposición (v-> w)} sea la longitud del mayor
superposición. Las gotas de miniasma se superponen v-> w si la superposición (v-> w) / maxovlp (v) está por debajo de a
umbral controlado por esta opción. Se aplica el miniasmo nRondas rondas de corta
eliminación de superposición con un umbral creciente entre FLOTADOR1 y FLOTADOR2.

-n INT Rondas de eliminación de solapamientos cortos [3].

-F FLOAT Umbral de la tasa de caída de superposición después de la eliminación de unitig breve [0.8]

Observaciones opciones
-b Indique que en la entrada, es probable que se proporcione el mismo mapeo dos veces.

-1 Omitir la primera ronda de selección de lectura previa al ensamblaje

-2 Omitir la segunda ronda de selección de lectura previa al ensamblaje

-p STR Información de salida y formato [ug]. Posible STR los valores incluyen - Habitación: correo-
regiones de lectura filtradas en formato BED; paf: asignaciones entre posfiltrado
lee; sg: lee el gráfico de superposición en formato GFA; ug: gráfico unitig en el GFA
formato.

-V Imprimir el número de versión en la salida estándar

ENTRADA FORMATO


Miniasm lee las posiciones de mapeo en el formato de mapeo por pares (PAF), que es un TAB-
formato de texto delimitado con cada línea que consta de al menos 12 campos como se describe en
la siguiente tabla:

┌────┬────────┬──────────────────────────────────── ──────────────────────────┐
ColumnaTipo de PropiedadDescripción
├────┼────────┼──────────────────────────────────── ──────────────────────────┤
│ 1 │ cadena │ Nombre de secuencia de consulta │
│ 2 │ int │ Longitud de secuencia de consulta │
│ 3 │ int │ Coordenada de inicio de consulta (basada en 0) │
│ 4 │ int │ Coordenada de fin de consulta (basada en 0) │
│ 5 │ char │ `+ 'si la consulta y el objetivo están en la misma línea; `- 'si es opuesto │
│ 6 │ cadena │ Nombre de la secuencia de destino │
│ 7 │ int │ Longitud de la secuencia de destino │
│ 8 │ int │ Coordenada de inicio del objetivo en la hebra original │
│ 9 │ int │ Coordenada final del objetivo en la hebra original │
│ 10 │ int │ Número de bases coincidentes en el mapeo │
│ 11 │ int │ Bases numéricas, incluidas las lagunas, en el mapeo │
│ 12 │ int │ Calidad de mapeo (0-255 con 255 para faltar) │
└────┴────────┴──────────────────────────────────── ──────────────────────────┘

Por favor mira minimapa(1) para obtener una descripción detallada de cada campo.

SALIDA FORMATO


Miniasm genera el ensamblaje en el formato Graphical Fragment Assembly (GFA). Es un
formato delimitado por TAB basado en líneas, con la letra inicial indica el tipo de línea.
La siguiente tabla muestra los tipos de línea utilizados por miniasm:

┌─────┬─────────────┬───────────────────────────── ───────────────────────┐
líneaComentariofijo campos
├─────┼─────────────┼───────────────────────────── ───────────────────────┤
│ H │ Encabezado │ N / A │
│ S │ Segmento │ segName segSeq │
│ L │ Superposición │ segName1 segOri1 segName2 segOri2 ovlpCIGAR │
│ a │ Ruta dorada │ utgName utgStart readName: longitud inicial-final readOri │
└─────┴─────────────┴───────────────────────────── ───────────────────────┘

Use miniasm en línea usando los servicios de onworks.net



Últimos programas en línea de Linux y Windows