Este es el comando HPCdaligner que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
HPCdaligner: genera un script para ejecutar alineador(1)
SINOPSIS
Alineador HPC [-vbAI] [-kint(14)] [-wint(6)][-hint(35)] [-tint] [-Mint] [-edoble (.70)]
[-lint(1000)] [-sint(100)] [-Hint] [-mseguir] + [-dalint(4)] [-gradoint(25)] ruta: db | presa
[primero: int[-último: int]]
DESCRIPCIÓN
Alineador HPC escribe un script de shell de UNIX en la salida estándar que consta de una secuencia
de comandos que se ejecutan eficazmente alineador(1) en todos los pares de bloques de una base de datos dividida
y luego los clasifica y fusiona externamente usando LAclase(1) y LAmerge(1) en una colección
de archivos de alineación con nombres camino. #. las donde # va desde 1 hasta el número de bloques que
la base de datos está dividida en. Estos archivos ordenados si se concatenan por decir LAcat(1) contendría
todas las alineaciones en orden ordenado (de a-read, luego b-read, etc.). Además, todos
se garantiza que las superposiciones para una lectura a determinada no se dividan entre archivos, por lo que se puede ejecutar
analizadores de artefactos o corrección de errores en cada archivo ordenado en paralelo.
La base de datos debe haber sido previamente dividida por división DB(1) y todos los parámetros, excepto
-v, -daly -grado, se pasan a las llamadas a alineador(1). Los valores predeterminados de
estos parámetros son como para alineador(1). los -v flag, para el modo detallado, también se pasa a
todas las llamadas a LAclase(1) y LAmerge(1). -dal y -grado las opciones se describen más adelante.
Para una base de datos dividida en N sub-bloques, las llamadas a alineador(1) producirá en total
Archivos 2TN ^ 2 .las asumiendo que daligner se ejecuta con subprocesos T. Estos luego se ordenarán y
combinado en N ^ 2 archivos .las ordenados, uno para cada par de bloques. Estos luego se fusionan en
ceil (log_deg N) fases donde el número de archivos disminuye geométricamente en -grado hasta
hay 1 archivo por fila de la matriz de bloques N x N. Así que al final uno tiene N ordenados .las
archivos que, cuando se concatenan, darían un solo archivo de superposición ordenado de gran tamaño.
El -dal opción (por defecto 4) da el número deseado de comparaciones de bloques por llamada a
alineador(1). Algunos deben contener dal-1 comparaciones, y la primera dal-2 comparaciones de bloques
aún menos, pero el Alineador HPC "planificador" hace lo mejor que puede para proporcionar una carga media de
comparaciones de bloques dal por comando. los -grado opción (por defecto 25) da el número máximo
de archivos que se fusionarán en un solo LAmerge(1) comando. El planificador aprovecha al máximo
incluso árbol k-ario de fusiones, donde el número de niveles es ceil (log_deg N).
Si los enteros la primera y pasado faltan, entonces el script producido es para cada bloque en
la base de datos. Si la primera está presente, entonces Alineador HPC produce un script incremental que
compara bloques la primera a pasado (pasado = la primera si no está presente) uno contra el otro y
todos los bloques anteriores del 1 al la primera-1, y luego actualiza incrementalmente los archivos .las para
bloques 1 al la primera-1 y crea los archivos .las para bloques la primera a pasado.
Cada salida de línea de comando de UNIX por el Alineador HPC puede ser un trabajo por lotes (usamos el &&
operador para combinar varios comandos en una línea para que esto sea así). Dependencias entre
Los trabajos se pueden mantener simplemente ejecutando primero todos los alineador(1) trabajos, luego todos los
trabajos de clasificación inicial y, a continuación, todos los trabajos de cada fase de la clasificación de combinación externa. Cada
de estas fases está separada por una línea de comentarios informativos para su scripting
conveniencia.
Utilice HPCdaligner en línea utilizando los servicios de onworks.net