InglésFrancésEspañol

Ad


icono de página de OnWorks

cmcalibrate: en línea en la nube

Ejecute cmcalibrate en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando cmcalibrate que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


cmcalibrate: ajuste las colas exponenciales para la determinación del valor E del modelo de covarianza

SINOPSIS


cmcalibrar [opciones] archivo cm

DESCRIPCIÓN


cmcalibrar determina los parámetros de cola exponencial para la determinación del valor E generando
secuencias aleatorias, buscándolas con el CM y recogiendo las puntuaciones del resultado
golpes. Un histograma de las puntuaciones de bits de los hits se ajusta a una cola exponencial, y el
los parámetros de la cola ajustada se guardan en el archivo CM. Los parámetros de cola exponencial
luego se utilizan para estimar la significancia estadística de los aciertos encontrados en cmbúsqueda y
cmscan

Un archivo CM debe calibrarse con cmcalibrar antes de que pueda usarse en cmbúsqueda or cmscan,
con una sola excepción: no es necesario calibrar archivos CM que incluyen solo
modelos con pares de bases cero antes de ejecutar cmbuscar.

cmcalibrar es muy lento. Se necesitan un par de horas para calibrar un solo tamaño medio.
CM en una sola CPU. cmcalibrar se ejecutará en paralelo en todos los núcleos disponibles si Infernal
se construyó en un sistema que admite subprocesos POSIX (consulte la sección Instalación de la
guía del usuario para obtener más información). Utilizando núcleos resultarán en aproximadamente -Fold
aceleración frente a una sola CPU. MPI (interfaz de paso de mensajes) también se puede utilizar para
paralelización con el --mpi opción si Infernal fue construido con MPI habilitado, pero usando
no se recomiendan más de 161 procesadores porque aumentar más allá de 161 no se acelerará
la calibración. Consulte la sección Instalación de la guía del usuario para obtener más información.

El --pronóstico La opción se puede utilizar para estimar cuánto tiempo tardará el programa en ejecutarse durante un
dado archivo cm en la máquina actual. Para predecir el tiempo de ejecución en procesadores con
MPI, utilice adicionalmente el --previsión .

Las secuencias aleatorias buscadas en cmcalibrar son generados por un HMM que fue entrenado en
Secuencias genómicas reales con diversos contenidos de GC. El objetivo es tener las distribuciones GC
en las secuencias aleatorias ser similares a las de las secuencias genómicas reales.

Se realizan cuatro rondas de búsquedas y posteriores ajustes de cola exponenciales, uno para cada
los cuatro algoritmos CM diferentes que se pueden utilizar en cmbúsqueda y cmscan: CYK glocal,
Glocal Inside, local CYK y local Inside.

Los parámetros de valores E determinados por cmcalibrar solo son utilizados por el cmbúsqueda y cmscan
programas. Si no va a utilizar estos programas, no pierda el tiempo calibrando
tus modelos.

CAMPUS


-h Ayudar; imprima un breve recordatorio del uso de la línea de comandos y las opciones disponibles.

-L Establecer la longitud total de las secuencias aleatorias para buscar megabases (Mb). Por
defecto is 1.6 Mb. Creciente hará que la cola exponencial se ajuste más
precisos y valores E más precisos, pero tomará más tiempo (duplicar será aproximadamente
el doble del tiempo de ejecución). Decreciente no se recomienda ya que hará que el
se ajusta con menos precisión y los valores E menos precisos.

CAMPUS PARA PREDECIENDO REQUERIDO HORA Y MEMORIA


--pronóstico
Predecir el tiempo de ejecución de la calibración de archivo cm (con las opciones proporcionadas) en
la máquina actual y salir. No se realiza la calibración. Las predicciones
deben considerarse estimaciones aproximadas. Si el subproceso múltiple está habilitado (consulte
Sección de instalación de la guía del usuario), el tiempo tendrá en cuenta el número
de núcleos disponibles.

--previsión
Con --pronóstico, especificar eso Se utilizarán procesadores para la calibración.
Esto puede resultar útil para predecir el tiempo de ejecución de una ejecución de MPI con
procesadores.

--memreq
Predecir la cantidad de memoria necesaria para calibrar archivo cm (con provisto
opciones) en la máquina actual y salir. No se realiza la calibración.

CAMPUS CONTROLADOR EXPONENCIAL COLA ENCAJA


--gtailn
ajustar la cola exponencial para glocal Inside y glocal CYK a la puntuaciones más altas
en la cola del histograma, donde is veces el número de Mb buscados. los
valor predeterminado de es 250. Se eligió el valor 250 porque funciona bien
empíricamente en relación con otros valores.

--ltailn
ajustar la cola exponencial para local Inside y local CYK a la puntuaciones más altas
en la cola del histograma, donde is veces el número de Mb buscados. los
valor predeterminado de es 750. Se eligió el valor 750 porque funciona bien
empíricamente en relación con otros valores.

- cola
Ignora el --gtailn y --ltailn opciones prefijadas y se ajustan a las fracción de cola de
el histograma a una cola exponencial, para todos los modos de búsqueda.

OPCIONAL SALIDA ARCHIVOS


--harchivo
Guarde los histogramas ajustados al archivo . El formato de este archivo es de dos espacios
columnas delimitadas por línea. La primera columna son los valores del eje x de las puntuaciones de bits de
cada contenedor. La segunda columna son los valores del eje y del número de hits por bin. Cada
La serie está delimitada por una línea con un solo carácter "&". El archivo contendrá
una serie para cada una de las cuatro colas exponenciales se ajusta en el siguiente orden:
CYK glocal, interior glocal, CYK local e interior local.

--archivo
Guarde la información de la parcela de supervivencia en un archivo . El formato de este archivo es de dos espacios
columnas delimitadas por línea. La primera columna son los valores del eje x de las puntuaciones de bits de
cada contenedor. La segunda columna son los valores del eje y de la fracción de aciertos que cumplen o
supere la puntuación de cada contenedor. Cada serie está delimitada por una línea con un solo
personaje "&". El archivo contendrá tres series de datos para cada uno de los cuatro CM
modos de búsqueda en el siguiente orden: glocal CYK, glocal Inside, local CYK y
interior local. La primera serie es la gráfica de supervivencia empírica del histograma.
de aciertos a la secuencia aleatoria. La segunda serie es el ajuste de cola exponencial a
la distribución empírica. La tercera serie es el ajuste de cola exponencial si lambda
se fijaron y se establecieron como el logaritmo natural de 2 (0.691314718).

--qqarchivo
Guarde la información de la gráfica de cuantiles-cuantiles en un archivo . El formato de este archivo es
dos columnas delimitadas por espacios por línea. La primera columna son los valores del eje x, y
la segunda columna son los valores del eje y. La distancia de los puntos desde el
línea de identidad (y = x) es una medida de qué tan bueno es el ajuste de cola exponencial, el
más cerca estén los puntos de la línea de identidad, mejor será el ajuste. Cada serie es
delimitado por una línea con un solo carácter "&". El archivo contendrá una serie
de datos empíricos para cada una de las cuatro colas exponenciales encaja en el siguiente
orden: glocal CYK, glocal Inside, local CYK y local Inside.

- archivo
Guarde las estadísticas delimitadas por espacio de diferentes ajustes de cola exponencial al archivo .
El archivo contendrá los valores lambda y mu para las colas exponenciales que se ajustan a
colas de histograma de diferentes tamaños. Los campos del archivo están etiquetados
informativamente.

--xarchivo
Guarde una lista de las puntuaciones en cada cola de histograma de ajuste en el archivo . Cada línea de
este archivo tendrá una puntuación diferente que indica que existió un hit en la cola con
esa puntuación. Cada serie está delimitada por una línea con un solo carácter "&". los
El archivo contendrá una serie para cada uno de los cuatro ajustes de cola exponenciales en el
siguiente orden: glocal CYK, glocal Inside, local CYK y local Inside.

OTROS CAMPUS


--semilla
Siembra el generador de números aleatorios con , un entero> = 0. Si es distinto de cero,
las simulaciones estocásticas serán reproducibles; el mismo comando dará lo mismo
resultados. Si es 0, el generador de números aleatorios se siembra arbitrariamente y
Las simulaciones estocásticas variarán de una ejecución a otra del mismo comando. El valor por defecto
la semilla es 181.

--beta
De forma predeterminada, se utilizan bandas dependientes de consultas (QDB) para acelerar la búsqueda de CM
algoritmos con una probabilidad de pérdida de cola beta de 1E-15. Este valor beta puede ser
cambiado a --beta . El parámetro beta es la cantidad de probabilidad
masa excluida durante el cálculo de la banda, valores más altos de beta dan mayores aceleraciones
pero sacrifique más precisión que los valores más bajos. El valor predeterminado utilizado es 1E-15.
(Para obtener más información sobre QDB, consulte Nawrocki y Eddy, PLoS Computational Biology
3(3): e56.)

- sin bandas
Apague QDB durante la calibración del valor E. Esto ralentizará la calibración.

--no nulo3
Desactive el modelo nulo adicional post hoc null3. Esto no se recomienda a menos que
planeas usar la misma opción para cmbúsqueda y/o cmscan

--aleatorio
Utilice el modelo nulo de fondo del CM para generar las secuencias aleatorias, en su lugar
del HMM más realista. A menos que el CM se haya construido utilizando el --nulo opción de
cmconstruir, el modelo nulo de fondo será del 25% cada A, C, G y U.

--gc
Genere las secuencias aleatorias utilizando la distribución de nucleótidos de la secuencia.
presentar .

--UPC
Especificar que Se utilizarán trabajadores de CPU paralelos. Si se establece como "0", entonces el
El programa se ejecutará en modo serie, sin utilizar subprocesos. También puedes controlar
este número estableciendo una variable de entorno, INFERNAL_NCPU. Esta opción
sólo estará disponible si la máquina en la que se construyó Infernal es capaz de usar
Subprocesos POSIX (consulte la sección Instalación de la guía del usuario para obtener más
información).

--mpi Ejecutar como un programa paralelo MPI. Esta opción solo estará disponible si Infernal tiene
ha sido configurado y construido con el indicador "--enable-mpi" (consulte la Instalación
sección de la guía del usuario para obtener más información).

Use cmcalibrate en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad