InglésFrancésEspañol

Ad


icono de página de OnWorks

cmbuild - Online en la nube

Ejecute cmbuild en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando cmbuild que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


cmbuild: construye modelos de covarianza a partir de secuencias múltiples de ARN anotadas estructuralmente
alineación (s)

SINOPSIS


cmconstruir [opciones]

DESCRIPCIÓN


Para cada alineación de secuencia múltiple en construir un modelo de covarianza y guardarlo en
un nuevo archivo .

El archivo de alineación debe estar en formato Stockholm o SELEX y debe contener consenso
anotación de estructura secundaria. cmconstruir utiliza la estructura de consenso para determinar el
arquitectura del CM.

puede ser '-' (guión), lo que significa leer esta entrada de stdin en lugar de un archivo.
Para usar '-', también debe especificar el formato de archivo de alineación con --informato , como en
--informato Estocolmo (debido a una limitación actual en nuestra implementación, archivo MSA
Los formatos no se pueden detectar automáticamente en un flujo de entrada que no se puede rebobinar).

puede no ser '-' (salida estándar), porque enviando el archivo CM a stdout entraría en conflicto
con la otra salida de texto del programa.

Además de escribir CM (s) para , cmconstruir también genera una sola línea para cada
modelo creado para stdout. Cada línea tiene los siguientes campos: "aln": el índice del
alineación utilizada para construir el CM; "idx": el índice del CM en el ; "nombre":
el nombre del CM; "nseq": el número de secuencias en la alineación utilizadas para construir el CM;
"eff_nseq": el número efectivo de secuencias utilizadas para construir el modelo; "alen": la longitud
de la alineación utilizada para construir el CM; "clen": el número de columnas de la alineación
definido como columnas de consenso (coincidencia); "bps": el número de pares de bases en el CM; "bifs":
el número de bifurcaciones en el CM; "rel entropía: CM": la entropía relativa total de la
modelo dividido por el número de columnas de consenso; "rel entropy: HMM": el relativo total
entropía del modelo ignorando la estructura secundaria dividida por el número de consenso
columnas. "descripción": descripción del modelo / alineación.

CAMPUS


-h Ayudar; imprima un breve recordatorio del uso de la línea de comandos y las opciones disponibles.

-n Nombra el nuevo CM . El valor predeterminado es usar el nombre de la alineación (si uno es
Presente en el ), o, en su defecto, el nombre del . If
contiene más de una alineación, -n no funciona, y cada alineación
debe tener un nombre anotado en el (como en Estocolmo # = anotación GF ID).

-F Permitir para ser sobrescrito. Sin esta opción, si ya haya utilizado
existe, cmconstruir sale con un error.

-o Dirija la salida resumida al archivo , en lugar de salida estándar.

-O Después de construir cada modelo, vuelva a guardar las alineaciones de origen anotadas en un archivo
en formato de Estocolmo. Las secuencias se anotan con qué pesos de secuencia relativa
Fueron asignados. Las alineaciones también están anotadas con una línea de anotación de referencia.
indicando qué columnas se asignaron como consenso. Si la alineación de la fuente hubiera
anotación de referencia ("# = GC RF") se reemplazará con el residuo de consenso de
el modelo para columnas de consenso y '.' para insertar columnas, a menos que el --mano
Se utilizó la opción para especificar posiciones de consenso, en cuyo caso será
sin alterar.

--devayuda Ayuda de impresión, como con -h , pero también incluyen opciones de expertos que no son
mostrado con -h . No se espera que estas opciones de expertos sean relevantes para el
gran mayoría de usuarios y, por lo tanto, no se describen en la página del manual. El único
Los recursos para comprender lo que realmente hacen son el breve diagrama unifilar
salida de descripciones cuando --devayuda está habilitado y el código fuente.

CAMPUS CONTROLADOR MODELO CONSTRUCCIÓN


Estas opciones controlan cómo se definen las columnas de consenso en una alineación.

--rápido Definir columnas de consenso automáticamente como aquellas que tienen una fracción> = Symfrac of
residuos en contraposición a lagunas. (Vea a continuación para --symfrac opción.) Esta es la
predeterminado.

--mano Utilice la anotación de coordenadas de referencia (# = línea GC RF, en Estocolmo) para determinar qué
las columnas son de consenso y las que son inserciones. Cualquier carácter sin espacio indica un
columna de consenso. (Por ejemplo, marque las columnas de consenso con "x" e inserte columnas
con ".".) Esta opción se llamó --rf en versiones anteriores de Infernal (0.1
hasta 1.0.2).

--symfrac
Definir el umbral de fracción de residuo necesario para definir una columna de consenso cuando
no usando --mano. El valor predeterminado es 0.5. La fracción de símbolo en cada columna es
calculado después de tener en cuenta la ponderación de secuencia relativa. Estableciendo esto en
0.0 significa que cada columna de alineación se asignará como consenso, que puede ser
útil en algunos casos. Establecerlo en 1.0 significa que solo las columnas que incluyen 0 espacios
se asignará por consenso. Esta opción reemplaza la --gapthresh opción
de versiones anteriores de Infernal (0.1 a 1.0.2), con igual a (1.0 -
). Por ejemplo, para reproducir el comportamiento de un comando de cmconstruir --gapthresh 0.8
en una versión anterior, use cmconstruir --symfrac 0.2 con esta versión.

--noss Ignore la anotación de estructura secundaria, si la hubiera, en y construye un CM con
pares de bases cero. Este modelo será similar a un perfil HMM y el cmbúsqueda y
cmscan Los programas utilizarán algoritmos HMM que son más rápidos que los CM para este
modelo. Además, no es necesario calibrar un modelo de pares de bases cero con cmcalibrar
antes de correr cmbúsqueda con eso. los --noss La opción debe usarse si no hay
anotación de estructura secundaria en .

- búsqueda
Parametrizar las puntuaciones de emisión a la RSEARCH, utilizando la matriz RIBOSUM en el archivo .
Con - búsqueda habilitado, todas las alineaciones en debe contener exactamente uno
secuencia o la --llama La opción también debe estar habilitada. Todas las posiciones en cada secuencia
se considerarán "columnas" de consenso. En realidad, las puntuaciones de emisión de estos
Los modelos no serán idénticos a los puntajes de RIBOSUM debido a las diferencias en el modelado.
estrategia entre Infernal y RSEARCH, pero serán lo más similares posible.
Los archivos de matriz RIBOSUM se incluyen con Infernal en el subdirectorio "matrices /" de
el directorio de nivel superior "infernal-xxx". Las matrices RIBOSUM son puntuación de sustitución
matrices entrenadas específicamente para ARN estructurales con monocatenarios separados
puntuaciones de sustitución de residuos y pares de bases. Para obtener más información, consulte RSEARCH
publicación (Klein y Eddy, BMC Bioinformatics 4:44, 2003).

OTROS MODELO CONSTRUCCIÓN CAMPUS


--nulo
Leer un modelo nulo de . El modelo nulo define la probabilidad de cada ARN
nucleótido en la secuencia de fondo, el valor predeterminado es utilizar 0.25 para cada nucleótido.
El formato de los archivos nulos se especifica en la guía del usuario.

--previo
Leer un Dirichlet antes de , reemplazando la mezcla predeterminada Dirichlet. los
El formato de los archivos anteriores se especifica en la guía del usuario.

Uso --devayuda para ver opciones de construcción de modelos adicionales, de lo contrario indocumentadas.

CAMPUS CONTROLADOR RELATIVO PESAS


cmconstruir utiliza un algoritmo de ponderación de secuencia ad hoc para reducir la ponderación estrechamente relacionada
secuencias y subidas de peso lejanamente relacionadas. Esto tiene el efecto de hacer que los modelos sean menos
sesgado por una representación filogenética desigual. Por ejemplo, dos secuencias idénticas
normalmente, cada uno recibe la mitad del peso que recibiría una secuencia. Estas opciones controlan
qué algoritmo se utiliza.

--wpb Utilice el esquema de ponderación de secuencia basado en la posición de Henikoff [Henikoff y Henikoff,
J. Mol. Biol. 243: 574, 1994]. Este es el predeterminado.

--wgsc Utilice el algoritmo de ponderación de Gerstein / Sonnhammer / Chothia [Gerstein et al, J. Mol.
Biol. 235: 1067, 1994].

--uno
Desactive la ponderación de secuencia; por ejemplo, establezca explícitamente todos los pesos de secuencia en 1.0.

--wdado
Utilice pesos de secuencia como se indica en la anotación en el archivo de alineación de entrada. Si no
se dieron los pesos, supongamos que todos son 1.0. El valor predeterminado es determinar nuevos
pesos de secuencia por el algoritmo de Gerstein / Sonnhammer / Chothia, ignorando cualquier
pesos anotados.

--wblosum
Utilice el algoritmo de filtrado BLOSUM para ponderar las secuencias, en lugar del predeterminado
Ponderación GSC. Agrupar las secuencias en un porcentaje de identidad dado (ver - ancho);
asignar a cada grupo un peso total de 1.0, distribuido equitativamente entre los miembros
de ese grupo.

--ancho
Controla el comportamiento del --wblosum Opción de ponderación estableciendo el porcentaje
identidad para agrupar la alineación a .

CAMPUS CONTROLADOR EFICAZ SECUENCIA NÚMERO


Una vez determinados los pesos relativos, se normalizan para sumar un total efectivo
secuencia de números, eff_nseq. Este número puede ser el número real de secuencias en el
alineación, pero casi siempre es más pequeña que eso. La ponderación de entropía predeterminada
Método (--ent) reduce el número de secuencia efectivo para reducir el contenido de la información
(entropía relativa o puntuación media esperada en homólogos verdaderos) por posición de consenso. los
La entropía relativa objetivo está controlada por una función de dos parámetros, donde los dos
los parámetros se pueden configurar con --antes de y --esigma.

--ente Utilice la estrategia de ponderación de entropía para determinar el número de secuencia efectivo que
da una entropía relativa del estado de coincidencia media objetivo. Esta opción es la predeterminada y
se puede apagar con --enona. El estado de concordancia media objetivo predeterminado relativo
la entropía es de 0.59 bits para modelos con al menos 1 par de bases y de 0.38 bits para modelos
con pares de bases cero, pero cambiado con --antes de. El valor predeterminado de 0.59 o 0.38 bits es
cambia automáticamente si la entropía relativa total del modelo (coincidencia sumada
entropía relativa del estado) es menor que un límite, que es de 6.0 bits por defecto, pero
se puede cambiar con el experto, indocumentado --ex opción. Si de verdad quieres
juega con esa opción, consulta el código fuente.

--enona
Desactive la estrategia de ponderación de entropía. El número de secuencia efectivo es solo el
número de secuencias en la alineación.

--antes de
Establezca la entropía relativa del estado de coincidencia media objetivo como . Por defecto el objetivo
La entropía relativa por posición de coincidencia es de 0.59 bits para modelos con al menos 1
par de bases y 0.38 para modelos con pares de bases cero.

--eminseq
Defina el número de secuencia efectivo mínimo permitido como .

--ehmmre
Establezca la entropía relativa del estado de coincidencia media de HMM objetivo como . Entropía para
los estados de coincidencia de pares de bases se calculan utilizando la emisión de pares de bases marginales
probabilidades.

--establecer
Establezca el número de secuencia efectivo para la ponderación de entropía como .

CAMPUS CONTROLADOR FILTRO P7 HMM CONSTRUCCIÓN


Por cada CM que cmconstruir construye, un filtro de acompañamiento p7 HMM se construye a partir de la entrada
alineación también. Estas opciones controlan la construcción del filtro HMM:

--p7ere
Establezca la entropía relativa del estado de coincidencia media objetivo para el filtro p7 HMM como . By
por defecto, la entropía relativa objetivo por posición de coincidencia es de 0.38 bits.

--p7ml Utilice un HMM de máxima probabilidad p7 construido a partir del CM como filtro HMM. Este HMM
Ser lo más similar posible al CM (aunque necesariamente ignorante de las
estructura).

Uso --devayuda para ver opciones adicionales de construcción de filtros HMM, que de otro modo no están documentadas.

CAMPUS CONTROLADOR FILTRO P7 HMM CALIBRACION


Después de construir cada filtro HMM, cmconstruir determina los parámetros de valor E apropiados para usar
durante el filtrado en cmbúsqueda y cmscan muestreando un conjunto de secuencias y buscándolas
con cada algoritmo y configuración de filtro HMM.

--EmN Establezca el número de secuencias muestreadas para la calibración del HMM del filtro MSV local en .
200 por defecto.

--EvN Establezca el número de secuencias muestreadas para la calibración HMM del filtro Viterbi local en
. 200 por defecto.

--ElfN Establezca el número de secuencias muestreadas para la calibración HMM del filtro directo local en
. 200 por defecto.

--EgfN Establezca el número de secuencias muestreadas para la calibración HMM del filtro directo glocal
a . 200 por defecto.

Uso --devayuda para ver opciones de calibración de filtros HMM adicionales, que de otro modo no están documentadas.

CAMPUS PARA REFINACIÓN EL REINO UNIDO ENTRADA ALINEACIÓN


--refinar
Intente refinar la alineación antes de construir el CM usando expectativa-
maximización (EM). Un CM se construye primero a partir de la alineación inicial como de costumbre. Luego,
las secuencias en la alineación se realinean de manera óptima (con el CYK con bandas HMM
algoritmo, óptimo significa óptimo dadas las bandas) al CM, y se construye un nuevo CM
de la alineación resultante. Las secuencias se realinean luego al nuevo CM, y un
el nuevo CM se construye a partir de esa alineación. Esto se continúa hasta la convergencia,
específicamente cuando las alineaciones para dos iteraciones sucesivas no son
significativamente diferente (las puntuaciones de bits sumadas de todas las secuencias en el
la alineación cambia menos del 1% entre dos iteraciones sucesivas). El final
alineación (la alineación utilizada para construir el CM que se escribe en ) is
escrito a .

-l Con --refinar, activar el algoritmo de alineación local, que permite que la alineación
abarcar dos o más subsecuencias si es necesario (por ejemplo, si las estructuras de la consulta
el modelo y la secuencia objetivo se comparten solo parcialmente), lo que permite ciertas
Las inserciones y eliminaciones en la estructura se penalizarán de manera diferente a lo normal.
indeles. El valor predeterminado es alinear globalmente el modelo de consulta con las secuencias de destino.

--gibbs
Modifica el comportamiento de --refinar por lo que se usa el muestreo de Gibbs en lugar de EM. los
La diferencia es que durante la etapa de alineación, la alineación no es necesariamente
óptimo, en su lugar, se muestrea una alineación (árbol de análisis) para cada secuencia a partir del
distribución posterior de alineaciones según lo determinado por el algoritmo Inside. Debido a
este paso de muestreo --gibbs no es determinista, por lo que diferentes ejecuciones con el mismo
la alineación puede producir resultados diferentes. Esto no es cierto cuando --refinar se utiliza
sin el --gibbs opción, en cuyo caso la alineación final y el CM siempre serán
lo mismo. Cuando --gibbs está habilitado, el --semilla La opción se puede utilizar para sembrar el
generador de números aleatorios de forma predecible, lo que hace que los resultados sean reproducibles. El objetivo de
las --gibbs La opción es ayudar a los curadores expertos en alineación de ARN a refinar la estructura
alineaciones permitiéndoles observar alineaciones alternativas de alta puntuación.

--semilla
Siembra el generador de números aleatorios con , un entero> = 0. Esta opción solo puede
ser utilizado en combinación con - Gibbs. If es diferente de cero, muestreo estocástico de
las alineaciones serán reproducibles; el mismo comando dará los mismos resultados. Si
es 0, el generador de números aleatorios se siembra arbitrariamente y el estocástico
los muestreos pueden variar de una ejecución a otra del mismo comando. La semilla predeterminada es 0.

--cyk Con --refinar, alinearse con el algoritmo CYK. Por defecto, la precisión óptima
se utiliza el algoritmo. Hay más información sobre esto en el cmalinear página de manual.

--notrunc
Con --refinar, apague el algoritmo de alineación truncado. Hay más
información sobre esto en el cmalinear página de manual.

Uso --devayuda para ver opciones de refinamiento de alineación adicionales, de otra manera no documentadas, como
así como otras opciones de archivo de salida y opciones para construir múltiples modelos para un solo
alineación.

Use cmbuild en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

  • 1
    OficinaPiso
    OficinaPiso
    OfficeFloor proporciona inversión de
    control de acoplamiento, con su: - dependencia
    inyección - inyección de continuación -
    inyección de hilo Para más información
    visita el...
    Descargar Office Floor
  • 2
    DivKit
    DivKit
    DivKit es un servidor de código abierto
    Marco de interfaz de usuario (SDUI). Te permite
    implementar actualizaciones provenientes del servidor para
    diferentes versiones de la aplicación. Además, puede ser
    usado para ...
    Descargar DivKit
  • 3
    subconvertidor
    subconvertidor
    Utilidad para convertir entre varios
    formato de suscripción. Usuarios de cohetes sombríos
    debe usar ss, ssr o v2ray como destino.
    Puede agregar &remark= a
    HT similar a Telegram...
    Descargar subconvertidor
  • 4
    CHAPOTEO
    CHAPOTEO
    SWASH es un numérico de propósito general
    herramienta para simular inestabilidad,
    no hidrostático, de superficie libre,
    fenómenos de transporte y flujo rotacional
    en aguas costeras como ...
    Descargar SWASH
  • 5
    VBA-M (Archivado - Ahora en Github)
    VBA-M (Archivado - Ahora en Github)
    El proyecto se ha trasladado a
    https://github.com/visualboyadvance-m/visualboyadvance-m
    caracteristicas:Creación de trucosguardar estadosmulti
    sistema, compatible con gba, gbc, gb, sgb,
    sgb2tu...
    Descargar VBA-M (Archivado - Ahora en Github)
  • 6
    Stacer
    Stacer
    Optimizador y monitorización del sistema Linux
    Repositorio de Github:
    https://github.com/oguzhaninan/Stacer.
    Público: Usuarios finales / Escritorio. Usuario
    interfaz: Qt. Programando La...
    Descargar Stacer
  • Más "

Comandos de Linux

Ad