emmae - Online en la nube

Este es el comando emmae que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


emma - Alineación de secuencia múltiple (contenedor ClustalW)

SINOPSIS


emma -secuencia Seqall [-sólo final palanca] -definir palanca -dendarchivo en archivo [-lento palanca]
-pwmatriz lista -pwdnamatrix lista -matriz de usuario variable -archivo de datos por pares en archivo
-matriz lista -usuariomatrix variable -dnamatriz lista -umamatriz variable
-archivomamatrix en archivo -pwgapopen flotar -pwgapextend flotar -ktup entero -brecha entero
-diags superiores entero -ventana entero -no por ciento booleano [-brecha flotar]
[-gape extender flotar] [-gaps booleano] [-gapdist entero] -norgap booleano
-hgapres cadena -nohgap booleano [-maxdiv entero] -outseq conjunto de secuencias
-dendoutfile archivar

emma -ayuda

DESCRIPCIÓN


emma es un programa de línea de comandos de EMBOSS (“el software abierto europeo de biología molecular
Suite"). Es parte del grupo (s) de comando "Alineación: Múltiple".

OPCIONES


Entrada .
-secuencia Seqall

-sólo final palanca
Valor predeterminado: N

-definir palanca
Valor predeterminado: N

-dendarchivo en archivo

-lento palanca
Se calcula una distancia entre cada par de secuencias y estas se utilizan para
Construya el dendrograma que guía la alineación múltiple final. Las puntuaciones son
calculado a partir de alineaciones separadas por pares. Estos se pueden calcular utilizando 2 métodos:
programación dinámica (lenta pero precisa) o por el método de Wilbur y Lipman
(extremadamente rápido pero aproximado). El método de precisión lenta está bien para secuencias cortas
pero será MUY LENTO para muchas (por ejemplo,> 100) secuencias largas (por ejemplo,> 1000 residuos).
Valor predeterminado: Y

Por parejas alinear opciones
-pwmatriz lista
La tabla de puntuación que describe la similitud de cada aminoácido entre sí.
Se ofrecen tres series de matrices de peso "integradas". Cada uno consta de varios
matrices que funcionan de manera diferente a diferentes distancias evolutivas. Para ver el exacto
detalles, lea la documentación. Básicamente, almacenamos varias matrices en la memoria,
que abarca todo el rango de la distancia de aminoácidos (desde secuencias casi idénticas hasta
muy divergentes). Para secuencias muy similares, es mejor usar un peso estricto
matriz que solo otorga una puntuación alta a las identidades y a los conservadores más favorecidos
sustituciones. Para secuencias más divergentes, es apropiado usar 'más suave'
matrices que dan una puntuación alta a muchas otras sustituciones frecuentes. 1) BLANCO
(Henikoff). Estas matrices parecen ser las mejores disponibles para realizar la base de datos.
similitud (búsquedas de homología). Las matrices utilizadas son: Blosum80, 62, 45 y 30. 2) PAM
(Día libre). Estos han sido muy utilizados desde finales de los años 70. Usamos el PAM
Matrices 120, 160, 250 y 350. 3) GONNET. Estas matrices se derivaron utilizando casi
el mismo procedimiento que el de Dayhoff (arriba) pero están mucho más actualizados y son
basado en un conjunto de datos mucho mayor. Parecen ser más sensibles que los Dayhoff.
serie. Usamos las matrices GONNET 40, 80, 120, 160, 250 y 350. También suministramos un
matriz de identidad que da una puntuación de 1.0 a dos aminoácidos idénticos y una puntuación de
cero en caso contrario. Esta matriz no es muy útil. Valor predeterminado: b

-pwdnamatrix lista
La tabla de puntuación que describe las puntuaciones asignadas a los partidos y los desajustes.
(incluidos los códigos de ambigüedad IUB). Valor predeterminado: i

-matriz de usuario variable

-archivo de datos por pares en archivo

Matrix opciones
-matriz lista
Esto proporciona un menú en el que se le ofrece una selección de matrices de peso. El predeterminado para
proteínas es la serie PAM derivada por Gonnet et al. Tenga en cuenta que se utiliza una serie.
La matriz real que se utiliza depende de cuán similares sean las secuencias a alinear en
este paso de alineación son. Diferentes matrices funcionan de manera diferente en cada evolución.
distancia. Se ofrecen tres series de matrices de peso "integradas". Cada uno consiste
de varias matrices que funcionan de manera diferente a diferentes distancias evolutivas. Para ver
los detalles exactos, lea la documentación. Básicamente, almacenamos varias matrices en
memoria, que abarca todo el rango de distancia de aminoácidos (desde casi idénticos
secuencias a las muy divergentes). Para secuencias muy similares, es mejor usar un
Matriz de peso estricta que solo otorga una puntuación alta a las identidades y a los más favorecidos.
sustituciones conservadoras. Para secuencias más divergentes, es apropiado utilizar
matrices 'más suaves' que dan una puntuación alta a muchas otras sustituciones frecuentes. 1)
BLOSUM (Henikoff). Estas matrices parecen ser las mejores disponibles para realizar
similitud de la base de datos (búsquedas de homología). Las matrices utilizadas son: Blosum80, 62, 45 y
30. 2) PAM (día libre). Estos han sido muy utilizados desde finales de los años 70. Nosotros
utilice las matrices PAM 120, 160, 250 y 350. 3) GONNET. Estas matrices se derivaron
usando casi el mismo procedimiento que el de Dayhoff (arriba) pero están mucho más a la altura
fecha y se basan en un conjunto de datos mucho mayor. Parecen ser más sensibles que los
Serie Dayhoff. Usamos las matrices GONNET 40, 80, 120, 160, 250 y 350. Nosotros también
proporcionar una matriz de identidad que da una puntuación de 1.0 a dos aminoácidos idénticos y
una puntuación de cero en caso contrario. Esta matriz no es muy útil. Alternativamente, puede leer
en la suya (solo una matriz, no una serie). Valor predeterminado: b

-usuariomatrix variable

-dnamatriz lista
Esto proporciona un menú donde se puede seleccionar una sola matriz (no una serie). Valor por defecto:
i

-umamatriz variable

-archivomamatrix en archivo

Beneficios adicionales .
Lenta alinear opciones
-pwgapopen flotar
La penalización por abrir una brecha en las alineaciones por pares. Valor predeterminado: 10.0

-pwgapextend flotar
La penalización por extender un espacio en 1 residuo en las alineaciones por pares. Defecto
valor: 0.1

Rápida alinear opciones
-ktup entero
Este es el tamaño del fragmento que coincide exactamente con el que se utiliza. AUMENTAR para la velocidad (máx. = 2
para proteínas; 4 para el ADN), DISMINUIR para la sensibilidad. Para secuencias más largas (por ejemplo,> 1000
residuos) es posible que deba aumentar el valor predeterminado. Valor predeterminado: @ ($ (acdprotein)? 1: 2)

-brecha entero
Esta es una penalización por cada espacio en las alineaciones rápidas. Tiene poco efecto en el
velocidad o sensibilidad excepto para valores extremos. Valor predeterminado: @ ($ (acdprotein)? 3: 5)

-diags superiores entero
El número de coincidencias de k-tuplas en cada diagonal (en una gráfica de matriz de puntos imaginaria) es
calculado. Solo los mejores (con la mayoría de coincidencias) se utilizan en la alineación. Esta
parámetro especifica cuántos. Disminuir por velocidad; aumentar la sensibilidad. Defecto
valor: @ ($ (acdprotein)? 5: 4)

-ventana entero
Este es el número de diagonales alrededor de cada una de las "mejores" diagonales que se utilizarán.
Disminuir por velocidad; aumentar la sensibilidad. Valor predeterminado: @ ($ (acdprotein)? 5: 4)

-no por ciento booleano
Valor predeterminado: N

Gap opciones
-brecha flotar
La penalización por abrir un hueco en la alineación. Aumento de la penalización de apertura de la brecha
hará que las lagunas sean menos frecuentes. Valor predeterminado: 10.0

-gape extender flotar
La penalización por ampliar un espacio en 1 residuo. Aumento de la penalización por extensión de la brecha
acortará los espacios. Los huecos terminales no se penalizan. Valor predeterminado: 5.0

-gaps booleano
Separación de la brecha final: trata las brechas finales como brechas internas con el propósito de
evitando espacios que están demasiado cerca (establecido por 'distancia de separación de espacios'). Si enciendes esto
desactivado, los huecos finales se ignorarán para este propósito. Esto es útil cuando desea alinear
fragmentos donde las brechas finales no son biológicamente significativas. Valor predeterminado: Y

-gapdist entero
Distancia de separación de espacios: intenta disminuir las posibilidades de que los espacios estén demasiado cerca de cada uno.
otro. Los espacios que están a menos de esta distancia se penalizan más que otros espacios.
Esto no evita las brechas cerradas; los hace menos frecuentes, promoviendo un bloque
apariencia de la alineación. Valor predeterminado: 8

-norgap booleano
Penalizaciones específicas por residuo: penalizaciones por brecha específica de aminoácidos que reducen o aumentan
las penalizaciones de apertura de hueco en cada posición en la alineación o secuencia. Como un
Por ejemplo, las posiciones que son ricas en glicina tienen más probabilidades de tener un espacio adyacente
que las posiciones ricas en valina. Valor predeterminado: N

-hgapres cadena
Este es un conjunto de residuos 'considerados' hidrófilos. Se usa cuando
introduciendo penalizaciones por huecos hidrofílicos. Valor predeterminado: GPSNDQEKR

-nohgap booleano
Penalizaciones por hueco hidrofílico: se utilizan para aumentar las posibilidades de un hueco dentro de una carrera (5 o
más residuos) de aminoácidos hidrófilos; es probable que sean de bucle o bobina aleatoria
regiones donde las brechas son más comunes. Los residuos que se 'consideran'
hidrofílicos se establecen mediante '-hgapres'. Valor predeterminado: N

-maxdiv entero
Este cambio retrasa la alineación de las secuencias relacionadas más lejanamente hasta después
se han alineado las secuencias más estrechamente relacionadas. La configuración muestra el porcentaje
nivel de identidad requerido para retrasar la adición de una secuencia; secuencias que son menos
idéntico que este nivel a cualquier otra secuencia se alineará más tarde. Valor por defecto:
30

Salida .
-outseq conjunto de secuencias

-dendoutfile archivar

Use emmae en línea usando los servicios de onworks.net



Últimos programas en línea de Linux y Windows