Este es el comando seqnre que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
seqnr: elimina la redundancia de los archivos DHF.
SINOPSIS
segundo -dhfinruta lista de direcciones -dosificación palanca -singletsdir directorio -dosis palanca
-insetsdir directorio [-matriz matrizf] -modo lista -trillar flotar Threshlow flotar
-trilla flotar [-brecha flotar] [-gape extender flotar] -dhfoutdir exterior dorado palanca
-redoutdir exterior -archivo de registro archivar
segundo -ayuda
DESCRIPCIÓN
segundo es un programa de línea de comandos de EMBOSS (“el software abierto europeo de biología molecular
Suite"). Es parte del (los) grupo (s) de comando "Utils: creación de base de datos".
OPCIONES
Entrada .
-dhfinruta lista de direcciones
Esta opción especifica la ubicación de los archivos DHF (archivos de aciertos de dominio) (entrada). Un dominio
archivo de hits 'contiene hits de base de datos (secuencias) con información de clasificación de dominio,
en el formato DHF (FASTA o EMBL-like). Los hits son parientes de un SCOP o CATH
familia y se encuentran a partir de una búsqueda en una base de datos de secuencias. Archivos que contienen hits
recuperados por PSIBLAST se generan utilizando SEQSEARCH. Valor por defecto: ./
-dosificación palanca
Esta opción especifica si se deben usar secuencias singlete (por ejemplo, archivos DHF) para filtrar
aporte. Opcionalmente, se pueden leer hasta dos directorios más de secuencias: estos son
considerados en el cálculo de redundancia pero nunca aparecen en los archivos de salida. Defecto
valor: Y
-singletsdir directorio
Esta opción especifica la ubicación de las secuencias de filtro singlete (por ejemplo, archivos DHF)
(aporte). Un 'archivo de hits de dominio' contiene hits de base de datos (secuencias) con dominio
información de clasificación, en formato DHF (FASTA o EMBL-like). Los golpes son
parientes de una familia SCOP o CATH y se encuentran a partir de una búsqueda en una base de datos de secuencias.
Los archivos que contienen hits recuperados por PSIBLAST se generan mediante SEQSEARCH. Defecto
valor: ./
-dosis palanca
Esta opción especifica si se deben usar conjuntos de secuencias (por ejemplo, archivos DHF) para filtrar
aporte. Opcionalmente, se pueden leer hasta dos directorios más de secuencias: estos son
considerados en el cálculo de redundancia pero nunca aparecen en los archivos de salida. Defecto
valor: Y
-insetsdir directorio
Esta opción especifica la ubicación de conjuntos de secuencias de filtros (por ejemplo, archivos DAF) (entrada). A
'archivo de alineación de dominio' contiene una secuencia de alineación de dominios que pertenecen al mismo
Familia SCOP o CATH. El archivo está en formato de clúster anotado con la familia de dominio.
información de clasificación. Los archivos generados mediante el uso de SCOPALIGN contendrán un
alineación de secuencias basada en la estructura de dominios de estructura conocida únicamente. Tales alineaciones
se puede ampliar con parientes de secuencia (de estructura desconocida) utilizando SEQALIGN.
Valor por defecto: ./
-matriz matrizf
Esta opción especifica la matriz de sustitución de residuos que se utiliza para la secuencia
comparación. Valor predeterminado: EBLOSUM62
Requerido .
-modo lista
Esta opción especifica si eliminar la redundancia en una secuencia de% de umbral único
similitud o eliminar la redundancia fuera de un rango de umbral aceptable% de similitud.
Todas las permutaciones de alineaciones de secuencia por pares se calculan para cada conjunto de entrada
sucesivamente utilizando la implementación EMBOSS de Needleman y Wunsch global
algoritmo de alineación. Las secuencias redundantes se eliminan en uno de los dos modos siguientes:
(i) Si un par de proteínas alcanza una secuencia porcentual superior a un umbral
similitud (especificada por el usuario) se descarta la secuencia más corta. (ii) Si un par
de las proteínas tienen un porcentaje de similitud de secuencia que se encuentra fuera de un nivel aceptable
rango (especificado por el usuario) se descarta la secuencia más corta. Valor predeterminado: 1
-trillar flotar
Esta opción especifica el umbral de redundancia de identidad de secuencia%. La secuencia
El umbral de redundancia de identidad determina el cálculo de la redundancia. Si un par de
las proteínas alcanzan un valor superior a este umbral, se descarta la secuencia más corta.
Valor predeterminado: 95.0
Threshlow flotar
Esta opción especifica el umbral de redundancia de identidad de secuencia% (límite inferior). los
El umbral de redundancia de identidad de secuencia% determina el cálculo de redundancia. Si un
par de proteínas tienen un porcentaje de similitud de secuencia que se encuentra fuera de un aceptable
rango se descarta la secuencia más corta. Valor predeterminado: 30.0
-trilla flotar
Esta opción especifica el umbral de redundancia de identidad de secuencia% (límite superior). los
El umbral de redundancia de identidad de secuencia% determina el cálculo de redundancia. Si un
par de proteínas tienen un porcentaje de similitud de secuencia que se encuentra fuera de un aceptable
rango se descarta la secuencia más corta. Valor predeterminado: 90.0
Beneficios adicionales .
-brecha flotar
Esta opción especifica la penalización por inserción de espacios. La penalización por inserción de espacios es la
puntuación quitada cuando se crea una brecha. El mejor valor depende de la elección de
matriz de comparación. El valor predeterminado asume que está utilizando la matriz EBLOSUM62 para
secuencias de proteínas y la matriz EDNAFULL para secuencias de nucleótidos. Valor predeterminado: 10
-gape extender flotar
Esta opción especifica la penalización por extensión del espacio. La extensión de la brecha, se agrega penalización
a la penalización por espacio estándar para cada base o residuo en el espacio. Este es el tiempo de las brechas
son penalizados. Por lo general, esperará algunos espacios largos en lugar de muchos espacios cortos, por lo que
la penalización por extensión del hueco debe ser menor que la penalización por hueco. Valor predeterminado: 0.5
Salida .
-dhfoutdir exterior
Esta opción especifica la ubicación de los archivos DHF (archivos de aciertos de dominio) de
secuencias (salida). Un 'archivo de hits de dominio' contiene hits de base de datos (secuencias) con
información de clasificación de dominio, en el formato DHF (FASTA o EMBL-like). los golpes
son parientes de una familia SCOP o CATH y se encuentran a partir de una búsqueda de una secuencia
base de datos. Los archivos que contienen hits recuperados por PSIBLAST se generan usando
SEQSEARCH. Valor por defecto: ./
dorado palanca
Esta opción especifica si se deben retener secuencias redundantes. Si esta opción está configurada
Se escribe el archivo DHF (archivo de aciertos de dominio) de secuencias redundantes. Valor predeterminado: N
-redoutdir exterior
Esta opción especifica la ubicación de los archivos DHF (archivos de aciertos de dominio) de redundante.
secuencias (salida). Un 'archivo de hits de dominio' contiene hits de base de datos (secuencias) con
información de clasificación de dominio, en el formato DHF (FASTA o EMBL-like). los golpes
son parientes de una familia SCOP o CATH y se encuentran a partir de una búsqueda de una secuencia
base de datos. Los archivos que contienen hits recuperados por PSIBLAST se generan usando
SEQSEARCH. Valor por defecto: ./
-archivo de registro archivar
Esta opción especifica el nombre del archivo de registro SEQNR (salida). El archivo de registro contiene
mensajes sobre cualquier error que surja durante la ejecución de SEQNR. Valor predeterminado: seqnr.log
Use seqnre en línea usando los servicios de onworks.net
