GoGPT Best VPN GoSearch

icono de página de OnWorks

exonerar - Online en la nube

Ejecute exonerate en el proveedor de alojamiento gratuito de OnWorks a través de Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando exonerate que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


exonerar - una herramienta genérica para la comparación de secuencias

SINOPSIS


exonerar [ opciones ] <consulta camino> <objetivo camino>

DESCRIPCIÓN


exonerar es una herramienta general para la comparación de secuencias.

Utiliza el C4 biblioteca de programación dinámica. Está diseñado para ser tanto general como rápido.
Puede producir alineaciones con o sin espacios, de acuerdo con una variedad de diferentes
modelos de alineación. La biblioteca C4 permite la alineación de secuencias utilizando un espacio reducido completo
implementación de programación dinámica, pero también permite la generación automatizada de heurísticas
de los modelos de alineación, utilizando programación dinámica escasa limitada, de modo que estos
Las alineaciones también pueden generarse rápidamente. Alineaciones generadas con estas heurísticas
representará una ruta válida a través del modelo de alineación, sin embargo (a diferencia del exhaustivo
alineaciones), no se garantiza que los resultados sean óptimos.

Convenciones


Una serie de convenciones (e idiosincrasias) se utilizan dentro de exonerar. Una comprensión
de ellos facilita la interpretación de la salida.

Coordenadas
Se utiliza un sistema de coordenadas intermedio, donde las posiciones se cuentan entre
los símbolos, en lugar de en los símbolos. Este esquema de numeración comienza desde cero.
Esta numeración se muestra a continuación para la secuencia "ACGT":

ACGT
+0 1 2 3 4

Por lo tanto, la subsecuencia "CG" tendría inicio = 1, fin = 3 y longitud = 2. Esta
El sistema de coordenadas se utiliza internamente en exonerar y para todos los formatos de salida.
producido con la excepción de la pantalla de alineación "legible por humanos" y el GFF
salida donde la convención y los estándares dictan lo contrario.

Marcha atrás Complementos
Cuando se informa una alineación en el complemento inverso de una secuencia, el
las coordenadas simplemente se dan en la copia en complemento inverso de la secuencia. Por eso
las posiciones en las secuencias nunca son negativas. Generalmente, la hebra delantera es
indicado por '+', la hebra inversa por '-', y una incógnita o no aplicable
hebra (como en el caso de una secuencia de proteína) se indica con '.'

Alineación: Partituras
Actualmente, solo se muestran las puntuaciones de alineación sin procesar. Esta puntuación es solo la suma
de las puntuaciones de transición utilizadas en la programación dinámica. Por ejemplo, en el caso de
una alineación de Smith-Waterman, será la suma de las puntuaciones de la matriz de sustitución
y las penalizaciones por brecha.

GENERAL OPCIONES


La mayoría de los argumentos tienen formas cortas y largas. Las formas largas
tienen más probabilidades de ser estables en el tiempo y, por lo tanto, deben usarse en scripts que
llamar exonerar.

-h | - ayuda breve
Mostrar ayuda. Esto mostrará un resumen conciso de las opciones disponibles, valores predeterminados
y valores establecidos actualmente.

--ayuda
Esto muestra todas las opciones de ayuda, incluidos los valores predeterminados, el valor establecido actualmente,
y la variable de entorno que se puede utilizar para establecer cada parámetro. Habrá
ser una indicación de qué opciones son obligatorias. Las opciones obligatorias no tienen
predeterminado y debe tener un valor proporcionado para que exonerar se ejecute. Si las opciones obligatorias
se utilizan en orden, sus banderas pueden omitirse de la línea de comando (ver ejemplos
debajo). A diferencia de esta página de manual, la información de esta opción siempre estará activa
al día con la última versión del programa.

-v | --versión
Muestra el número de versión. También muestra otra información como la fecha de construcción.
y versión simplificada utilizada.

SECUENCIA ENTRADA OPCIONES


Se realizarán comparaciones por pares entre todas las secuencias de consulta y todos los objetivos
secuencias. Generalmente, para obtener el mejor rendimiento, secuencias más cortas (p. Ej., Tecnologías ecológicamente racionales, escopeta
lecturas, proteínas) deben usarse como secuencias de consulta, y secuencias más largas (por ejemplo, genomic
secuencias) deben utilizarse como secuencias diana.

-q | --consulta
Especifique las secuencias de consulta necesarias. Estos deben estar en un archivo de formato FASTA.
Se pueden suministrar secuencias de consulta únicas o múltiples. Además, varias copias
del archivo fasta se puede suministrar siguiendo un indicador --query, o usando con
múltiples banderas de consulta.

-t | --objetivo
Especifique las secuencias de destino necesarias. Además, debe estar en un archivo de formato FASTA. Como
con las secuencias de consulta, las secuencias y archivos de destino únicos o múltiples pueden ser
suministrado. NUEVO: el nombre del archivo de destino puede reemplazarse por un nombre de servidor y un número de puerto
en forma de nombre de host: puerto cuando se utiliza exonerar al servidor. Consulte la página de manual para
exonerar al servidor para obtener más información sobre cómo ejecutar exonerate en modo cliente: servidor.

-Q | --Tipo de consulta <adn | proteína>
Especifique el tipo de consulta que se utilizará. Si no se proporciona, se asume el tipo de consulta
ser ADN cuando la primera secuencia del archivo contiene más del 85% de bases [ACGTN].
De lo contrario, se supone que es un péptido. Esta opción fuerza el tipo de consulta como algunos
Las secuencias de nucleótidos y péptidos pueden caer a ambos lados de este umbral.

-T | --tipo de objetivo <adn | proteína>
Especifique el tipo de destino que se utilizará. Lo mismo que --Tipo de consulta (arriba), excepto que
se aplica al objetivo. Especificar el tipo de secuencia evitará la sobrecarga de
tener que leer la primera secuencia en la base de datos dos veces (lo que puede ser significativo
con secuencias del tamaño de un cromosoma)

--querychunkid

--querychunktotal

--objetivochunkid

--targetchunktotal
Estas opciones para facilitar la ejecución de exoneración en granjas de cómputo y evitar tener que
Divida las bases de datos de secuencias en pequeños fragmentos para ejecutarlas en diferentes nodos. Si por
Por ejemplo, desea dividir la base de datos de destino en tres partes, debe ejecutar
tres trabajos de exoneración en diferentes nodos, incluidas las opciones:

--targetchunkid 1 --targetchunktotal 3
--targetchunkid 2 --targetchunktotal 3
--targetchunkid 3 --targetchunktotal 3
NÓTESE BIEN. La granularidad que ofrece esta opción solo se reduce a una única secuencia, por lo que
cuando hay más fragmentos que secuencias en la base de datos, algunos procesos funcionarán
nada.

-V | --verboso
Sea detallado: muestre información sobre lo que está sucediendo durante el análisis. los
el valor predeterminado es 1 (poca información), cuanto mayor sea el número dado, más
se imprime la información. Para silenciar toda la salida predeterminada de exonerar, use
--verbose 0 --showalignment no --showvulgar no

ANÁLISIS OPCIONES


-E | --exhaustivo
Especifique si se debe utilizar o no una alineación exhaustiva. Por defecto, esto es
FALSO y se utilizarán heurísticas de alineación. Si se establece en TRUE, un exhaustivo
se calculará la alineación. Esto requiere tiempo cuadrático y será mucho, mucho
más lento, pero proporcionará el resultado óptimo para el modelo dado.
-B | --bigseq
Realice la alineación de secuencias grandes (multimegabase). Esto es muy recuerdo
eficiente y rápido cuando ambas secuencias tienen el tamaño de un cromosoma, pero actualmente no
actualmente permiten el uso de una palabra vecindario (es decir, solo semillas que coincidan exactamente).
--forcescan <ninguno | pregunta | objetivo>
Obligue al FSM a escanear la secuencia de consulta en lugar del objetivo. Esta opcion es
útil, por ejemplo, si tiene una sola pieza de secuencia genómica y tiene que
compárelo con todo el dbEST. Al escanear la base de datos, en lugar de la consulta,
el análisis se completará mucho más rápidamente, ya que los gastos generales de múltiples
La construcción de consultas FSM, la lectura de múltiples objetivos y las predicciones del sitio de empalme serán
remoto. De forma predeterminada, exonerar adivinará la estrategia óptima basada en la base de datos
tamaños de secuencia.
- umbral de saturación
Cuando se establece en cero, esta opción no hace nada. De lo contrario, una vez más que este número
de palabras (además del número esperado de palabras por casualidad) han coincidido
posición en la consulta, la posición en la consulta será 'insensible' (ignore más
coincidencias) para la comparación actual por pares.
--servidor personalizado
NUEVO: Cuando se utiliza exonerar en modo cliente: servidor con un servidor no estándar, esto
comando le permite enviar un comando personalizado al servidor. Este comando es enviado por
el cliente (exonerar) antes que cualquier otro comando, y se proporciona como una forma de
pasando parámetros u otros comandos específicos del servidor personalizado. Ver el
exonerar al servidor página de manual para obtener más información sobre la ejecución de exonerar en
cliente: modo servidor.

RÁPIDO BASE DE DATOS OPCIONES


--fastasuffix
Si alguna de las entradas dadas con --consulta or --objetivo son directorios, luego exonerar
descenderá recursivamente estos directorios, leyendo todos los archivos que terminan con este
sufijo como entrada de formato fasta.

ABANDONADO ALINEACIÓN OPCIONES


-m | --modelo <alineación modelo>
Especifique el modelo de alineación que se utilizará. Los modelos actualmente admitidos son:
sin huecos
El tipo de modelo más simple, utilizado por defecto. Un modelo apropiado con ser
seleccionado automáticamente para el tipo de secuencias de entrada proporcionadas.
ungapped: trans
Este modelo sin espacios incluye la traducción de todos los marcos de la consulta y
secuencias de destino. Esto es similar a una búsqueda de tipo tblastx sin espacios.
afín: global
Esto realiza una alineación global con huecos, similar a Needleman-Wunsch
algoritmo, excepto con brechas afines. La alineación global requiere que tanto el
las secuencias en su totalidad están incluidas en la alineación.
afín: bestfit
Esto realiza un mejor ajuste o una mejor alineación de ubicación de la consulta en el
secuencia de destino. La secuencia de consulta completa se incluirá en el
alineación, pero solo la mejor ubicación para su alineación en el objetivo
secuencia.
afín: local
Esta es una alineación local con brechas afines, similar a la de Smith-Waterman-
Algoritmo Gotoh. Un algoritmo de alineación de propósito general. Como esto es local
alineación, cualquier subsecuencia de la consulta y la secuencia objetivo puede aparecer en
la alineación.
afín: superposición
Este tipo de alineación encuentra la mejor superposición entre la consulta y el objetivo.
La alineación de superposición debe incluir el inicio de la consulta o el objetivo y el
final de la consulta o la secuencia objetivo, para alinear las secuencias que se superponen en
los extremos, o en la sección media de una secuencia más larga. Este es el tipo de
alineación de uso frecuente en algoritmos de ensamblaje.
est2genoma
Este modelo es similar al modelo afín: local, pero también incluye intrón
modelado en la secuencia de destino para permitir la alineación de empalmado a sin empalmar
secuencias codificantes para genes tanto directos como inversos. Esto es similar a
los modelos de alineación utilizados en programas como EST_GENOME y sim4.
ner Los NER son regiones no equivalentes: regiones grandes tanto en la consulta como en
objetivo que no están alineados. Este modelo se puede utilizar para alineaciones de proteínas.
donde las regiones de hélice fuertemente conservadas se alinearán, pero se conservarán débilmente
las regiones de bucle no lo son. De manera similar, este modelo podría usarse para buscar co-
regiones conservadas linealmente en comparación con secuencias genómicas.
proteína2dna
Este modelo compara una secuencia de proteína con una secuencia de ADN, incorporando todos
los espacios y cambios de marco apropiados.
protein2dna: bestfit
NUEVO: Ésta es una versión bestfit del modelo protein2dna, con la que el
la proteína completa está incluida en la alineación. Actualmente solo está disponible
cuando se utiliza una alineación exhaustiva.
proteína2genoma
Este modelo permite la alineación de una secuencia de proteínas con el ADN genómico. Este es
similar al modelo de protein2dna, con la adición de modelado de intrones
y fases de intrones. Este modelo es similar a los utilizados por genewise.
protein2genome: bestfit
NUEVO: Ésta es una versión bestfit del modelo protein2genome, con la que
la proteína completa está incluida en la alineación. Actualmente solo está disponible
cuando se utiliza una alineación exhaustiva.
codificación
Este modelo es similar al modelo sin huecos: trans, excepto que los huecos y
Se permiten cambios de fotograma. Es similar a una búsqueda tblastx con huecos.
codificación2genoma
Esto es similar al modelo est2genome, excepto que la secuencia de consulta es
traducido durante la comparación, lo que permite una comparación más sensible.
cdna2genoma
Esto combina propiedades de los modelos est2genome y coding2genome, para
Permitir el modelado de un ADNc completo donde se puede flanquear una región codificante central
por UTR no codificantes. Cuando se conoce el inicio y el final del CDS, se puede especificar
usando la opción --annotation (ver más abajo) para permitir solo la codificación correcta
región para aparecer en el alineamiento.
genoma2genoma
Este modelo es similar al modelo coding2coding, excepto que los intrones son
modelado en ambas secuencias. (aún no funciona bien)

Los nombres cortos u, u: t, a: g, a: b, a: l, a: o, e2g, ner,
p2d, p2d: b p2g, p2g: b, c2c, c2g cd2g y g2g también se pueden utilizar para especificar
.

-s | --puntaje
Este es el umbral de puntuación general. Las alineaciones no se informarán debajo de este
umbral. Para las alineaciones heurísticas, cuanto más alto es este umbral, menos tiempo
el análisis tomará.

--por ciento
Informe solo las alineaciones que puntúen al menos este porcentaje de la puntuación máxima para
cada consulta. p.ej. usar --por ciento 90 para informar alineaciones con el 90% de la máxima
puntuación optable para esa consulta. Esta opción es útil no solo porque reduce
las coincidencias espurias en la salida, sino porque genera consultas específicas
umbrales (a diferencia de --puntaje ) para un conjunto de consultas de diferente longitud, y
También acelera considerablemente la búsqueda. NB. con esta opción, es posible
tienen un ADNc que coincide exactamente con su gen correspondiente, pero aún así obtienen una puntuación inferior al 100%,
debido a la adición de las puntuaciones de penalización del intrón, por lo tanto, esta opción debe usarse
con cuidado.

--alineación
Muestre las alineaciones en una forma legible por humanos.

--mostrar azúcar
Muestra la salida de "azúcar" para alineaciones sin huecos. El azúcar es una alineación simple sin huecos
Informe, que muestra alineaciones sin huecos una por línea. Comienza la línea de azúcar
con la cadena "azúcar:" para una fácil extracción de la salida, seguida de
los siguientes 9 campos en el orden siguiente:

consulta_id Identificador de consulta
inicio_consulta Posición de la consulta al inicio de la alineación
consulta_fin Fin de alineación de posición de consulta
consulta_hebra Hebra de consulta coincidente
ID_objetivo |
inicio_objetivo | los mismos 4 campos
objetivo_end | para la secuencia objetivo
hilo_objetivo |
Puntuación La puntuación de alineación sin procesar

--showcigar
Muestre las alineaciones en formato "puro". El cigarro es un hueco idiosincrásico compacto
Informe de alineación, que muestra alineaciones separadas una por línea. El formato comienza
con los mismos 9 campos que la producción de azúcar (ver arriba), y es seguido por una serie de
pares donde la operación es una de coincidencia, inserción o eliminación, y
la longitud describe el número de veces que se repite esta operación.

--showvulgar
Muestra las alineaciones en formato "vulgar". Lo vulgar es detallado, útil etiquetado con espacios
Informe de alineación, este formato también comienza con los mismos 9 campos que la salida de azúcar
(ver arriba), y es seguido por una serie de
trillizos. La etiqueta puede ser una de las siguientes:

M Match
C Codón
G Gap
N Región no equivalente
5 Sitio de empalme de 5 '
3 Sitio de empalme de 3 '
I Intrón
S Codón partido
F Cambio de cuadro

--showquerygff
Informe la salida de GFF para las características de la secuencia de consulta. Ver
http://www.sanger.ac.uk/Software/formats/GFF para obtener más información. Línea cuenta con opciones en español.

--showtargetgff
Informe la salida de GFF para las características de la secuencia de destino.

--ryo
Formato de salida roll-your-own. Esto permite la especificación de un formato printf-esque
línea que se utiliza para especificar qué información incluir en la salida y cómo
se va a mostrar. El campo de formato puede contener los siguientes campos:

% [qt] [idlsSt]
Para {consulta, destino}, informe el
{id, definición, longitud, secuencia, hebra, tipo} Las secuencias se informan en un
formato fasta como bloque (sin encabezados).
% [qt] a [bels]
Para cualquier {consulta, destino} región que ocurre in la alineación, informar el
{inicio, fin, duración, secuencia}
% [qt] c [bels]
Para la región {consulta, destino} que se produce en el codificación secuencia en la sección de
alineación, informe el {inicio, final, longitud, secuencia}
%s La puntuación bruta
%r El rango (en los resultados de una búsqueda bestn)
%m Nombre del modelo
% e [tismo]
Equivalente {total, id, similitud, desajustes} (es decir,% em == (% et -% ei))
% p [es] Porcentaje {id, similitud} sobre las porciones equivalentes de la alineación.
(es decir,% pi == 100 * (% ei /% et))
%g Orientación genética ('+' = hacia adelante, '-' = hacia atrás, '.' = Desconocido)
%S Bloque de azúcar (los 9 campos utilizados en la producción de azúcar (ver arriba)
%C Bloque de puros (los campos de una línea de puros después de la porción de azúcar)
%V Bloque vulgar (los campos de una línea vulgar después de la porción de azúcar)
%% Se expande a un signo de porcentaje (%)
\n Nueva línea
\t Pestaña
\\ Se expande a una barra invertida (\)
\{ Abrazadera rizada
\} Cierre rizado corsé
{ Comenzar la sección de salida por transición
} Finalizar sección de salida por transición
% P [qt] [sabe]
Salida por transición para {consulta, destino} {secuencia, avance, comienzo, finalización}
% P [nsl]
Salida por transición para {nombre, puntuación, etiqueta}

Esta opción es muy útil y flexible. Por ejemplo, para informar todas las secciones de la consulta
secuencias que aparecen en alineaciones en formato fasta, use:

--ryo ">% qi % qd \ n% qas \ n "

Para generar todos los símbolos y puntuaciones en una alineación, intente algo como:

--ryo "% V {% Pqs % Ptos % Ps \ n} "

-n | --mejor
Informe los mejores N resultados para cada consulta. (Solo los resultados obtienen mejores resultados que los
umbral de puntuación
será informado). La opción reduce la cantidad de salida generada y también
permite exonerar para acelerar la búsqueda.

-S | --suboptar
Esta opción permite el informe de (estilo Waterman-Eggert) subóptimo
alineaciones. (Está activado de forma predeterminada). Todo subóptimo (es decir, sin intersección)
Las alineaciones se informarán para cada par de secuencias puntuando al menos el
umbral proporcionado por --puntaje.

Cuando esta opción se usa con alineaciones exhaustivas, varios tiempos cuadráticos completos
Se requerirán pases, por lo que el tiempo de ejecución aumentará considerablemente.

-g | --extensión abierta
Provoca que se realice una etapa de extensión con huecos, es decir. se aplica programación dinámica
en regiones de forma arbitraria y de tamaño dinámico que rodean las semillas de HSP. los
el umbral de extensión está controlado por la opción --extensionthreshold.

Aunque a veces es más lento que BSDP, la extensión con huecos mejora la sensibilidad con
alineaciones débiles, ricas en huecos, como durante la comparación entre especies.

NB. Este opción is ahora la predeterminada. Establezca it a false para revertir al antiguo tipo BSDP
alineaciones. Esta opción puede ser más lenta que BSDP para algunos análisis a gran escala con
modelos de alineación simples.

--refinar
Forzar exoneración para refinar las alineaciones generadas por la heurística utilizando dinámica
programación en regiones más grandes. Esto lleva más tiempo, pero mejora la calidad de
las alineaciones finales.

Las estrategias disponibles para el refinamiento son:

ninguna El valor predeterminado: no se usa ningún refinamiento.
ser completados Se calcula una alineación exhaustiva a partir del par de secuencias en su
totalidad.
región DP se aplica solo a la región de las secuencias cubiertas por la heurística
alineación.

--refinarlímite
Especifique un límite adicional que se incluirá en la región sujeta a alineación durante
refinamiento por región.

VITERBI ALGORITMO OPCIONES


-D | --dpmemoria
Las exhaustivas rutinas de rastreo de alineación utilizan una memoria reducida al estilo Hughey
técnica. Esta opción especifica cuánta memoria se utilizará para esto.
Por lo general, cuanta más memoria se permita aquí, más rápidas serán las alineaciones.
producido.

CÓDIGO GENERACION OPCIONES


-C | - recopilado
Esta opción permite deshabilitar el código generado para la programación dinámica. Está
Se utiliza principalmente durante el desarrollo de exonerar. Cuando se establece en FALSE, un "interpretado"
Se utiliza la versión de la implementación de programación dinámica, que es mucho más lenta.

HEURÍSTICO OPCIONES


--terminalrangeint
--terminalrangeext
--unirrangeint
--joinrangeext
--spanrangeint
--spanrangeext
Estas opciones se utilizan para especificar el tamaño de las regiones de subalineación a las que DP
se aplica alrededor de los extremos de las PAS. Esto puede ser en los extremos HSP (terminal
rango), entre HSP (rango de unión), o entre HSP que pueden estar conectados por un
región grande, como un intrón o una región no equivalente (intervalo de extensión). Estas
los rangos se pueden especificar para una serie de coincidencias en el HSP (rango interno)
o fuera del HSP (rango externo).

Utilice exoneración en línea utilizando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad




×
Anuncio
❤ ️Compre, reserve o adquiera aquí: sin costo, ayuda a mantener los servicios gratuitos.