InglésFrancésEspañol

Ad


icono de página de OnWorks

2do puntaje

Ejecute 2ndscore en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando 2ndscore que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


2ndscore: encuentre la mejor horquilla anclada en cada posición.

SINOPSIS


2ndscore in.fasta> out.hairpins

DESCRIPCIÓN


Para cada posición en la secuencia, esto generará una línea:

-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(puntaje) (inicio .. fin) (contexto izquierdo) (horquilla) (contenido derecho)

Para posiciones cercanas al final de las secuencias, el contexto puede rellenarse con 'x'
caracteres. Si no se puede encontrar una horquilla, la puntuación será 'Ninguno'.

Se pueden proporcionar múltiples archivos fasta y múltiples secuencias en cada archivo fasta. los
La salida para cada secuencia estará separada por una línea que comienza con '>' y contiene el
Descripción FASTA de la secuencia.

Debido a que las puntuaciones de horquilla de la hebra positiva y negativa pueden diferir (debido a GU
vinculante en ARN), por defecto 2ndscore genera dos conjuntos de horquillas para cada secuencia: el
Horquillas FORWARD y las horquillas REVERSE. Todas las horquillas delanteras se imprimen primero, y
se identifican con la palabra 'FORWARD' al final de la línea '>' que los precede.
Del mismo modo, las horquillas REVERSE se enumeran después de una línea '>' que termina en 'REVERSE'. Si tu
desea buscar solo una u otra rama, puede usar:

--no-fwd No imprima las horquillas HACIA ADELANTE
--no-rvs No imprima las horquillas REVERSE

Puede configurar la función de energía utilizada, al igual que con transterm con --gc, --au, --gu,
--mm, --gap opciones. Las opciones --min-loop, --max-loop y --max-len también son compatibles.

FORMATO OF EL REINO UNIDO .BOLSO ARCHIVOS
Las columnas para los archivos .bag son, en orden:

1. nombre_gen
2. inicio_terminador
3. terminador_end
4. horquilla_puntaje
5. puntuación de cola
6. secuencia_terminador

7. terminator_confidence: una combinación de la horquilla y la puntuación final que
tiene en cuenta la probabilidad de que tales puntuaciones se encuentren en una secuencia aleatoria. Esta
es la "puntuación" principal del terminador y se calcula como se describe en
el papel.

8. APPROXIMATE_distance_from_end_of_gene: El * número aproximado * de base
pares entre el final del gen y el comienzo del terminador. Esta
es aproximado de varias maneras: Primero, (y más importante) TransTermHP
no siempre usa el gen real termina. Dependiendo de las opciones que le des
puede recortar algunos de los extremos de los genes para manejar terminadores que
se superponen parcialmente con los genes. En segundo lugar, donde "comienza" el terminador
no está tan bien definido. Este campo está destinado solo para una verificación de cordura
(los terminadores reportados como los mejores cerca de los extremos de los genes no deberían ser
_demasiado lejos_ del final del gen).

USO TRANSTERMINO SIN GENOMA ANOTACIONES
TransTermHP utiliza información genética conocida solo para 3 cosas: (1) etiquetar el putativo
terminadores como "genes internos" o "intergénicos", (2) eligiendo el fondo GC-
porcentaje de contenido para calcular las puntuaciones, porque los genes a menudo tienen diferente contenido de GC
que las regiones intergénicas, y (3) producir una salida ligeramente más legible. Objetos (1)
y (3) no son realmente necesarios, y (2) no tiene ningún efecto si sus genes tienen aproximadamente el mismo
Contenido de GC como sus regiones intergénicas.

Desafortunadamente, TransTermHP aún no tiene una opción simple para ejecutar sin una anotación
archivo (ya sea .ptt o .coords), y requiere al menos 2 genes para estar presentes. La solución
es crear genes pequeños y falsos que flanquean cada cromosoma. Para hacer esto, haz una falsificación.
archivo que contiene solo estas dos líneas:

fakegene1 1 2 chome_id
fakegene2 L-1 L crom_id

donde L es la longitud de la secuencia de entrada y L-1 es 1 menos que la longitud de la entrada
secuencia. "chrom_id" debe ser la palabra que sigue directamente a ">" en el archivo .fasta
que contiene su secuencia. (Si, por ejemplo, su archivo .fasta comienza con "> seq1", entonces
crom_id = seq1).

Esto crea una anotación "falsa" con dos genes de 1 base de longitud que flanquean la secuencia en un
Disposición de cola a cola: -> <-. TransTermHP se puede ejecutar con:

transterm -p expterm.dat secuencia.fasta fake.coords

Si el contenido de G / C de sus regiones intergénicas es aproximadamente el mismo que el de sus genes, entonces esto
no tendrá demasiado efecto en las puntuaciones que reciben los terminadores. Por otra parte,
este uso de TransTermHP no se ha probado mucho en absoluto, por lo que es difícil garantizar su
exactitud.

Utilice 2ndscore en línea utilizando los servicios de onworks.net


Ad