AnglaisFrançaisAllemandItalienPortugaisRusseEspagnol

Icône de favori OnWorks

2ndscore - En ligne dans le Cloud

Exécutez 2ndscore dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande 2ndscore qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

PRÉNOM


2ndscore - trouvez la meilleure épingle à cheveux ancrée à chaque position.

SYNOPSIS


2ndscore in.fasta > out.hairpins

DESCRIPTION


Pour chaque position dans la séquence, cela produira une ligne :

-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(score) (début .. fin) (contexte gauche) (épingle) (contexte droit)

Pour les positions proches des extrémités des séquences, le contexte peut être complété par « x »
personnages. Si aucune épingle à cheveux ne peut être trouvée, le score sera « Aucun ».

Plusieurs fichiers fasta peuvent être fournis et plusieurs séquences peuvent être dans chaque fichier fasta. Les
la sortie pour chaque séquence sera séparée par une ligne commençant par '>' et contenant le
Description FASTA de la séquence.

Parce que les scores en épingle à cheveux du brin plus et du brin moins peuvent différer (en raison de GU
liaison dans l'ARN), par défaut, 2ndscore génère deux ensembles d'épingles à cheveux pour chaque séquence : le
Les épingles à cheveux VERS L'AVANT et les épingles à cheveux RETOURNÉES. Toutes les épingles à cheveux avant sont sorties en premier, et
sont identifiés par le mot « FORWARD » à la fin de la ligne « > » qui les précède.
De même, les épingles à cheveux REVERSE sont répertoriées après une ligne '>' se terminant par 'REVERSE'. Si tu
souhaitez rechercher uniquement l'un ou l'autre brin, vous pouvez utiliser :

--no-fwd Ne pas imprimer les épingles à cheveux FORWARD
--no-rvs Ne pas imprimer les épingles à cheveux REVERSE

Vous pouvez définir la fonction d'énergie utilisée, tout comme avec transterm avec --gc, --au, --gu,
--mm, --options d'écart. Les options --min-loop, --max-loop et --max-len sont également prises en charge.

FORMAT OF NOTRE .SAC DES DOSSIERS
Les colonnes des fichiers .bag sont, dans l'ordre :

1. nom_gène
2. terminateur_start
3. terminateur_fin
4. épingle_score
5. tail_score
6. terminateur_sequence

7. terminator_confidence : une combinaison du score en épingle à cheveux et en queue qui
prend en compte la probabilité que ces scores soient dans une séquence aléatoire. Cette
est le "score" principal pour le terminateur et est calculé comme décrit dans
le papier.

8. APPROXIMATE_distance_from_end_of_gene : Le nombre *approximatif* de base
paires entre la fin du gène et le début du terminateur. Cette
est approximatif à plusieurs égards : d'abord (et le plus important) TransTermHP
n'utilise pas toujours les vraies extrémités des gènes. Selon les options que vous donnez
il peut couper certaines extrémités des gènes pour gérer les terminateurs qui
chevauchent partiellement les gènes. Deuxièmement, où le terminateur "commence"
n'est pas si bien défini. Ce champ est destiné uniquement à un contrôle de cohérence
(les terminateurs signalés comme étant les meilleurs près des extrémités des gènes ne devraient pas être
_trop loin_ de la fin du gène).

EN UTILISANT TRANSTERME SANS GÉNOME ANNOTATION
TransTermHP n'utilise les informations génétiques connues que pour 3 choses : (1) étiqueter le putatif
terminateurs comme « gènes internes » ou « intergéniques », (2) en choisissant le fond GC-
pourcentage de contenu pour calculer les scores, car les gènes ont souvent un contenu GC différent
que les régions intergéniques, et (3) produisant une sortie légèrement plus lisible. Articles (1)
et (3) ne sont pas vraiment nécessaires, et (2) n'a aucun effet si vos gènes ont à peu près les mêmes
Contenu GC en tant que régions intergéniques.

Malheureusement, TransTermHP n'a pas encore d'option simple pour s'exécuter sans annotation
(soit .ptt ou .coords), et nécessite la présence d'au moins 2 gènes. La solution
est de créer de faux petits gènes qui flanquent chaque chromosome. Pour ce faire, créez un fake.coords
fichier qui ne contient que ces deux lignes :

fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id

où L est la longueur de la séquence d'entrée et L-1 est inférieur de 1 à la longueur de l'entrée
séquence. "chrom_id" doit être le mot qui suit directement le ">" dans le fichier .fasta
contenant votre séquence. (Si, par exemple, votre fichier .fasta commence par ">seq1", alors
chrom_id = seq1).

Cela crée une "fausse" annotation avec deux gènes longs d'une base flanquant la séquence dans un
disposition queue à queue : --> <--. TransTermHP peut alors être exécuté avec :

transterm -p expterm.dat sequence.fasta fake.coords

Si le contenu en G/C de vos régions intergéniques est à peu près le même que celui de vos gènes, alors cela
n'aura pas trop d'effet sur les scores que les terminateurs reçoivent. D'autre part,
cette utilisation de TransTermHP n'a pas été beaucoup testée, il est donc difficile de se porter garant de son
précision.

Utilisez 2ndscore en ligne en utilisant les services onworks.net


Ad


Ad

Derniers programmes en ligne Linux et Windows