Il s'agit du mélange de commandes qui peut être exécuté dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos nombreux postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.
PROGRAMME:
Nom
shuffle - randomiser les séquences dans un fichier de séquence
SYNOPSIS
Shuffle [choix] fichier seq
DESCRIPTION
Shuffle lit un fichier de séquence fichier seq, randomise chaque séquence et imprime la séquence randomisée
séquences au format FASTA sur la sortie standard. Les noms des séquences restent inchangés ; ceci
permet de retrouver la source de chaque séquence randomisée si nécessaire.
La valeur par défaut consiste à simplement mélanger chaque séquence d'entrée, en préservant la composition monosymbole
exactement. Pour mélanger chaque séquence tout en préservant son monosymbole et son disysymbole
composition exactement, utilisez le -d option.
La fonction -0 et -1 les options vous permettent de générer des séquences avec les mêmes propriétés de Markov que
chaque séquence d'entrée. Avec -0, pour chaque séquence d'entrée, les statistiques de Markov d'ordre 0 sont
collectées (par exemple, composition de symboles), et une nouvelle séquence est générée avec le même
composition. Avec -1, la séquence générée a les mêmes propriétés de Markov du premier ordre que
la séquence d'entrée (par exemple les mêmes fréquences de disymogèle).
Notez que la valeur par défaut et -0, or -d et -1, sont similaires ; les algorithmes de mélange préservent
composition exactement, tandis que les algorithmes de Markov s'attendent seulement à générer une séquence de
composition similaire en moyenne.
D'autres algorithmes de mélange sont également disponibles, comme documenté ci-dessous dans les options.
OPTIONS
-0 Calculer les fréquences de Markov d'ordre 0 de chaque séquence d'entrée (par exemple, résidu
composition) ; générer une séquence de sortie en utilisant les mêmes fréquences de Markov d'ordre 0.
-1 Calculer les fréquences de Markov du 1er ordre pour chaque séquence d'entrée (par exemple, directe)
composition) ; générer une séquence de sortie en utilisant les mêmes fréquences de Markov du 1er ordre.
Le premier résidu de la séquence de sortie est toujours le même que le premier résidu de
la séquence d'entrée.
-d Mélangez la séquence d'entrée tout en préservant à la fois le monosymbole et le disysymbole
composition exacte. Utilise un algorithme publié par SF Altschul et BW
Erickson, Mol. Biol. Evol. 2:526-538, 1985.
-h Imprimer une brève aide ; inclut le numéro de version et un résumé de toutes les options, y compris
options d'experts.
-l Regardez uniquement la longueur de chaque séquence d'entrée ; générez une protéine de sortie iid
séquence de cette longueur, en utilisant des fréquences de monorésidus typiques des protéines (prises
de Swissprot 35).
-n Marque différentes randomisations de chaque séquence d'entrée dans fichier seq, plutôt que
la valeur par défaut d'un.
-r Générer la séquence de sortie en inversant la séquence d'entrée. (Par conséquent, une seule
La « randomisation » par séquence d'entrée est possible, elle ne vaut donc pas la peine d'être utilisée -n si tu
utiliser l'inversion.)
-t Tronquer chaque séquence d'entrée à une longueur fixe d'exactement résidus. Si le
la séquence d'entrée est plus courte que il est rejeté (le fichier de sortie peut donc
contient moins de séquences que le fichier d'entrée). Si la séquence d'entrée est plus longue que
une sous-séquence contiguë est choisie au hasard.
-w Mélangez régionalement chaque séquence d'entrée dans des tailles de fenêtre de , préserver le local
composition des résidus dans chaque fenêtre. Un algorithme de brassage serait probablement plus adapté
bioséquences avec une composition de résidus non stationnaire (par exemple, une composition qui est
variant le long de la séquence, comme entre différents isochores du génome humain
séquence).
-B (Babelfish). Détection automatique et lecture d'un format de fichier de séquence autre que celui par défaut
(FASTA). Presque tous les formats de fichiers de séquence courants sont reconnus (y compris Genbank,
Formats de séquences non alignées EMBL, SWISS-PROT, PIR et GCG, et Stockholm, GCG MSF,
et les formats d'alignement clustal). Voir la documentation imprimée pour une liste complète
des formats pris en charge.
EXPERT OPTIONS
--informat
Précisez que le fichier séquence est au format , plutôt que le FASTA par défaut
format. Les exemples courants incluent Genbank, EMBL, GCG, PIR, Stockholm, Clustal, MSF,
ou PHYLIP; voir la documentation imprimée pour une liste complète des formats acceptés
noms. Cette option remplace le format attendu par défaut (FASTA) et le -B
Option de détection automatique de Babelfish.
--nodesc
Ne générez aucune description de séquence dans le fichier de sortie, uniquement les noms de séquence.
--la graine
Réglez la graine de nombre aléatoire sur . Si vous souhaitez des résultats reproductibles, utilisez le même
à chaque fois. Par défaut, Shuffle utilise une graine différente à chaque fois, donc ne
générer la même sortie dans les exécutions suivantes avec la même entrée.
Utiliser la lecture aléatoire en ligne à l'aide des services onworks.net
