GoGPT Best VPN GoSearch

Icône de favori OnWorks

alimask - En ligne dans le Cloud

Exécutez alimask dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de l'alimask de commande qui peut être exécuté dans le fournisseur d'hébergement gratuit OnWorks à l'aide de l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.

PROGRAMME:

Nom


alimask - Ajoute une ligne de masque à un alignement de séquences multiples

SYNOPSIS


alimasque [choix]

DESCRIPTION


alimasque est utilisé pour appliquer une ligne de masque à un alignement de séquences multiples, basé sur fourni
l'alignement ou les coordonnées du modèle. Lorsque hmmconstruire reçoit un alignement masqué en entrée, il
produit un modèle de profil dans lequel les probabilités d'émission aux positions masquées sont définies
pour correspondre à la fréquence de fond, plutôt que d'être défini en fonction des fréquences observées dans
l'alignement. Les taux d'insertion et de suppression spécifiques à la position ne sont pas modifiés, même dans
régions masquées. alimasque détecte automatiquement le format d'entrée et produit des alignements masqués dans
Format de Stockholm. peut contenir un seul alignement de séquence.

Une motivation courante pour masquer une région dans un alignement est que la région contient un
répétition en tandem simple qui provoque un taux inacceptablement élevé de faux positifs
les coups.

Dans le cas le plus simple, une plage de masque est donnée en coordonnées par rapport à l'entrée
alignement, utilisation --alirange . Cependant, il arrive plus souvent que la région à
masqué a été identifié en coordonnées relatives au modèle de profil (par exemple sur la base
reconnaître un simple motif de répétition dans les alignements de faux coups ou dans le logo HMM). Pas tout
les colonnes d'alignement sont converties pour correspondre aux positions d'état dans le profil (voir le --symfrac
drapeau pour hmmconstruire pour discussion), de sorte que les positions des modèles ne correspondent pas nécessairement à
positions des colonnes d'alignement. Pour supprimer le fardeau de la conversion des positions du modèle en
positions d'alignement, alimasque accepte également l'entrée de plage de masque dans les coordonnées du modèle,
grâce à --gamme de modèles . Lorsque vous utilisez ce drapeau, alimasque détermine quel alignement
les postes seraient identifiés par hmmconstruire comme les états de correspondance, un processus qui exige que
tous hmmconstruire les drapeaux ayant une incidence sur cette décision soient fournis à alimasque. C'est pour cette raison
que beaucoup de hmmconstruire les drapeaux sont également utilisés par alimasque.

OPTIONS


-h Aider; imprimer un bref rappel de l'utilisation de la ligne de commande et de toutes les options disponibles.

-o Dirigez la sortie du résumé vers un fichier , plutôt que de Stdout.

OPTIONS POUR LES CANADIENS EN PRÉCISANT MASQUE GAMME


Une seule plage de masque est donnée sous la forme d'une paire séparée par des tirets, comme --gamme de modèles 10-20 et
plusieurs plages peuvent être soumises sous forme de liste séparée par des virgules, --gamme de modèles 10-20,30-42.

--gamme de modèles
Fournissez la ou les plages données dans les coordonnées du modèle.

--alirange
Fournissez la ou les plages données en coordonnées d'alignement.

--apendmask
Ajouter au masque existant trouvé avec l'alignement. La valeur par défaut est d'écraser tout
masque existant.

--model2ali
Plutôt que de produire réellement l'alignement masqué, imprimez simplement la ou les gammes de modèles
correspondant à la ou aux plages d'alignement d'entrée.

--ali2modèle
Plutôt que de produire réellement l'alignement masqué, imprimez simplement la ou les plages d'alignement
correspondant à la ou aux gammes de modèles d'entrée.

OPTIONS POUR LES CANADIENS EN PRÉCISANT THE ALPHABET


Le type d'alphabet (amino, ADN ou ARN) est détecté automatiquement par défaut, en regardant le
composition de la fichier msa. L'autodétection est normalement assez fiable, mais parfois
le type d'alphabet peut être ambigu et la détection automatique peut échouer (par exemple, sur un petit jouet
alignements de quelques résidus seulement). Pour éviter cela, ou pour augmenter la robustesse de l'automatisation
pipelines d'analyse, vous pouvez spécifier le type d'alphabet de fichier msa avec ces options.

--amino
Spécifiez que toutes les séquences dans fichier msa sont des protéines.

--adn Spécifiez que toutes les séquences dans fichier msa sont des ADN.

--rna Spécifiez que toutes les séquences dans fichier msa sont des ARN.

OPTIONS CONTRLE PROFIL LOCATION CONSTRUCTION


Ces options contrôlent la manière dont les colonnes de consensus sont définies dans un alignement.

--vite Définissez les colonnes de consensus comme celles qui ont une fraction >= symfrac de résidus comme
opposé aux lacunes. (Voir ci-dessous pour le --symfrac option.) Il s'agit de la valeur par défaut.

--main Définir les colonnes de consensus dans le profil suivant en utilisant l'annotation de référence au multiple
alignement. Cela vous permet de définir toutes les colonnes de consensus que vous souhaitez.

--symfrac
Définir le seuil de fraction de résidus nécessaire pour définir une colonne consensus lorsque
en utilisant l' --vite option. La valeur par défaut est 0.5. La fraction de symbole dans chaque colonne est
calculé après avoir pris en compte la pondération relative des séquences et en ignorant l'écart
caractères correspondant aux extrémités des fragments de séquence (par opposition aux caractères internes
insertions/suppressions). Le définir sur 0.0 signifie que chaque colonne d'alignement sera
être attribués par consensus, ce qui peut être utile dans certains cas. Le mettre à 1.0
signifie que seules les colonnes qui incluent 0 espaces (insertions/suppressions internes) seront
attribué comme consensus.

--fragthresh
Nous voulons seulement compter les lacunes terminales comme suppressions si la séquence alignée est connue
être de pleine longueur, pas s'il s'agit d'un fragment (par exemple, car seule une partie de celui-ci
a été séquencé). HMMER utilise une règle simple pour déduire des fragments : si la longueur de la séquence
L est inférieur ou égal à une fraction fois la longueur de l'alignement en colonnes,
alors la séquence est traitée comme un fragment. La valeur par défaut est 0.5. Réglage
--fragthresh0 ne définira aucune séquence (non vide) en tant que fragment ; tu pourrais vouloir
faites-le si vous savez que vous avez un alignement soigneusement organisé de pleine longueur
séquences. Réglage --fragthresh1 définira toutes les séquences comme des fragments ; Tu pourrais
voulez faire cela si vous savez que votre alignement est entièrement composé de fragments, tels
comme de courtes lectures traduites dans les données métagénomiques des fusils de chasse.

OPTIONS CONTRLE RELATIF POIDS


HMMER utilise un algorithme de pondération des séquences ad hoc pour réduire la pondération des séquences étroitement liées
et augmenter ceux qui sont éloignés les uns des autres. Cela a pour effet de rendre les modèles moins biaisés par
représentation phylogénétique inégale. Par exemple, deux séquences identiques seraient généralement
chacun reçoit la moitié du poids qu'une séquence aurait. Ces options contrôlent
l'algorithme est utilisé.

--wpb Utilisez le schéma de pondération séquentielle basé sur la position de Henikoff [Henikoff et Henikoff,
J. Mol. Biol. 243:574, 1994]. C'est la valeur par défaut.

--wgsc Utiliser l'algorithme de pondération Gerstein/Sonnhammer/Chothia [Gerstein et al, J. Mol.
Biol. 235 :1067, 1994].

--wblosum
Utilisez le même schéma de regroupement que celui utilisé pour pondérer les données dans le calcul de BLOSUM
les matrices de substitution [Henikoff et Henikoff, Proc. Natl. Acad. Sci 89:10915, 1992].
Les séquences sont à liaison unique regroupées à un seuil d'identité (par défaut 0.62 ; voir
--large) et dans chaque groupe de séquences c, chaque séquence obtient un poids relatif
1/ch.

--wnone
Aucun poids relatif. Toutes les séquences se voient attribuer un poids uniforme.

--large
Définit le seuil d'identité utilisé par le clustering à liaison unique lors de l'utilisation --wblosum.
Invalide avec tout autre schéma de pondération. La valeur par défaut est 0.62.

AUTRES OPTIONS


--informat
Déclarer que l'entrée fichier msa est au format . Actuellement le multiple accepté
les formats de fichier de séquence d'alignement incluent Stockholm, Aligned FASTA, Clustal, NCBI
PSI-BLAST, PHYLIP, Selex et UCSC SAM A2M. La valeur par défaut est de détecter automatiquement le format de
le fichier.

--la graine
Semez le générateur de nombres aléatoires avec , un entier >= 0. Si est différent de zéro, tout
les simulations stochastiques seront reproductibles ; la même commande donnera le même
résultats. Si est 0, le générateur de nombres aléatoires est ensemencé arbitrairement, et
les simulations stochastiques varieront d'une exécution à l'autre de la même commande. Le défaut
la graine est de 42.

Utilisez alimask en ligne en utilisant les services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad




×
Publicité
❤ ️Achetez, réservez ou achetez ici — gratuitement, contribue à maintenir la gratuité des services.