AnglaisFrançaisEspagnol

Ad


Icône de favori OnWorks

cmbuild - En ligne dans le Cloud

Exécutez cmbuild dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande cmbuild qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


cmbuild - construire des modèles de covariance à partir de séquences multiples d'ARN structurellement annotées
alignement(s)

SYNOPSIS


cmbuild [choix]

DESCRIPTION


Pour chaque alignement de séquences multiples dans construire un modèle de covariance et l'enregistrer dans
un nouveau fichier .

Le fichier d'alignement doit être au format Stockholm ou SELEX, et doit contenir un consensus
annotation de structure secondaire. cmbuild utilise la structure du consensus pour déterminer
architecture du CM.

peut être « - » (tiret), ce qui signifie lire cette entrée à partir de Stdin plutôt qu'un fichier.
Pour utiliser '-', vous devez également spécifier le format du fichier d'alignement avec --informat , un péché
--informat Stockholm (à cause d'une limitation actuelle dans notre implémentation, fichier MSA
les formats ne peuvent pas être détectés automatiquement dans un flux d'entrée non rembobinable.)

n'est peut être pas '-' (sortie standard), car l'envoi du fichier CM à Stdout serait en conflit
avec l'autre sortie texte du programme.

En plus d'écrire des CM à , cmbuild produit également une seule ligne pour chaque
modèle créé sur stdout. Chaque ligne comporte les champs suivants : "aln" : l'index du
alignement utilisé pour construire le CM ; "idx": l'index du CM dans le ; "Nom":
le nom du CM ; "nseq" : le nombre de séquences dans l'alignement utilisé pour construire le CM ;
"eff_nseq" : le nombre effectif de séquences utilisées pour construire le modèle ; "alen": la longueur
de l'alignement utilisé pour construire le CM ; "clen": le nombre de colonnes de l'alignement
définis comme des colonnes de consensus (correspondance) ; « bps » : le nombre de paires de bases dans le CM ; "bif":
le nombre de bifurcations dans le CM ; « entropie rel : CM » : l'entropie relative totale du
modèle divisé par le nombre de colonnes de consensus ; "rel entropie: HMM": le relatif total
entropie du modèle ignorant la structure secondaire divisée par le nombre de consensus
Colonnes. "description": description du modèle/alignement.

OPTIONS


-h Aider; imprimer un bref rappel de l'utilisation de la ligne de commande et des options disponibles.

-n Nommez le nouveau CM . La valeur par défaut est d'utiliser le nom de l'alignement (s'il est
Présent dans le ), ou, à défaut, le nom du . If
contient plus d'un alignement, -n ne fonctionne pas, et chaque alignement
doit avoir un nom annoté dans le (comme à Stockholm #=annotation GF ID).

-F Autoriser être écrasé. Sans cette option, si déjà
existe, cmbuild sort avec une erreur.

-o Dirigez la sortie du résumé vers un fichier , plutôt que de sortie standard.

-O Une fois chaque modèle construit, réenregistrez les alignements source annotés dans un fichier
au format Stockholm. Les séquences sont annotées avec quels poids de séquence relatifs
ont été attribués. Les alignements sont également annotés avec une ligne d'annotation de référence
indiquant quelles colonnes ont été attribuées comme consensus. Si l'alignement de la source avait
l'annotation de référence ("#=GC RF") elle sera remplacée par le résidu consensus de
le modèle pour les colonnes de consensus et '.' pour les colonnes d'insertion, à moins que le --main
a été utilisée pour spécifier les positions consensuelles, auquel cas il sera
inchangé.

--devhelp Imprimer l'aide, comme pour -h , mais également inclure des options d'experts qui ne sont pas
affiché avec -h . Ces options d'experts ne devraient pas être pertinentes pour le
grande majorité des utilisateurs et ne sont donc pas décrits dans la page de manuel. Le seul
les ressources pour comprendre ce qu'ils font réellement sont les brèves lignes
les descriptions sont sorties lorsque --devhelp est activé, et le code source.

OPTIONS CONTRLE MODÈLE CONSTRUCTION


Ces options contrôlent la manière dont les colonnes de consensus sont définies dans un alignement.

--vite Définissez automatiquement les colonnes de consensus comme celles qui ont une fraction >= symfrac of
résidus par opposition aux lacunes. (Voir ci-dessous pour le --symfrac option.) C'est le
défaut.

--main Utilisez l'annotation des coordonnées de référence (#=ligne RF GC, à Stockholm) pour déterminer quelle
les colonnes sont des consensus et qui sont des insertions. Tout caractère sans espace indique un
colonne de consensus. (Par exemple, marquez les colonnes de consensus avec « x » et insérez des colonnes
avec ".".) Cette option a été appelée --rf dans les versions précédentes d'Infernal (0.1
à 1.0.2).

--symfrac
Définir le seuil de fraction de résidus nécessaire pour définir une colonne consensus lorsque
n'utilise pas --main. La valeur par défaut est 0.5. La fraction de symbole dans chaque colonne est
calculé après prise en compte de la pondération relative des séquences. Régler ceci sur
0.0 signifie que chaque colonne d'alignement sera assignée comme consensus, ce qui peut être
utile dans certains cas. Le définir sur 1.0 signifie que seules les colonnes qui incluent 0 écart
sera attribué par consensus. Cette option remplace la --gapthresh option
des versions précédentes d'Infernal (0.1 à 1.0.2), avec égal à (1.0 -
). Par exemple pour reproduire le comportement d'une commande de cmbuild --gapthresh 0.8
dans une version précédente, utilisez cmbuild --symfrac 0.2 avec cette version.

--noss Ignorez l'annotation de structure secondaire, le cas échéant, dans et construisez un CM avec
zéro paires de bases. Ce modèle sera similaire à un profil HMM et le cmrecherche ainsi que
cmscan les programmes utiliseront des algorithmes HMM qui sont plus rapides que ceux de CM pour cela
maquette. De plus, un modèle de paire de bases zéro n'a pas besoin d'être calibré avec cmcalibrer
avant de courir cmrecherche avec ça. le --noss l'option doit être utilisée s'il n'y a pas
annotation de structure secondaire dans .

--rsearch
Paramétrer les scores d'émission à la RSEARCH, en utilisant la matrice RIBOSUM dans le fichier .
Avec --rsearch activé, tous les alignements dans doit contenir exactement un
séquence ou le --appel L'option doit également être activée. Toutes les positions dans chaque séquence
seront considérés comme des « colonnes » consensuelles. En fait, les scores d'émission de ces
les modèles ne seront pas identiques aux scores RIBOSUM en raison de différences dans la modélisation
stratégie entre Infernal et RSEARCH, mais ils seront aussi similaires que possible.
Les fichiers de matrice RIBOSUM sont inclus avec Infernal dans le sous-répertoire "matrices/" de
le répertoire de niveau supérieur "infernal-xxx". Les matrices RIBOSUM sont des scores de substitution
matrices formées spécifiquement pour les ARN structuraux avec un simple brin séparé
scores de substitution de résidus et de paires de bases. Pour plus d'informations, consultez la RECHERCHE
publication (Klein et Eddy, BMC Bioinformatics 4:44, 2003).

AUTRES MODÈLE CONSTRUCTION OPTIONS


--nul
Lire un modèle nul de . Le modèle nul définit la probabilité de chaque ARN
nucléotide dans la séquence d'arrière-plan, la valeur par défaut est d'utiliser 0.25 pour chaque nucléotide.
Le format des fichiers nuls est spécifié dans le guide de l'utilisateur.

--avant
Lire un Dirichlet avant de , remplaçant le mélange par défaut Dirichlet. Les
le format des fichiers antérieurs est spécifié dans le guide de l'utilisateur.

Utilisez --devhelp pour voir des options de construction de modèle supplémentaires, autrement non documentées.

OPTIONS CONTRLE RELATIF POIDS


cmbuild utilise un algorithme de pondération de séquence ad hoc pour réduire la pondération étroitement liée
séquences et upweight éloignées. Cela a pour effet de rendre les modèles moins
biaisée par une représentation phylogénétique inégale. Par exemple, deux séquences identiques seraient
généralement chacun reçoit la moitié du poids qu'une séquence aurait. Ces options contrôlent
quel algorithme est utilisé.

--wpb Utilisez le schéma de pondération séquentielle basé sur la position de Henikoff [Henikoff et Henikoff,
J. Mol. Biol. 243:574, 1994]. C'est la valeur par défaut.

--wgsc Utiliser l'algorithme de pondération Gerstein/Sonnhammer/Chothia [Gerstein et al, J. Mol.
Biol. 235 :1067, 1994].

--wnone
Désactivez la pondération des séquences ; par exemple, définissez explicitement tous les poids de séquence sur 1.0.

--wdonné
Utilisez les poids de séquence comme indiqué dans l'annotation dans le fichier d'alignement d'entrée. Sinon
les poids ont été donnés, supposons qu'ils sont tous de 1.0. La valeur par défaut est de déterminer de nouveaux
pondérations de séquence par l'algorithme de Gerstein/Sonnhammer/Chothia, en ignorant tout
poids annotés.

--wblosum
Utilisez l'algorithme de filtrage BLOSUM pour pondérer les séquences, au lieu de la valeur par défaut
pondération GSC. Regroupez les séquences à un pourcentage d'identité donné (voir --largeur);
attribuer à chaque cluster un poids total de 1.0, réparti également entre les membres
de ce cluster.

--large
Contrôle le comportement du --wblosum option de pondération en définissant le pourcentage
identité pour regrouper l'alignement sur .

OPTIONS CONTRLE EFFICACE SÉQUENCE NUMÉRO


Une fois que les poids relatifs ont été déterminés, ils sont normalisés pour additionner un total effectif
numéro de séquence, eff_nseq. Ce nombre peut être le nombre réel de séquences dans le
l'alignement, mais il est presque toujours plus petit que cela. La pondération entropique par défaut
méthode (--eent) réduit le numéro de séquence effectif pour réduire le contenu de l'information
(entropie relative, ou score moyen attendu sur les vrais homologues) par position de consensus. Les
l'entropie relative de la cible est contrôlée par une fonction à deux paramètres, où les deux
les paramètres sont réglables avec --avant ainsi que --esigme.

--eent Utilisez la stratégie de pondération entropique pour déterminer le numéro de séquence effectif qui
donne une entropie relative de l'état de correspondance moyenne cible. Cette option est la valeur par défaut, et
peut être désactivé avec --énone. L'état de correspondance moyen cible par défaut relatif
l'entropie est de 0.59 bits pour les modèles avec au moins 1 paire de bases et de 0.38 bits pour les modèles
avec zéro paires de bases, mais changé avec --avant. La valeur par défaut de 0.59 ou 0.38 bits est
automatiquement changé si l'entropie relative totale du modèle (correspondance sommée
l'entropie relative de l'état) est inférieure à un seuil, qui est de 6.0 bits par défaut, mais
modifiable avec l'expert, sans papiers --ex option. Si tu veux vraiment
jouer avec cette option, consultez le code source.

--énone
Désactivez la stratégie de pondération entropique. Le numéro de séquence effectif n'est que le
nombre de séquences dans l'alignement.

--avant
Définir l'entropie relative de l'état de correspondance moyen cible comme . Par défaut la cible
l'entropie relative par position de correspondance est de 0.59 bits pour les modèles avec au moins 1
basepair et 0.38 pour les modèles avec zéro paires de bases.

--eminseq
Définissez le numéro de séquence effectif minimum autorisé comme .

--ehmmre
Définissez l'entropie relative de l'état de correspondance moyenne HMM cible comme . Entropie pour
les états de correspondance d'appariement de bases sont calculés à l'aide d'une émission de paires de bases marginalisées
probabilités.

--eset
Définissez le numéro de séquence effectif pour la pondération entropique comme .

OPTIONS CONTRLE FILTRE P7 HMM CONSTRUCTION


Pour chaque CM qui cmbuild constructions, un filtre d'accompagnement p7 HMM est construit à partir de l'entrée
l'alignement aussi. Ces options contrôlent la construction du filtre HMM :

--p7ère
Définissez l'entropie relative de l'état de correspondance moyenne cible pour le filtre p7 HMM comme . By
par défaut, l'entropie relative cible par position de correspondance est de 0.38 bits.

--p7ml Utilisez un HMM p7 à maximum de vraisemblance construit à partir du CM comme filtre HMM. Ce HMM va
être aussi similaire que possible au CM (tout en ignorant nécessairement les
structure).

Utilisez --devhelp pour voir des options de construction de filtre HMM supplémentaires, autrement non documentées.

OPTIONS CONTRLE FILTRE P7 HMM ÉTALONNAGE


Après avoir construit chaque filtre HMM, cmbuild détermine les paramètres de valeur E appropriés à utiliser
lors du filtrage dans cmrecherche ainsi que cmscan en échantillonnant un ensemble de séquences et en les recherchant
avec chaque configuration et algorithme de filtre HMM.

--EmN Réglez le nombre de séquences échantillonnées pour l'étalonnage HMM du filtre MSV local sur .
200 par défaut.

--EvN Réglez le nombre de séquences échantillonnées pour l'étalonnage local du filtre Viterbi HMM sur
. 200 par défaut.

--ElfN Définissez le nombre de séquences échantillonnées pour l'étalonnage HMM du filtre Forward local sur
. 200 par défaut.

--EgfN Définir le nombre de séquences échantillonnées pour l'étalonnage HMM du filtre avant glocal
à . 200 par défaut.

Utilisez --devhelp pour voir des options d'étalonnage HMM de filtre supplémentaires, autrement non documentées.

OPTIONS POUR RAFFINAGE LES CONTRIBUTION ALIGNEMENT


--affiner
Essayez d'affiner l'alignement avant de construire le CM en utilisant l'attente-
maximisation (EM). Un CM est d'abord construit à partir de l'alignement initial comme d'habitude. Puis,
les séquences dans l'alignement sont réalignées de manière optimale (avec le HMM bagué CYK
algorithme, optimal signifie optimal compte tenu des bandes) au CM, et un nouveau CM est construit
de l'alignement résultant. Les séquences sont ensuite réalignées sur le nouveau CM, et un
le nouveau CM est construit à partir de cet alignement. Ceci est continué jusqu'à la convergence,
en particulier lorsque les alignements pour deux itérations successives ne sont pas
significativement différents (les scores binaires additionnés de toutes les séquences dans le
l'alignement change de moins de 1 % entre deux itérations successives). Le final
alignement (l'alignement utilisé pour construire le CM qui est écrit sur ) is
écrite à .

-l Avec --affiner, activer l'algorithme d'alignement local, qui permet à l'alignement de
s'étendre sur deux ou plusieurs sous-séquences si nécessaire (par exemple si les structures de la requête
modèle et séquence cible ne sont que partiellement partagés), permettant à certaines grandes
insertions et suppressions dans la structure à pénaliser différemment de la normale
indèles. La valeur par défaut consiste à aligner globalement le modèle de requête sur les séquences cibles.

--gibbs
Modifie le comportement de --affiner donc l'échantillonnage de Gibbs est utilisé à la place de l'EM. Les
différence est que pendant la phase d'alignement, l'alignement n'est pas nécessairement
optimal, à la place un alignement (parsettree) pour chaque séquence est échantillonné à partir du
distribution postérieure des alignements telle que déterminée par l'algorithme Inside. En raison de
cette étape d'échantillonnage --gibbs est non déterministe, donc différentes exécutions avec le même
l'alignement peut donner des résultats différents. Ce n'est pas vrai quand --affiner est utilisé
sans --gibbs option, auquel cas l'alignement final et le CM seront toujours
le même. Lorsque --gibbs est activé, le --la graine L'option peut être utilisée pour amorcer le
générateur de nombres aléatoires de manière prévisible, rendant les résultats reproductibles. L'objectif de
le --gibbs option est d'aider les conservateurs experts en alignement d'ARN à affiner la structure
alignements en leur permettant d'observer des alignements alternatifs à score élevé.

--la graine
Semez le générateur de nombres aléatoires avec , un entier >= 0. Cette option ne peut
être utilisé en combinaison avec --gibbs. If est non nul, l'échantillonnage stochastique de
les alignements seront reproductibles ; la même commande donnera les mêmes résultats. Si
est 0, le générateur de nombres aléatoires est ensemencé arbitrairement, et stochastique
les échantillonnages peuvent varier d'une exécution à l'autre de la même commande. La valeur par défaut est 0.

--cyk Avec --affiner, aligner avec l'algorithme CYK. Par défaut la précision optimale
algorithme est utilisé. Il y a plus d'informations à ce sujet dans le cmaligner page de manuel.

--notrunc
Avec --affiner, désactiver l'algorithme d'alignement tronqué. Il y a plus
informations à ce sujet dans le cmaligner page de manuel.

Utilisez --devhelp pour voir des options d'affinement d'alignement supplémentaires, autrement non documentées, comme
ainsi que d'autres options de fichier de sortie et des options pour créer plusieurs modèles pour un seul
alignement.

Utiliser cmbuild en ligne en utilisant les services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

  • 1
    BureauÉtage
    BureauÉtage
    OfficeFloor fournit l'inversion de
    commande de couplage, avec ses : - dépendances
    injection - injection de continuation -
    injection de fil Pour plus d'informations
    visiter le...
    Télécharger OfficeFloor
  • 2
    Kit Div
    Kit Div
    DivKit est un logiciel open source piloté par serveur
    Cadre d'interface utilisateur (SDUI). Il vous permet de
    déployer des mises à jour provenant du serveur pour
    différentes versions de l'application. Aussi, cela peut être
    utilisé p...
    Télécharger DivKit
  • 3
    sous-convertisseur
    sous-convertisseur
    Utilitaire pour convertir entre divers
    formule d'abonnement. Utilisateurs de Shadowrocket
    devrait utiliser ss, ssr ou v2ray comme cible.
    Vous pouvez ajouter &remark= à
    Télégramme-aimé HT...
    Télécharger le sous-convertisseur
  • 4
    SWASH
    SWASH
    SWASH est un outil numérique polyvalent
    outil de simulation d'instabilité,
    non hydrostatique, à surface libre,
    écoulement rotationnel et phénomènes de transport
    dans les eaux côtières comme ...
    Télécharger SWASH
  • 5
    VBA-M (Archivé - Maintenant sur Github)
    VBA-M (Archivé - Maintenant sur Github)
    Le projet a déménagé à
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Fonctionnalités :Création de tricheétats de sauvegardemulti
    système, prend en charge gba, gbc, gb, sgb,
    sgb2tu...
    Télécharger VBA-M (Archivé - Maintenant sur Github)
  • 6
    Stacer
    Stacer
    Optimiseur de système Linux et surveillance
    Dépôt Github :
    https://github.com/oguzhaninan/Stacer.
    Public : utilisateurs finaux/ordinateurs de bureau. Utilisateur
    interface : Qt. Programmation La...
    Télécharger Stacer
  • Plus "

Commandes Linux

Ad