AnglaisFrançaisEspagnol

Ad


Icône de favori OnWorks

cmcalibrate - En ligne dans le Cloud

Exécutez cmcalibrate dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande cmcalibrate qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


cmcalibrate - ajuster les queues exponentielles pour la détermination de la valeur E du modèle de covariance

SYNOPSIS


cmcalibrer [choix] fichier cm

DESCRIPTION


cmcalibrer détermine les paramètres de queue exponentielle pour la détermination de la valeur E en générant
séquences aléatoires, en les recherchant avec le CM et en recueillant les scores des résultats
les coups. Un histogramme des scores de bits des hits est ajusté à une queue exponentielle, et le
les paramètres de la queue ajustée sont enregistrés dans le fichier CM. Les paramètres de queue exponentielle
sont ensuite utilisés pour estimer la signification statistique des résultats trouvés dans cmrecherche ainsi que
cmscan.

Un fichier CM doit être calibré avec cmcalibrer avant de pouvoir être utilisé dans cmrecherche or cmscan,
à une exception près : il n'est pas nécessaire de calibrer les fichiers CM qui ne contiennent que
modèles avec zéro paires de bases avant l'exécution cmrecherche.

cmcalibrer Est très lent. Il faut quelques heures pour calibrer une seule taille moyenne
CM sur une seule CPU. cmcalibrer fonctionnera en parallèle sur tous les cœurs disponibles si Infernal
a été construit sur un système qui prend en charge le threading POSIX (voir la section Installation du
mode d'emploi pour plus d'informations). À l'aide de noyaux se traduira par environ -plier
accélération par rapport à un seul processeur. MPI (Message Passing Interface) peut également être utilisé pour
parallélisation avec le --mpi option si Infernal a été construit avec MPI activé, mais en utilisant
plus de 161 processeurs n'est pas recommandé car augmenter au-delà de 161 n'accélérera pas
l'étalonnage. Voir la section Installation du guide de l'utilisateur pour plus d'informations.

La --prévision peut être utilisée pour estimer combien de temps le programme prendra pour s'exécuter pendant un
donné fichier cm sur la machine actuelle. Pour prédire le temps de fonctionnement sur processeurs avec
MPI, utilisez en plus le --nprévision option.

Les séquences aléatoires recherchées dans cmcalibrer sont générés par un HMM qui a été formé sur
séquences génomiques réelles avec divers contenus GC. Le but est d'avoir les distributions GC
dans les séquences aléatoires être similaires à ceux des séquences génomiques réelles.

Quatre tours de recherches et des ajustements exponentiels ultérieurs sont effectués, un pour chacun
les quatre algorithmes CM différents qui peuvent être utilisés dans cmrecherche ainsi que cmscan : CYK glocal,
glocal Inside, local CYK et local Inside.

Les paramètres des valeurs E déterminés par cmcalibrer ne sont utilisés que par le cmrecherche ainsi que cmscan
programmes. Si vous n'utilisez pas ces programmes, ne perdez pas de temps à calibrer
vos modèles.

OPTIONS


-h Aider; imprimer un bref rappel de l'utilisation de la ligne de commande et des options disponibles.

-L Définir la longueur totale des séquences aléatoires à rechercher mégabases (Mo). Par
défaut is 1.6 Mo. En augmentant rendra la queue exponentielle plus ajustée
précis et les valeurs E plus précises, mais prendront plus de temps (doubler sera à peu près
doubler le temps d'exécution). décroissant n'est pas recommandé car cela
les ajustements sont moins précis et les valeurs E moins précises.

OPTIONS POUR PRÉDIRE EST REQUIS ET MÉMOIRE


--prévision
Prédire le temps d'exécution de l'étalonnage de fichier cm (avec les options fournies) sur
la machine actuelle et quitter. L'étalonnage n'est pas effectué. Les prédictions
doivent être considérés comme des estimations approximatives. Si le multithreading est activé (voir
section Installation du guide de l'utilisateur), le calendrier tiendra compte du nombre
de cœurs disponibles.

--nprévision
Avec --prévision, préciser que processeurs seront utilisés pour l'étalonnage.
Cela peut être utile pour prédire le temps d'exécution d'une exécution MPI avec
processeurs.

--memreq
Prédire la quantité de mémoire requise pour l'étalonnage fichier cm (avec fourni
options) sur la machine actuelle et quitter. L'étalonnage n'est pas effectué.

OPTIONS CONTRLE EXPONENTIEL QUEUE FITS


--gtailn
adapter la queue exponentielle pour glocal Inside et glocal CYK au scores les plus élevés
dans la queue de l'histogramme, où is fois le nombre de Mo recherchés. Les
valeur par défaut de est 250. La valeur 250 a été choisie car elle fonctionne bien
empiriquement par rapport à d'autres valeurs.

--ltailn
adapter la queue exponentielle pour l'intérieur local et le CYK local au scores les plus élevés
dans la queue de l'histogramme, où is fois le nombre de Mo recherchés. Les
valeur par défaut de est 750. La valeur 750 a été choisie car elle fonctionne bien
empiriquement par rapport à d'autres valeurs.

--tailp
Ignore le --gtailn ainsi que --ltailn options préfixées et s'adapter à la fraction de queue de
l'histogramme à une queue exponentielle, pour tous les modes de recherche.

EN OPTION SORTIE DES DOSSIERS


--hfichier
Enregistrer les histogrammes dans un fichier . Le format de ce fichier est à deux espaces
colonnes délimitées par ligne. La première colonne contient les valeurs de l'axe des x des scores de bits de
chaque bac. La deuxième colonne contient les valeurs de l'axe des y du nombre d'accès par bac. Chaque
série est délimitée par une ligne avec un seul caractère "&". Le fichier contiendra
une série pour chacune des quatre queues exponentielles correspond à l'ordre suivant :
glocal CYK, glocal Inside, local CYK et local Inside.

--sfile
Enregistrer les informations du tracé de survie dans un fichier . Le format de ce fichier est à deux espaces
colonnes délimitées par ligne. La première colonne contient les valeurs de l'axe des x des scores de bits de
chaque bac. La deuxième colonne est les valeurs de l'axe des y de la fraction de hits qui rencontrent ou
dépasser le score pour chaque bac. Chaque série est délimitée par une ligne avec un seul
personnage "&". Le fichier contiendra trois séries de données pour chacun des quatre CM
modes de recherche dans l'ordre suivant : glocal CYK, glocal Inside, local CYK et
local à l'intérieur. La première série est le graphique de survie empirique de l'histogramme
de hits à la séquence aléatoire. La deuxième série est la queue exponentielle ajustée à
la distribution empirique. La troisième série est l'ajustement exponentiel de la queue si lambda
ont été fixés et définis comme le logarithme naturel de 2 (0.691314718).

--qqfile
Enregistrer les informations du graphique quantile-quantile dans un fichier . Le format de ce fichier est
deux colonnes délimitées par des espaces par ligne. La première colonne contient les valeurs de l'axe des x, et
la deuxième colonne est les valeurs de l'axe des y. La distance des points de la
la ligne d'identité (y=x) est une mesure de la qualité de l'ajustement exponentiel de la queue, le
plus les points sont proches de la ligne d'identité, meilleur est l'ajustement. Chaque série est
délimité par une ligne avec un seul caractère "&". Le fichier contiendra une série
de données empiriques pour chacun des quatre ajustements exponentiels dans la suite
ordre : glocal CYK, glocal Inside, local CYK et local Inside.

--ffichier
Enregistrer les statistiques délimitées par l'espace de différents ajustements exponentiels dans le fichier .
Le fichier contiendra les valeurs lambda et mu pour les queues exponentielles adaptées à
queues d'histogramme de différentes tailles. Les champs du fichier sont étiquetés
à titre informatif.

--xfichier
Enregistrer une liste des scores dans chaque queue d'histogramme d'ajustement dans un fichier . Chaque ligne de
ce fichier aura un score différent indiquant qu'un coup existait dans la queue avec
ce score. Chaque série est délimitée par une ligne avec un seul caractère "&". Les
contiendra une série pour chacun des quatre ajustements exponentiels dans le
ordre suivant : glocal CYK, glocal Inside, local CYK et local Inside.

AUTRES OPTIONS


--la graine
Semez le générateur de nombres aléatoires avec , un entier >= 0. Si est différent de zéro,
les simulations stochastiques seront reproductibles ; la même commande donnera le même
résultats. Si est 0, le générateur de nombres aléatoires est ensemencé arbitrairement, et
les simulations stochastiques varieront d'une exécution à l'autre de la même commande. Le défaut
la graine est de 181.

--bêta
Par défaut, le banding dépendant de la requête (QDB) est utilisé pour accélérer la recherche CM
algorithmes avec une probabilité de perte de queue bêta de 1E-15. Cette valeur bêta peut être
changé en avec --bêta . Le paramètre bêta est la quantité de probabilité
masse exclue lors du calcul de la bande, des valeurs bêta plus élevées donnent des accélérations plus importantes
mais sacrifie plus de précision que des valeurs inférieures. La valeur par défaut utilisée est 1E-15.
(Pour plus d'informations sur QDB, voir Nawrocki et Eddy, PLoS Computational Biology
3(3) : e56.)

--non bagué
Désactivez QDB pendant l'étalonnage de la valeur E. Cela ralentira l'étalonnage.

--nonull3
Désactivez le modèle null supplémentaire post hoc null3. Ceci n'est pas recommandé à moins que
vous prévoyez d'utiliser la même option pour cmrecherche (facultatif) cmscan.

--Aléatoire
Utilisez le modèle null d'arrière-plan du CM pour générer les séquences aléatoires, à la place
du HMM plus réaliste. À moins que le CM n'ait été construit en utilisant le --nul Option de
cmbuild, le modèle nul d'arrière-plan sera de 25 % chacun A, C, G et U.

--gc
Générer les séquences aléatoires en utilisant la distribution nucléotidique de la séquence
filet .

--CPU
Précisez que des processeurs de travail parallèles doivent être utilisés. Si est défini sur "0", alors le
programme sera exécuté en mode série, sans utiliser de threads. Vous pouvez également contrôler
ce nombre en définissant une variable d'environnement, INFERNAL_NCPU. Cette option va
être disponible uniquement si la machine sur laquelle Infernal a été construit est capable d'utiliser
Filetage POSIX (voir la section Installation du guide de l'utilisateur pour plus
information).

--mpi Exécuter en tant que programme parallèle MPI. Cette option ne sera disponible que si Infernal a
été configuré et construit avec le drapeau "--enable-mpi" (voir la section Installation
section du guide de l'utilisateur pour plus d'informations).

Utilisez cmcalibrate en ligne à l'aide des services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad