Il s'agit de la commande makehmmerdb qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
makehmmerdb - crée un fichier de base de données binaire HMMER à partir d'un fichier de séquence
SYNOPSIS
makehmmerdb [choix]
DESCRIPTION
makehmmerdb est utilisé pour créer un fichier binaire à partir d'un fichier de séquence d'ADN. Ce fichier binaire peut
être utilisé comme base de données cible pour l'outil de recherche ADN nhmmer.En utilisantdéfautParamétresin nhmmer,
cela donne une accélération d'environ 10 fois avec une petite perte de sensibilité sur les repères.
(Cette méthode a été largement testée, mais doit toujours être considérée comme quelque peu
expérimental.)
OPTIONS
-h Aider; imprimer un bref rappel de l'utilisation de la ligne de commande et de toutes les options disponibles.
AUTRES OPTIONS
--informat
Affirmez que le fichier de base de données de séquences est au format . Les formats acceptés incluent
fasta, emblème, banque de données, ddbj, unipro, Stockholm, pfam, a2met grand-père. La valeur par défaut est
pour détecter automatiquement le format du fichier.
--bin_length
Longueur du bac. Le fichier binaire dépend d'une structure de données appelée l'index FM, qui
organise une copie permutée de la séquence en cases de longueur . Longueur de bac plus longue
conduira à des fichiers plus petits (parce que des données sont capturées sur chaque casier) et éventuellement
temps de requête plus lent. La valeur par défaut est 256. Beaucoup plus que 512 peut conduire à des
réduction de la vitesse.
--sa_freq
Taux d'échantillonnage du tableau de suffixes. La structure de l'indice FM échantillonne également le sous-jacent
tableau de suffixes pour la base de données de séquences. Échantillonnage plus fréquent (valeur plus petite pour
) donnera une taille de fichier plus grande et une recherche plus rapide (jusqu'à ce que la taille du fichier devienne grande
suffisamment pour que les E/S deviennent un goulot d'étranglement). La valeur par défaut est 8. Doit être une puissance de
2.
--taille de bloc
La séquence d'entrée est divisée en blocs de taille millions de lettres. Un indice FM
est construit pour chaque bloc, plutôt que de construire un index FM pour toute la séquence
base de données. La valeur par défaut est 50. Les blocs plus gros ne semblent pas donner une vitesse substantielle
augmenter.
Utilisez makehmmerdb en ligne en utilisant les services onworks.net