Il s'agit de la commande formatdb qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
formatdb - formater les bases de données de protéines ou de nucléotides pour BLAST
SYNOPSIS
formatdb [-] [-B nom de fichier] [-F nom de fichier] [-L nom de fichier] [-T nom de fichier] [-V] [-a] [-b] [-e]
[-i nom de fichier] [-l nom de fichier] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
DESCRIPTION
formatdb doit être utilisé pour formater les bases de données sources de protéines ou de nucléotides avant
ces bases de données peuvent être recherchées par blastall, blastpgp ou MegaBLAST. La base de données sources
peut être au format FASTA ou ASN.1. Bien que le format FASTA soit le plus souvent utilisé comme
entrée à formatdb, l'utilisation d'ASN.1 est avantageuse pour ceux qui utilisent ASN.1 comme
source commune pour d'autres formats tels que le rapport GenBank. Une fois un fichier de base de données source
a été formaté par formatdb BLAST n'en a pas besoin. Veuillez noter que si vous êtes
va appliquer des mises à jour périodiques à vos bases de données BLAST en utilisant fusionner(1), vous devrez
conserver le fichier de la base de données source.
OPTIONS
Un résumé des options est inclus ci-dessous.
- Imprimer le message d'utilisation
-B nom de fichier
Binary Gifile produit à partir du Gifile spécifié par -F. Cette option spécifie le
nom d'un fichier de liste binaire GI. Cette option doit être utilisée avec le -F option. UNE
texte liste IG peut être spécifié avec le -F option et le -B l'option produira
cette liste GI au format binaire. Le fichier binaire est plus petit et BLAST n'a pas besoin
pour le convertir, afin qu'il puisse être lu plus rapidement.
-F nom de fichier
Gifile (fichier contenant la liste des gi) à utiliser avec -B or -L
-L nom de fichier
Créez un fichier d'alias nommé nom de fichier, en limitant les séquences recherchées à celles
spécifié par -F.
-T nom de fichier
Définissez les ID de taxonomie dans les définitions ASN.1 selon le tableau dans nom de fichier.
-V Verbose : vérifiez les identifiants de chaîne non uniques dans la base de données
-a Le fichier d'entrée est une base de données au format ASN.1 (sinon FASTA est attendu)
-b La base de données ASN.1 est binaire (par opposition au texte ASCII)
-e L'entrée est une entrée Seq. Une base de données source ASN.1 (texte ascii ou binaire) peut
contenir un Bioseq-set ou un seul Bioseq. Dans le dernier cas -e devrait être fourni.
-i nom de fichier
Fichier(s) d'entrée pour le formatage
-l nom de fichier
Nom du fichier journal (par défaut = formatdb.log)
-n str Nom de base pour les fichiers BLAST (par défaut le nom du fichier FASTA d'origine)
-o Analysez SeqID et créez des index. Si la base de données source est au format FASTA, le
les identifiants de base de données dans la ligne de définition FASTA doivent suivre les conventions de
le format FASTA Defline.
-p F L'entrée est un nucléotide, pas une protéine.
-s Indexer uniquement par accession, pas par locus. Ceci est particulièrement utile pour les ensembles de séquences
comme les EST où les noms d'accession et de locus sont identiques. Formatdb s'exécute
plus rapide et produit des fichiers temporaires plus petits si cette option est utilisée. C'est fortement
recommandé pour les EST, STS, GSS et HTGS.
-t str Titre du fichier de base de données [String]
-v N Divisez les gros fichiers FASTA en « volumes » de taille N millions de lettres (4000 par
défaut). Dans le cadre de la création d'un volume, formatdb écrit un nouveau type de BLAST
fichier de base de données, appelé fichier d'alias, avec l'extension `nal' ou `pal'.
Utilisez formatdb en ligne à l'aide des services onworks.net