Questo è il comando formatdb che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
formatdb - formatta database di proteine o nucleotidi per BLAST
SINOSSI
formatdb [-] [-B Nome del file] [-F Nome del file] [-L Nome del file] [-T Nome del file] [-V] [-a] [-b] [-e]
[-i Nome del file] [-l Nome del file] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
DESCRIZIONE
formatdb deve essere utilizzato per formattare i database di origine di proteine o nucleotidi prima
questi database possono essere ricercati da blastall, blastpgp o MegaBLAST. Il database di origine
può essere in formato FASTA o ASN.1. Sebbene il formato FASTA sia più spesso utilizzato come
input a formatdb, l'uso di ASN.1 è vantaggioso per coloro che utilizzano ASN.1 come
fonte comune per altri formati come il rapporto GenBank. Una volta che un file di database di origine
è stato formattato da formatdb non è necessario per BLAST. Si prega di notare che se lo sei
applicherai aggiornamenti periodici ai tuoi database BLAST usando fondere(1), sarà necessario
conservare il file del database di origine.
VERSIONI
Di seguito è riportato un riepilogo delle opzioni.
- Stampa messaggio di utilizzo
-B Nome del file
Gifile binario prodotto dal Gifile specificato da -F. Questa opzione specifica il
nome di un file di elenco GI binario. Questa opzione dovrebbe essere utilizzata con il -F opzione. UN
l'elenco GI di testo può essere specificato con il -F opzione e il -B l'opzione produrrà
quell'elenco GI in formato binario. Il file binario è più piccolo e BLAST non ha bisogno
per convertirlo, in modo che possa essere letto più velocemente.
-F Nome del file
Gifile (file contenente un elenco di gi) da utilizzare con -B or -L
-L Nome del file
Crea un file alias chiamato Nome del file, limitando le sequenze cercate a quelle
specificato da -F.
-T Nome del file
Imposta gli ID tassonomia nelle definizioni ASN.1 secondo la tabella in Nome del file.
-V Verbose: controlla gli ID stringa non univoci nel database
-a Il file di input è un database in formato ASN.1 (altrimenti è previsto FASTA)
-b Il database ASN.1 è binario (al contrario del testo ASCII)
-e L'ingresso è una voce Seq. Un database sorgente ASN.1 (ascii di testo o binario) può
contengono un Bioseq-set o solo un Bioseq. Nel secondo caso -e dovrebbe essere fornito.
-i Nome del file
File di input per la formattazione
-l Nome del file
Nome del file di registro (predefinito = formatdb.log)
-n str Nome di base per i file BLAST (predefinito al nome del file FASTA originale)
-o Analizza SeqID e crea indici. Se il database di origine è in formato FASTA, il
gli identificatori del database nella riga di definizione FASTA devono seguire le convenzioni di
il formato DEFline FASTA.
-p F L'input è un nucleotide, non una proteina.
-s Indice solo per accessione, non per luogo. Ciò è particolarmente utile per i set di sequenze
come gli EST in cui i nomi di accessione e locus sono identici. Formatdb viene eseguito
più veloce e produce file temporanei più piccoli se viene utilizzata questa opzione. è fortemente
consigliato per EST, STS, GSS e HTGS.
-t str Titolo per file di database [Stringa]
-v N Suddividi file FASTA di grandi dimensioni in "volumi" di dimensioni N milioni di lettere (4000 da
predefinito). Nell'ambito della creazione di un volume, formatdb scrive un nuovo tipo di BLAST
file di database, chiamato file alias, con estensione "nal" o "pal".
Usa formatdb online utilizzando i servizi onworks.net